En este post se explica qué es la recta de regresión en estadística. Así pues, encontrarás cómo calcular la recta de regresión entre dos variables, un ejercicio resuelto y, además, una calculadora online para calcular la recta de regresión de cualquier muestra de datos.
Índice
¿Qué es la recta de regresión?
En estadística, la recta de regresión es la recta que se obtiene de un modelo de regresión lineal simple. En concreto, la recta de regresión es la recta que mejor se ajusta a una nube de puntos y que, por tanto, mejor describe un conjunto de datos estadísticos.
Así pues, la ecuación de la recta de regresión relaciona matemáticamente la variable independiente X y la variable dependiente Y de un conjunto de datos. Aunque generalmente la recta de regresión no es capaz de determinar con exactitud el valor de cada observación, sí que nos permite obtener una aproximación de su valor.
Como puedes ver en la gráfica anterior, la recta de regresión nos ayuda a ver la tendencia de un conjunto de datos y qué tipo de relación hay entre la variable independiente y la variable dependiente. Más abajo profundizaremos en las aplicaciones de la recta de regresión.
Fórmula de la recta de regresión
Ahora que ya sabemos la definición de la recta de regresión, vamos a ver cómo se calcula la ecuación de la recta de un modelo de regresión lineal.
Como toda recta, la ecuación de la recta de regresión está formada por una constante (b0) y una pendiente (b1):
Así pues, las fórmulas para calcular los coeficientes de la recta de regresión lineal son las siguientes:
Donde:
- es la constante de la recta de regresión.
- es la pendiente de la recta de regresión.
- es el valor de la variable independiente X del dato i.
- es el valor de la variable dependiente Y del dato i.
- es la media de los valores de la variable independiente X.
- es la media de los valores de la variable dependiente Y.
👉 Puedes usar la calculadora que hay más abajo para calcular la recta de regresión de cualquier conjunto de datos.
Ejemplo resuelto de la recta de regresión
Para profundizar en el concepto de la recta de regresión, a continuación se muestra un ejemplo resuelto de cómo hacer una recta de regresión.
- Después de realizar un examen de estadística, se ha preguntado a cinco estudiantes cuántas horas de estudio dedicaron al examen, los datos se muestran en la tabla de abajo. Calcula la recta de regresión de los datos estadísticos recopilados para relacionar linealmente las horas de estudio con la nota obtenida. Luego, determina qué nota sacará un alumno que haya estudiado 8 horas.
Para hallar la recta de regresión de la muestra de datos tenemos que determinar los coeficientes b0 y b1 de la ecuación y, para ello, tenemos que utilizar las fórmulas vistas en el apartado de arriba.
No obstante, para poder aplicar las fórmulas de la recta de regresión lineal primero tenemos que calcular la media de la variable independiente y la media de la variable dependiente:
Ahora que ya sabemos las medias de las variables, calculamos el coeficiente b1 del modelo usando su fórmula correspondiente:
Por último, calculamos el coeficiente b0 del modelo empleando su fórmula correspondiente:
En definitiva, la ecuación de la recta de regresión lineal del problema es la siguiente:
A continuación puedes ver la representación gráfica de la muestra de datos junto con la recta del modelo de regresión lineal simple:
Una vez hemos calculado la recta de regresión, para hacer una predicción de la nota que conseguirá un alumno que ha estudiado 8 horas simplemente tenemos que sustituir dicho valor en la ecuación de la recta de regresión obtenida:
Así pues, según el modelo de regresión lineal realizado, si un alumno ha estudiado ocho horas obtendrá una puntuación de 5,56 en el examen.
¿Para qué sirve una recta de regresión?
Principalmente, la recta de regresión tiene dos usos: la recta de regresión sirve para determinar qué tipo de relación hay entre dos variables y, por otro lado, la recta de regresión también permite hacer una predicción sobre el valor de una nueva observación.
La pendiente de la recta de regresión nos indica cómo es la correlación entre la variable independiente y la variable dependiente. Si la pendiente es positiva, significa que la variable dependiente es directamente proporcional a la variable independiente, mientras que si la pendiente es negativa, implica que las variables son inversamente proporcionales. Por último, si el coeficiente de la pendiente es muy cercano a cero, quiere decir que la correlación entre las dos variables es muy baja.
Además, si se conoce la ecuación de la recta de regresión, se puede predecir el valor de la variable dependiente para un nuevo valor de la variable independiente, tal y como hemos hecho en el ejemplo de arriba. Así pues, cuanto mejor ajustada esté la recta de regresión, mejores serán las predicciones que haga.
Calculadora de la recta de regresión
Introduce una muestra de datos en la siguiente calculadora para calcular la recta de regresión entre las dos variables. Debes separar las parejas de datos, de manera que en el primer recuadro solo haya los valores de la variable independiente X y en el segundo recuadro únicamente estén los valores de la variable dependiente Y.
Los datos deben separase por un espacio e introducirse usando el punto como separador decimal.