En este post se explica qué es la regresión polinomial en estadística y cómo se hace. Además, podrás ver un ejemplo en el que se realiza una regresión polinomial.
Índice
¿Qué es la regresión polinomial?
La regresión polinomial, o regresión polinómica, es un modelo de regresión en el cual la relación entre la variable independiente X y la variable dependiente Y se modela mediante un polinomio.
Por ejemplo, la ecuación de un modelo de regresión polinomial de segundo grado es y=β0+β1x+β2x2+ε.
La regresión polinomial es útil para ajustar conjuntos de datos cuyas gráficas son curvas polinómicas. Así pues, si la gráfica de puntos de una muestra de datos tiene forma de parábola, será mejor construir un modelo de regresión cuadrático que un modelo de regresión lineal. De esta forma la ecuación del modelo de regresión se adaptará mejor a la muestra de datos.
Ten en cuenta que la regresión polinomial es un tipo de regresión no lineal, junto con la regresión exponencial y la regresión logarítmica.
Fórmula de la regresión polinomial
La ecuación de un modelo de regresión polinomial es y=β0+β1x+β2x2+β3x3…+βmxm+ε.
Donde:
es la variable dependiente.
es la variable independiente.
es la constante de la ecuación de la regresión polinomial.
es el coeficiente de regresión asociado a la variable
.
es el error o residuo, es decir, la diferencia entre el valor observado y el valor estimado por el modelo.
De modo que si tenemos una muestra con un total de observaciones, podemos plantear el modelo de regresión polinomial en forma matricial:
La expresión matricial anterior se puede reescribir asignando una letra a cada matriz:
Así pues, aplicando el criterio de los mínimos cuadrados, se puede llegar a la fórmula para estimar los coeficientes de un modelo de regresión polinomial:
No obstante, hacer estos cálculos a mano es muy laborioso y lleva mucho tiempo, por lo que resulta más práctico usar un software informático (como Minitab o Excel) que permite realizar un modelo de regresión polinomial de manera mucho más rápida.
Ejemplo de un modelo de regresión polinomial
Ahora que ya sabemos la definición de la regresión polinomial y cómo se hace, vamos a ver un ejemplo resuelto para acabar de entender el concepto.
En primer lugar, debemos tener en cuenta que se debe hacer un modelo de regresión polinomial cuando la gráfica de los datos tenga forma de curva polinómica. Por ejemplo, si la gráfica de puntos tiene forma de curva cúbica, deberemos construir un modelo de regresión polinomial de tercer grado.
Así pues, tal y como ves en la siguiente imagen, la gráfica de puntos de nuestros datos tiene forma cuadrática, ya que a medida que aumentamos el valor de la variable independiente, la variable dependiente crece más rápido. En este caso se ha hecho un modelo de regresión lineal y, como puedes comprobar, no se ajusta bien a los puntos porque tiene tramos en los que la recta queda por debajo de todos los puntos y tramos en los que la recta queda por encima de ellos.

En cambio, si hacemos un modelo de regresión polinomial cuadrático, se ajusta mucho mejor a la muestra de datos, tal y como puedes ver en la imagen de abajo.

Además, al hacer un modelo de regresión polinomial el coeficiente de determinación mejora sustancialmente, ya que pasa de un 86,80% a un 94,05%. Por lo tanto, el nuevo modelo de regresión explica mucho mejor el conjunto de datos.
Por otro lado, otro indicio de que tenemos que realizar una regresión polinomial es la gráfica de los residuos. Si al hacer una regresión lineal, la gráfica de los residuos tiene forma de parábola u otro tipo de polinomio, seguramente un modelo de regresión polinomial se ajuste mejor a los datos estudiados.
Otros tipos de regresión no lineal
Principalmente, existen tres tipos de regresión no lineal:
- Regresión polinomial: la ecuación del modelo de regresión tiene forma de polinomio.
- Regresión logarítmica: se hace el logaritmo de la variable independiente.
- Regresión exponencial: la variable independiente se encuentra en el exponente de la ecuación.