Regresión polinomial

En este post se explica qué es la regresión polinomial en estadística y cómo se hace. Además, podrás ver un ejemplo en el que se realiza una regresión polinomial.

¿Qué es la regresión polinomial?

La regresión polinomial, o regresión polinómica, es un modelo de regresión en el cual la relación entre la variable independiente X y la variable dependiente Y se modela mediante un polinomio.

Por ejemplo, la ecuación de un modelo de regresión polinomial de segundo grado es y=β01x+β2x2+ε.

La regresión polinomial es útil para ajustar conjuntos de datos cuyas gráficas son curvas polinómicas. Así pues, si la gráfica de puntos de una muestra de datos tiene forma de parábola, será mejor construir un modelo de regresión cuadrático que un modelo de regresión lineal. De esta forma la ecuación del modelo de regresión se adaptará mejor a la muestra de datos.

Ten en cuenta que la regresión polinomial es un tipo de regresión no lineal, junto con la regresión exponencial y la regresión logarítmica.

Fórmula de la regresión polinomial

La ecuación de un modelo de regresión polinomial es y=β01x+β2x23x3…+βmxm+ε.

y=\beta_0+\beta_1 x+\beta_2 x^2+\beta_3 x^3+\dots+\beta_m x^m+\varepsilon

Donde:

  • y es la variable dependiente.
  • x es la variable independiente.
  • \beta_0 es la constante de la ecuación de la regresión polinomial.
  • \beta_i es el coeficiente de regresión asociado a la variable x^i.
  • \bm{\varepsilon} es el error o residuo, es decir, la diferencia entre el valor observado y el valor estimado por el modelo.

De modo que si tenemos una muestra con un total de n observaciones, podemos plantear el modelo de regresión polinomial en forma matricial:

\begin{pmatrix}y_1\\y_2\\y_3\\\vdots\\y_n\end{pmatrix}=\begin{pmatrix}1&x_1&x_1^2&\dots&x_1^m\\1&x_2&x_2^2&\dots&x_2^m\\1&x_3&x_3^2&\dots&x_3^m\\ \vdots&\vdots&\ddots&\vdots\\1&x_{n}&x_n^2&\dots&x_n^m\end{pmatrix}\cdot\begin{pmatrix}\beta_0\\\beta_1\\\beta_2\\\vdots\\\beta_m\end{pmatrix}+\begin{pmatrix}\varepsilon_1\\\varepsilon_2\\\varepsilon_3\\\vdots\\\varepsilon_n\end{pmatrix}

La expresión matricial anterior se puede reescribir asignando una letra a cada matriz:

Y=X\beta+\varepsilon

Así pues, aplicando el criterio de los mínimos cuadrados, se puede llegar a la fórmula para estimar los coeficientes de un modelo de regresión polinomial:

\widehat{\beta}=\left(X^tX\right)^{-1}X^tY

No obstante, hacer estos cálculos a mano es muy laborioso y lleva mucho tiempo, por lo que resulta más práctico usar un software informático (como Minitab o Excel) que permite realizar un modelo de regresión polinomial de manera mucho más rápida.

Ejemplo de un modelo de regresión polinomial

Ahora que ya sabemos la definición de la regresión polinomial y cómo se hace, vamos a ver un ejemplo resuelto para acabar de entender el concepto.

En primer lugar, debemos tener en cuenta que se debe hacer un modelo de regresión polinomial cuando la gráfica de los datos tenga forma de curva polinómica. Por ejemplo, si la gráfica de puntos tiene forma de curva cúbica, deberemos construir un modelo de regresión polinomial de tercer grado.

Así pues, tal y como ves en la siguiente imagen, la gráfica de puntos de nuestros datos tiene forma cuadrática, ya que a medida que aumentamos el valor de la variable independiente, la variable dependiente crece más rápido. En este caso se ha hecho un modelo de regresión lineal y, como puedes comprobar, no se ajusta bien a los puntos porque tiene tramos en los que la recta queda por debajo de todos los puntos y tramos en los que la recta queda por encima de ellos.

En cambio, si hacemos un modelo de regresión polinomial cuadrático, se ajusta mucho mejor a la muestra de datos, tal y como puedes ver en la imagen de abajo.

ejemplo de regresión polinomial

Además, al hacer un modelo de regresión polinomial el coeficiente de determinación mejora sustancialmente, ya que pasa de un 86,80% a un 94,05%. Por lo tanto, el nuevo modelo de regresión explica mucho mejor el conjunto de datos.

Por otro lado, otro indicio de que tenemos que realizar una regresión polinomial es la gráfica de los residuos. Si al hacer una regresión lineal, la gráfica de los residuos tiene forma de parábola u otro tipo de polinomio, seguramente un modelo de regresión polinomial se ajuste mejor a los datos estudiados.

Otros tipos de regresión no lineal

Principalmente, existen tres tipos de regresión no lineal:

  • Regresión polinomial: la ecuación del modelo de regresión tiene forma de polinomio.
  • Regresión logarítmica: se hace el logaritmo de la variable independiente.
  • Regresión exponencial: la variable independiente se encuentra en el exponente de la ecuación.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio