Regresión logarítmica

En este post se explica qué es la regresión logarítmica y cómo se hace. Además, podrás ver un ejemplo de una regresión logarítmica para acabar de entender el concepto.

¿Qué es la regresión logarítmica?

La regresión logarítmica es un modelo de regresión que incluye un logaritmo en su ecuación, en concreto, en una regresión logarítmica se hace el logaritmo de la variable independiente. De modo que la ecuación de un modelo de regresión logarítmica es y=a+b·ln(x).

La regresión logarítmica es muy útil para ajustar un modelo de regresión cuando los datos de la muestra forman una curva logarítmica, de esta forma el modelo de regresión se adapta mejor a la muestra de datos. Más abajo profundizaremos en cuándo se debe realizar una regresión logarítmica.

Así pues, la regresión logarítmica es un tipo de regresión no lineal, junto con la regresión exponencial y la regresión polinomial.

Fórmula de la regresión logarítmica

Un modelo de regresión logarítmica consiste en hacer el logaritmo de la variable independiente. Por lo tanto, la fórmula de la ecuación de una regresión logarítmica es y=a+b·ln(x).

y=a+b\cdot \ln(x)

Donde:

  • y es la variable dependiente.
  • x es la variable independiente.
  • a,b son los coeficientes de la regresión.

Fíjate que, en realidad, y=a+b·ln(x) es la ecuación de una recta, pero en lugar de estar referida a las variables originales x e y, está referida a las variables ln(x) e y.

¿Cuándo hacer una regresión logarítmica?

Debemos hacer una regresión logarítmica cuando la gráfica de la muestra de datos sea una curva logarítmica, es decir, cuando la gráfica de puntos sea similar a la gráfica de una función logarítmica.

Fíjate en el siguiente diagrama de dispersión, se ha ajustado un modelo de regresión lineal a un conjunto de datos. Como puedes ver, la recta no es una mala aproximación de los datos, sin embargo, si prestas atención los valores crecen más rápido al principio del gráfico que al final, por lo que la recta no se acaba de ajustar completamente a las observaciones.

Así pues, merece la pena probar hacer un modelo de regresión logarítmica, ya que parece que los datos siguen un curva logarítmica. El resultado obtenido del modelo de regresión logarítmica es el siguiente:

ejemplo de regresión logarítmica

Como puedes ver en la gráfica anterior, el modelo de regresión logarítmico obtenido se ajusta mejor a la muestra de datos. De hecho, el coeficiente de determinación ha aumentado de un 66,87% a un 80,05%, por lo que el modelo ahora puede explicar mucho mejor la muestra de datos. Por lo tanto, en este caso es mejor utilizar la regresión logística para hallar una ecuación que aproxime el valor de los datos.

Otros tipos de regresión no lineal

Los tres casos de regresión no lineal más habituales son los siguientes:

  • Regresión logarítmica: se hace el logaritmo de la variable independiente.
  • Regresión exponencial: la variable independiente es el exponente de la ecuación.
  • Regresión polinomial: la ecuación del modelo de regresión tiene forma de polinomio.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio