Mínimos cuadrados

En este artículo se explica qué son los mínimos cuadrados en estadística, qué es el método de los mínimos cuadrados y cómo se ajusta un modelo de regresión por el criterio de los mínimos cuadrados.

¿Qué es el método de los mínimos cuadrados?

El método de los mínimos cuadrados es un método estadístico que se usa para determinar la ecuación de una regresión. Es decir, el método de los mínimos cuadrados es un criterio que se utiliza en un modelo de regresión para minimizar el error obtenido al calcular la ecuación de la regresión.

En concreto, el método de los mínimos cuadrados consiste en minimizar la suma de los cuadrados de los residuos, o dicho de otro modo, se basa en minimizar la suma de los cuadrados de las diferencias entre los valores predichos por el modelo de regresión y los valores observados. Más abajo veremos detalladamente cómo se ajusta un modelo de regresión por el criterio de mínimos cuadrados.

La principal característica del método de los mínimos cuadrados es que se minimizan las distancias más largas entre los valores observados y la función de regresión. A diferencia de otros criterios de regresión, el método de los mínimos cuadrados considera más importante minimizar los residuos grandes que los residuos pequeños, pues el cuadrado de un número grande es mucho mayor que el cuadrado de un número pequeño.

Error de estimación

Para entender bien el concepto de mínimos cuadrados, primero debemos tener claro qué son los residuos en un modelo de regresión. Así pues, a continuación veremos qué es un error de estimación y cómo se calcula.

En estadística, el error de estimación, también llamado residuo, es la diferencia entre el valor real y el valor ajustado por el modelo de regresión. Por lo tanto, un residuo estadístico se calcula de la siguiente manera:

e_i=y_i-\widehat{y}_i

Donde:

  • e_ies el residuo del dato i.
  • y_ies el valor real del dato i.
  • \widehat{y}_ies el valor proporcionado por el modelo de regresión del dato i.

De modo que cuanto mayor sea el residuo de un dato, significa que peor se ha ajustado el modelo de regresión para ese dato. De manera que cuanto más pequeño sea un residuo, menor será la distancia entre su valor real y su valor predicho.

Asimismo, si el residuo de un dato es positivo, quiere decir que el modelo de regresión ha predicho un valor menor que el valor real. Mientras que si el residuo es negativo, significa que el valor predicho es mayor que el valor real.

Minimizar los cuadrados de los errores

Ahora que ya sabemos qué es un residuo en estadística, será más fácil entender cómo se minimizan los cuadrados de los errores.

El cuadrado de un error es el cuadrado de un residuo, por lo tanto, el cuadrado de un error es igual a la diferencia entre el valor real y el valor ajustado por el modelo de regresión elevado a la dos.

e_i^2=(y_i-\widehat{y}_i)^2

Donde:

  • e_i^2es el cuadrado del residuo del dato i.
  • y_ies el valor real del dato i.
  • \widehat{y}_ies el valor proporcionado por el modelo de regresión del dato i.

Así pues, el método de los mínimos cuadrados consiste en hacer un modelo de regresión minimizando la suma de los cuadrados de los errores. Por lo tanto, el criterio de los mínimos cuadrados se basa en minimizar la siguiente expresión:

\begin{array}{l} [MIN] \ \displaystyle \sum_{i=1}^ne_i^2\\[4ex][MIN] \ \displaystyle \sum_{i=1}^n(y_i-\widehat{y}_i)^2\end{array}

Por eso el criterio de los mínimos cuadrados también se llama criterio del mínimo error cuadrático.

Como puedes ver en la fórmula anterior, el criterio por mínimos cuadrados da más importancia a minimizar los residuos grandes que los residuos pequeños. Por ejemplo, si un residuo es 3 y otro residuo es 5, sus cuadrados son 9 y 25 respectivamente, por lo tanto, el criterio por mínimos cuadrados priorizará minimizar el segundo residuo antes que el primer residuo.

Ajuste por mínimos cuadrados

El ajuste de un modelo de regresión por el criterio de los mínimos cuadrados consiste en encontrar un modelo de regresión que minimice los cuadrados de los residuos. Por lo tanto, la ecuación obtenida del modelo de regresión será aquella cuyos cuadrados de las diferencias entre los valores observados y los valores ajustados sea mínima.

Fíjate en el siguiente ejemplo que existen más criterios para realizar un modelo de regresión y, según el criterio escogido, la ecuación de la regresión es diferente.

método de los mínimos cuadrados, ajuste por mínimos cuadrados

Como puedes ver en los ejemplos anteriores, la recta obtenida del modelo de regresión lineal para un mismo conjunto de datos depende del criterio escogido. Generalmente, en los modelos de regresión se utiliza el criterio de los mínimos cuadrados.

En estadística, el modelo de regresión más utilizado es el modelo de regresión lineal simple, que consiste en aproximar la relación entre la variable independiente X y la variable dependiente Y mediante una recta.

y=b_0+b_1x

Así pues, las fórmulas para ajustar un conjunto de datos a un modelo de regresión lineal simple son las siguientes:

b_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}

b_0=\overline{y}-b_1\overline{x}

Puedes ver un ejemplo de cómo se calcula un modelo de regresión lineal simple por el criterio de los mínimos cuadrados haciendo clic en el siguiente enlace:

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio