Covarianza y varianza

En este post te explicamos qué son la varianza y la covarianza en estadística. Así pues, encontrarás cómo calcular la varianza y la covarianza de un conjunto de datos junto con ejercicios resueltos. Además, podrás ver cuál es la diferencia entre la varianza y la convarianza.

Varianza

La varianza es igual a la suma de los cuadrados de los residuos partido por el número total de observaciones. Así que la fórmula de la varianza es la siguiente:

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

En general, la interpretación de la varianza es similar a la desviación estándar. Cuanto más grande sea el valor de la varianza, más dispersos están los datos, es decir, en general más lejos están de la media. Y al revés, cuanto más pequeña sea el valor de la varianza, menos dispersión habrá en la serie de datos.

Ejemplo del cálculo de la varianza

  • De una empresa multinacional se conoce el resultado económico que ha tenido durante los últimos cinco años, en la mayoría ha obtenido beneficios pero un año presentó unas pérdidas considerables: 11, 5, 2, -9, 7 millones de euros. Calcula la varianza de este conjunto de datos.

Como hemos visto en la explicación de arriba, lo primero que debemos hacer para hallar la varianza de una serie de datos es calcular su media aritmética:

\overline{X}=\cfrac{11+5+2+(-9)+7}{5}=3,2

Y una vez sabemos el valor promedio de los datos podemos utilizar la fórmula de la varianza:

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{X}\right)^2}{n}

Sustituimos los datos proporcionados por el enunciado del ejercicio en la fórmula:

Var(X)=\cfrac{\displaystyle (11-3,2)^2+(5-3,2)^2+(2-3,2)^2+(-9-3,2)^2+(7-3,2)^2}{5}

Por último, solo queda resolver las operaciones para hacer el cálculo de la varianza:

\begin{aligned}Var(X)&=\cfrac{7,8^2+1,8^2+(-1,2)^2+(-12,2)^2+3,8^2}{5}\\[2ex]&=\cfrac{60,84+3,24+1,44+148,84+14,44}{5}\\[2ex]&= \cfrac{228,8}{5} \\[2ex]&=45,76 \ \text{millones de euros}^2\end{aligned}

Fíjate que las unidades de la varianza son las mismas unidades de los datos estadísticos pero elevadas al cuadrado, por eso la varianza de este grupo de datos es 45,76 millones de euros2.

Covarianza

En estadística, la covarianza es un valor que indica el grado de variación conjunta de dos variables aleatorias. Es decir, la covarianza sirve para analizar la dependencia entre dos variables.

La fórmula para calcular la covarianza es la siguiente:

Cov(X,Y)&=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{n}

La interpretación del valor de la covarianza es muy sencilla:

  • Si la covarianza es positiva, significa que existe una dependencia entre las dos variables. Por lo tanto, cuando una variable aumente de valor la otra variable también aumentará, y al revés.
  • Si la covarianza es negativa, quiere decir que la relación entre las dos variables es negativa. De manera que cuando una variable aumente de valor la otra variable disminuirá, y viceversa.
  • Si la covarianza es igual a cero (o su valor es cercano a cero), implica que no hay una relación entre las dos variables. Es decir, las dos variables aleatorias son independientes.

Ejemplo del cálculo de la covarianza

  • Calcula la covarianza del siguiente conjunto de datos estadísticos:

En primer lugar, tenemos que calcular la media aritmética de cada variable. Para ello, dividimos la suma de los valores de cada variable entre el número total de datos.

\overline{x}=\cfrac{58}{10}=5,8

\overline{y}=\cfrac{51}{10}=5,1

Una vez hemos determinado el promedio de cada variable aleatoria, podemos añadir las siguientes columnas a la tabla de datos para sacar la covarianza:

ejercicio resuelto de la covarianza

De modo que para determinar la covarianza de las dos variables debemos dividir el sumatorio de la última columna entre el número de parejas de datos:

\begin{aligned}Cov(X,Y)&=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{n}\\[2ex] Cov(X,Y)&= \cfrac{41,2}{10} \\[2ex]Cov(X,Y)&= 4,12\end{aligned}

En este caso el valor de la covarianza es positivo, lo que significa que hay una dependencia directa entre las dos variables aleatorias estudiadas. Sin embargo, si el valor de la covarianza hubiera sido negativo, significaría que la dependencia entre las dos variables es inversa. Y, finalmente, si el valor de la covarianza es nulo o muy próximo a cero, quiere decir que no existe una relación lineal entre las dos variables.

Diferencia entre varianza y covarianza

Para acabar de entender el concepto de varianza y de covarianza, vamos a ver en detalle cuál es la diferencia entre estas dos medidas estadísticas.

La diferencia entre la varianza y la covarianza es que la varianza indica la variabilidad de una variable, en cambio, la covarianza indica el grado de variación conjunta de dos variables, es decir, la covarianza mide la dependencia entre dos variables.

Así pues, la varianza y la covarianza son dos tipos de medidas estadísticas diferentes. La varianza es una medida de dispersión, mientras que la covarianza es una medida de dependencia entre variables.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio