Medidas de variabilidad

En este artículo se explica qué son las medidas de variabilidad y para qué sirven este tipo de métricas estadísticas. Así pues, encontrarás la definición de medida de variabilidad, cuáles son los diferentes tipos de medidas de variabilidad y cómo se calculan las medidas de variabilidad.

¿Qué son las medidas de variabilidad?

Las medidas de variabilidad son una medidas estadísticas que indican la variabilidad de un conjunto de datos. Es decir, las medidas de variabilidad miden la dispersión de una serie de datos.

Por lo tanto, las medidas de variabilidad sirven para saber cuánto de dispersos están los valores de una muestra. Cuanto más alto sea el valor de una medida de variabilidad, significa que los datos de la muestra están más separados entre sí. En general, interesa que los datos de la muestra estén próximos entre sí, por lo que normalmente se intentan minimizar las medidas de variabilidad.

En estadística, las medidas de variabilidad son importantes porque nos permiten saber la representatividad de una medida de centralización sobre el conjunto de datos. Si los valores de las medidas de variabilidad son bajos, significa que los datos están muy concentrados y, por tanto, las medidas de centralización describen bien el conjunto de los datos.

Las medidas de variabilidad también se pueden llamar medidas de dispersión o medidas de propagación.

¿Cuáles son las medidas de variabilidad?

Las medidas de variabilidad son las siguientes:

  • Desviación estándar (o desviación típica)
  • Varianza
  • Coeficiente de variación
  • Rango
  • Rango intercuartil
  • Desviación media

A continuación se explica cómo calcular cada tipo de medida de variabilidad

Desviación estándar

La desviación estándar, también llamada desviación típica, es igual a la raíz cuadrada de la suma de los cuadrados de las desviaciones de la serie de datos partido por el número total de observaciones.

Por lo tanto, la fórmula de esta medida de variabilidad es la siguiente:

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^N(x_i-\overline{x})^2}{N}}

Varianza

La varianza es igual a la suma de los cuadrados de los residuos partido por el número total de observaciones. Así que la fórmula de esta métrica de variabilidad es la siguiente:

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

Donde:

  • X es la variable aleatoria de la que se quiere calcular la varianza.
  • x_i es el valor del dato i.
  • n es el número total de observaciones.
  • \overline{X} es la media de la variable aleatoria X.

Coeficiente de variación

En estadística, el coeficiente de variación es una medida de variabilidad que sirve para determinar la dispersión de un conjunto de datos respecto a su media. El coeficiente de variación se calcula dividiendo la desviación estándar de los datos entre su promedio, y luego se multiplica por 100 para expresar el valor en forma de porcentaje.

CV=\cfrac{\sigma}{\overline{x}}\cdot 100

Rango

El rango es una medida de variabilidad que indica la diferencia entre el valor máximo y el valor mínimo de los datos de una muestra. Por lo tanto, para calcular el rango de una población o muestra estadística se debe restar el valor máximo menos el valor mínimo.

R=\text{M\'ax}-\text{M\'in}

Rango intercuartil

El rango intercuartil, también llamado rango intercuartílico, es una medida de variabilidad estadística que indica la diferencia entre el tercer y el primer cuartil.

Por lo tanto, para calcular el rango intercuartil de un conjunto de datos estadísticos primero se debe hallar el tercer y el primer cuartil, y luego restarlos.

IQR=Q_3-Q_1

El símbolo del rango intercuartil es IQR, del inglés interquartile range.

Una de las características más ventajosas de esta medida de variabilidad es que se trata de un estadístico robusto, es decir, tiene una alta robustez a los valores atípicos. Como en el cálculo del rango intercuartil no se tienen en cuenta los valores extremos, su valor variará muy poco si aparecen nuevas observaciones atípicas (outliers).

Desviación media

La desviación media, también llamada desviación absoluta promedio, es la media de las desviaciones absolutas, por lo tanto, la desviación media es igual al sumatorio de las desviaciones de cada dato respecto a la media aritmética dividido entre el número total de datos.

D_{\overline{x}}=\cfrac{\sum_{i=1}^N|x_i-\overline{x}|}{N}

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio