Medidas de dispersión

En este artículo encontrarás cuáles son las medidas de dispersión y para qué sirven estás métricas estadísticas. Además, podrás ver cómo se calcula cada medida de dispersión.

¿Qué son las medidas de dispersión?

Las medidas de dispersión son unas métricas estadísticas que indican la dispersión de un conjunto de datos. Es decir, las medidas de dispersión se utilizan para evaluar cuánto de dispersos están los datos de una muestra.

Las medidas de dispersión también se llaman medidas de variabilidad o medidas de propagación.

¿Cuáles son las medidas de dispersión?

Las medidas de dispersión son las siguientes:

  • Desviación estándar (o desviación típica)
  • Varianza
  • Coeficiente de variación
  • Rango
  • Rango intercuartil
  • Desviación media

A continuación se explica cómo determinar cada medida de dispersión.

Desviación estándar

La desviación estándar, también llamada desviación típica, es igual a la raíz cuadrada de la suma de los cuadrados de las desviaciones de la serie de datos partido por el número total de observaciones.

Por lo tanto, la fórmula de esta medida de dispersión es la siguiente:

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^N(x_i-\overline{x})^2}{N}}

Varianza

La varianza es igual a la suma de los cuadrados de los residuos partido por el número total de observaciones. Así que la fórmula de esta métrica de dispersión es la siguiente:

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

Donde:

  • X es la variable aleatoria de la que se quiere calcular la varianza.
  • x_i es el valor del dato i.
  • n es el número total de observaciones.
  • \overline{X} es la media de la variable aleatoria X.

Coeficiente de variación

En estadística, el coeficiente de variación es una medida de dispersión que sirve para determinar la dispersión de un conjunto de datos respecto a su media. El coeficiente de variación se calcula dividiendo la desviación estándar de los datos entre su promedio, y luego se multiplica por 100 para expresar el valor en forma de porcentaje.

CV=\cfrac{\sigma}{\overline{x}}\cdot 100

Rango

El rango es una medida de dispersión que indica la diferencia entre el valor máximo y el valor mínimo de los datos de una muestra. Por lo tanto, para calcular el rango de una población o muestra estadística se debe restar el valor máximo menos el valor mínimo.

R=\text{M\'ax}-\text{M\'in}

Rango intercuartil

El rango intercuartil, también llamado rango intercuartílico, es una medida de dispersión estadística que indica la diferencia entre el tercer y el primer cuartil.

Por lo tanto, para calcular el rango intercuartil de un conjunto de datos estadísticos primero se debe hallar el tercer y el primer cuartil, y luego restarlos.

IQR=Q_3-Q_1

El símbolo del rango intercuartil es IQR, del inglés interquartile range.

Una de las características más ventajosas de esta medida de dispersión es que se trata de un estadístico robusto, es decir, tiene una alta robustez a los valores atípicos. Como en el cálculo del rango intercuartil no se tienen en cuenta los valores extremos, su valor variará muy poco si aparecen nuevas observaciones atípicas (outliers).

Desviación media

La desviación media, también llamada desviación absoluta promedio, es la media de las desviaciones absolutas, por lo tanto, la desviación media es igual al sumatorio de las desviaciones de cada dato respecto a la media aritmética dividido entre el número total de datos.

D_{\overline{x}}=\cfrac{\sum_{i=1}^N|x_i-\overline{x}|}{N}

¿Para qué sirven las medidas de dispersión?

Las medidas de dispersión sirven para evaluar la dispersión de una muestra estadística. Es decir, las medidas de dispersión permiten cuantificar la dispersión de un conjunto de datos, y a partir de los valores obtenidos se puede analizar la dispersión de la muestra de datos.

Las medidas de dispersión son muy utilizadas, ya que permiten describir una muestra de datos. Las medidas de dispersión ayudan a entender cómo es una serie de datos.

Otras métricas estadísticas que también se calculan a menudo son las medidas de tendencia central y las medidas de posición. En general, no se determina una única medida estadística, sino que se sacan varias métricas para entender mejor cómo son los datos que se están estudiando.

Deja un comentario

Tu dirección de correo electrónico no será publicada.

Ir arriba