En este artículo se explica qué es la distribución muestral en estadística y para qué sirve. Así pues, encontrarás el significado de una distribución muestral, un ejemplo resuelto de una distribución muestral y, además, las fórmulas de los tipos de distribuciones muestrales más frecuentes.
Índice
¿Qué es la distribución muestral?
La distribución muestral, o distribución de muestreo, es la distribución que resulta de considerar todas las muestras posibles de una población. Es decir, la distribución muestral es aquella distribución que se obtiene al calcular un parámetro muestral de todas las muestras posibles de una población.
Por ejemplo, si de una población estadística extraemos todas las muestras posibles y calculamos la media de cada muestra, el conjunto de medias muestrales forman una distribución muestral. En concreto, como el parámetro calculado es la media aritmética, se trata de la distribución muestral de la media.
En estadística, la distribución muestral sirve para calcular la probabilidad que se tiene de acercarse al valor del parámetro poblacional al estudiar una sola muestra. Asimismo, la distribución muestral permite estimar el error muestral para un tamaño de muestra dado.
Ejemplo de la distribución muestral
Ahora que ya sabemos la definición de la distribución muestral, vamos a ver un ejemplo simple para acabar de entender el concepto.
- En una caja metemos tres bolas y cada una tiene escrito un número del uno al tres, de manera que una bola tiene el número 1, otra bola tiene el número 2 y la última bola tiene el número 3. Para un tamaño muestral n=2, calcula las probabilidades de la distribución muestral de la media si se seleccionan las muestras con reemplazo.
Las muestras se seleccionan con reemplazo, es decir, la bola que se coge para seleccionar el primer elemento de la muestra se vuelve a meter dentro de la caja y puede volver a ser seleccionada en la segunda extracción. Por lo tanto, todas las muestras posibles de la población son:
1,1 1,2 1,3
2,1 2,2 2,3
3,1 3,2 3,3
Así pues, calculamos la media aritmética de cada muestra posible:
Por lo tanto, las probabilidades de obtener cada valor de la media muestral al seleccionar una muestra aleatoria de la población son las siguientes:
Las probabilidades de la distribución muestral que se muestran en la tabla anterior se han calculado dividiendo el número de muestras que tienen dicho valor de la media entre el número total de casos posibles. Por ejemplo: la media muestral vale 1,5 en dos casos de los nueve posibles, por lo tanto, P(1,5)=2/9.
Tipos de distribuciones muestrales
Las distribuciones muestrales (o distribuciones de muestreo) se pueden clasificar según el parámetro muestral a partir del cual se han obtenido. Así pues, los tipos de distribuciones más usuales son los siguientes:
- Distribución muestral de la media: es la distribución muestral que resulta de calcular la media aritmética de cada muestra.
- Distribución muestral de la proporción: es la distribución muestral que se obtiene al calcular la proporción de todas las muestras.
- Distribución muestral de la varianza: es la distribución muestral que forman el conjunto de todas las varianzas muestrales.
- Distribución muestral de la diferencia de medias: es la distribución muestral que resulta de calcular la diferencia entre las medias de todas las muestras posibles de dos poblaciones diferentes.
- Distribución muestral de la diferencia de proporciones: es la distribución muestral que se consigue al restar todas las proporciones muestrales posibles de dos poblaciones.
A continuación se explica cada tipo de distribución muestral más detalladamente.
Distribución muestral de la media
Dada una población que sigue una distribución de probabilidad normal de media y desviación estándar
y se extraen de ella muestras de tamaño
, la distribución muestral de la media también estará definida por una distribución normal con las siguientes características:
Donde es la media de la distribución muestral de la media y
es su desviación típica. Asimismo,
es el error estándar de la distribución muestral.
Nota: si la población no sigue una distribución normal pero el tamaño muestral es grande (n>30), la distribución muestral de la media también se puede aproximar a la distribución normal anterior por el teorema central del límite.
Por lo tanto, como la distribución muestral de la media sigue una distribución normal, la fórmula para calcular cualquier probabilidad relacionada con la media de una muestra es la siguiente:
Donde:
es la media de la muestra.
es la media de la población.
es la desviación típica de la población.
es el tamaño de la muestra.
es una variable definida por la distribución normal estándar N(0,1).
Distribución muestral de la proporción
En realidad, al estudiar una proporción de una muestra estamos analizando los casos de éxito, por lo tanto, la variable aleatoria del estudio sigue una distribución de probabilidad binomial.
Según el teorema central del límite, para tamaños grandes (n>30) podemos aproximar una distribución binomial a una distribución normal. Por lo tanto, la distribución muestral de la proporción se aproxima a una distribución normal con los siguientes parámetros:
Donde es la probabilidad de éxito y
es la probabilidad de fracaso
.
Nota: una distribución binomial solo se puede aproximar a una distribución normal si ,
y
.
Por lo tanto, como se puede aproximar la distribución muestral de la proporción a una distribución normal, la fórmula para calcular cualquier probabilidad relacionada con la proporción de una muestra es la siguiente:
Donde:
es la proporción de la muestra.
es la proporción de la población.
es la probabilidad de fracaso de la población,
.
es el tamaño de la muestra.
es una variable definida por la distribución normal estándar N(0,1).
Distribución muestral de la varianza
La distribución muestral de la varianza está definida por la distribución de probabilidad chi-cuadrado. Por lo tanto, la fórmula del estadístico de la distribución muestral de la varianza es la siguiente:
Donde:
es el estadístico de la distribución muestral de la varianza, el cual sigue una distribución chi-cuadrado.
es el tamaño muestral.
es la varianza de la muestra.
es la varianza de la población.
Distribución muestral de la diferencia de medias
Si el tamaño muestral es suficientemente grande (n1≥30 y n2≥30), la distribución muestral de la diferencia de medias sigue una distribución normal. En concreto, los parámetros de dicha distribución se calculan de la siguiente manera:
Nota: si las dos poblaciones son distribuciones normales, entonces la distribución muestral de la diferencia de medias sigue una distribución normal independientemente de los tamaños muestrales.
Por lo tanto, como la distribución muestral de la diferencia de medias está definida por una distribución normal, la fórmula para calcular el estadístico de la distribución muestral de la diferencia de medias es la siguiente:
Donde:
es la media de la muestra i.
es la media de la población i.
es la desviación estándar de la población i.
es el tamaño de la muestra i.
es una variable definida por la distribución normal estándar N(0,1).
Fíjate que las muestras de las poblaciones diferentes pueden tener un tamaño muestral distinto.
Distribución muestral de la diferencia de proporciones
Las muestras que se seleccionan para la distribución muestral de la diferencia de proporciones están definidas por distribuciones binomiales, ya que a efectos prácticos una proporción es una relación de los casos de éxito respecto al número total de observaciones.
No obstante, debido al teorema del límite central, las distribuciones binomiales se pueden aproximar a distribuciones de probabilidad normales. En consecuencia, la distribución muestral de la diferencia de proporciones se puede aproximar a una distribución normal con las siguientes características:
Nota: la distribución muestral de la diferencia de proporciones solo se puede aproximar a una distribución normal si ,
,
,
,
y
.
Por lo tanto, como se puede aproximar la distribución muestral de la diferencia de proporciones a una distribución normal, la fórmula para calcular el estadístico de la distribución muestral de la diferencia de proporciones es la siguiente:
Donde:
es la proporción de la muestra i.
es la proporción de la población i.
es la probabilidad de fracaso de la población i,
.
es el tamaño de la muestra i.
es una variable definida por la distribución normal estándar N(0,1).
Excelente exposición. Precisa y concisa
¡Muchas gracias!
Amo esta página, explica todo muy bien y conciso. Sirve para consultar en todo momento.
¡Muchas gracias Miriam! ¡Me alegro de que te resulte útil!
Excelentísimo, trabajo, soy licenciado en estadística y hacen algo muy bueno para los estudiantes.
¡Gracias Gustavo! ¡Me alegra que te guste!
excelente información, siempre me ayuda esta pagina. muy bueno 10/10