Tamaño de la muestra

En este artículo se explica qué es el tamaño muestral y por qué es importante en estadística. Además, encontrarás cómo calcular el tamaño de la muestra adecuada y un ejercicio resuelto para que puedas ver cómo se hace.

¿Qué es el tamaño de la muestra?

El tamaño de la muestra (o tamaño muestral) es el número de individuos que componen la muestra de un estudio. En estadística, el tamaño de la muestra es importante para que la muestra sea representativa de toda la población.

Por lo tanto, el tamaño de la muestra de un estudio estadístico debe ser suficientemente grande para que represente las características de toda la población. Por otro lado, el tamaño de la muestra no puede ser excesivamente grande ya que entonces se encarece la investigación. En conclusión, el tamaño de la muestra debe ser el adecuado, ni demasiado grande ni demasiado pequeño.

Por ejemplo, si queremos realizar un análisis sobre la altura de un país, no podemos preguntar la altura a todos los habitantes del país, ya que la investigación llevaría mucho tiempo y resultaría demasiado cara. Así que debemos hacer un muestreo aleatorio y preguntar solamente a una muestra representativa de la población.

¿Y cómo podemos saber el tamaño de la muestra adecuado? En el siguiente apartado veremos cómo determinar el tamaño de la muestra apropiado según los requisitos de la investigación.

Cómo calcular el tamaño de la muestra

Para la estimación de una media, el tamaño de la muestra necesario es igual al cuadrado de Zα/2 multiplicado por la desviación típica (σ) dividido por el margen de error deseado (e). De modo que la fórmula para calcular el tamaño de la muestra es la siguiente:

\displaystyle n=\left(\frac{Z_{\alpha/2}\cdot\sigma}{e}\right)^2

Donde:

  • n es el tamaño de la muestra.
  • \alpha es el nivel de significación deseado. Teniendo en cuenta que 1-\alpha es el nivel de confianza deseado.
  • Z_{\alpha/2} es el cuantil de la distribución normal estándar correspondiente a una probabilidad de α/2. Para tamaños muestrales grandes y un nivel de confianza del 95% se suele aproximar a 1,96 y para una confianza del 99% se suele aproximar a 2,576.
  • \sigma es la desviación típica.

Ten presente que en esta fórmula se está suponiendo que el tamaño poblacional es infinito, es decir, que el tamaño de la población es muy grande o desconocido.

Nota: la fórmula anterior se deduce de la fórmula del intervalo de confianza para la media.

Ejemplo del cálculo del tamaño de una muestra

En este apartado calcularemos el tamaño muestral adecuado para una investigación estadística a modo de ejemplo.

  • Sabemos que la desviación típica de una población es aproximadamente de 15, pero desconocemos su media así que queremos llevar a cabo un estudio para hacer una estimación de la media. ¿Cuál es el tamaño de la muestra que necesitamos si queremos un margen de error de ±2 con un nivel de confianza del 95%?

Tal y como hemos visto arriba, la fórmula para calcular el tamaño muestral es la siguiente:

\displaystyle n=\left(\frac{Z_{\alpha/2}\cdot\sigma}{e}\right)^2

En este caso, el nivel de confianza deseado es del 95%, por lo tanto, el valor de Zα/2 correspondiente es 1,96.

1-\alpha=0,95 \ \color{orange}\bm{\longrightarrow}\color{black} \ \alpha=0,05 \ \color{orange}\bm{\longrightarrow}\color{black}\ \alpha/2=0,025

\begin{array}{c}Z_{\alpha/2}= \ \color{orange}\bm{?}\\[4ex]Z_{0,025}=1,96\end{array}

Por último, ahora que ya sabemos cuánto valen todos los parámetros, sustituimos sus valores en la fórmula y calculamos el tamaño muestral:

\begin{aligned}\displaystyle n&=\left(\frac{Z_{\alpha/2}\cdot\sigma}{e}\right)^2\\[2ex] n&=\left(\frac{1,96\cdot 15}{2}\right)^2\\[2ex] n&=216,09 \approx 217 \end{array}

En definitiva, para estimar la media poblacional con los requisitos deseados necesitamos, como mínimo, una muestra con un tamaño de 217 individuos.

Tamaño de la muestra, nivel de confianza y margen de error

Según el nivel de confianza y el margen de error demandados, el tamaño muestral necesario variará. Así pues, el tamaño de la muestra, el nivel de confianza y el margen de error se relacionan de la siguiente manera:

  1. El tamaño de la muestra y el nivel de confianza son directamente proporcionales. Es decir, si el nivel de confianza aumenta, el tamaño muestral también aumentará.
  2. El tamaño de la muestra y el margen de error son inversamente proporcionales. De modo que si el margen de error aumenta, el tamaño muestral disminuirá.
  3. Por lo tanto, si se aumenta el tamaño de la muestra, se puede incrementar el nivel de confianza o reducir el margen de error.

Otras fórmulas del tamaño de una muestra

Según el parámetro que se desea estimar, la fórmula del tamaño muestral necesario varia ligeramente. Así pues, en este apartado veremos otras fórmulas que pueden serte útiles para calcular el tamaño de la muestra en algunos casos particulares.

Tamaño de la muestra de una proporción

La fórmula para calcular el tamaño de una muestra necesario para la estimación de una proporción (p) es la siguiente:

n=\cfrac{N\cdot Z_{\alpha/2}^2\cdot p\cdot (1-p)}{e^2\cdot (N-1)+Z_{\alpha/2}^2\cdot p\cdot (1-p)}

Tamaño de la muestra de una probabilidad

Cuando se quiere realizar la estimación de una probabilidad, se recomienda utilizar la siguiente fórmula para determinar el tamaño muestral necesario:

\displaystyle n=\left(\frac{Z_{\alpha/2}}{2\cdot e}\right)^2

Tamaño de la muestra para la comparación de dos medias independientes

La fórmula para calcular el tamaño muestral cuando se comparan dos medias independientes con un riesgo α y un riesgo β determinados es la siguiente:

n=\cfrac{2\cdot \sigma^2 \cdot \left(Z_{\alpha/2}+Z_\beta\right)}{\Delta^2}

Donde \Delta es la diferencia entre las dos medias de la hipótesis alternativa.

Tamaño de la muestra para la comparación de dos medias apareadas

Si se desea comparar dos medias apareadas con un error α y un error β fijados, la fórmula que se debe emplear para hallar el número de observaciones de la muestra es la siguiente:

n=\cfrac{2\cdot \sigma_d^2 \cdot \left(Z_{\alpha/2}+Z_\beta\right)}{\Delta^2}

Donde \Delta es la diferencia entre las dos medias apareadas de la hipótesis alternativa y \sigma_d^2 es la varianza de las diferencias entre dos medidas de un mismo individuo.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ir arriba