Intervalo de confianza para la diferencia de medias

En este post se explica qué es intervalo de confianza para la diferencia de medias en estadística y para qué sirve. Así pues, encontrarás cómo calcular el intervalo de confianza para la diferencia de dos medias y un ejercicio resuelto paso a paso.

¿Qué es el intervalo de confianza para la diferencia de medias?

El intervalo de confianza para la diferencia de medias es un intervalo que proporciona un valor máximo y un valor mínimo entre los cuales se encuentra el valor de la diferencia de las medias de dos poblaciones con un determinado nivel de confianza.

Por ejemplo, si el intervalo de confianza para la diferencia de las medias de dos poblaciones con un nivel de confianza del 95% es (3,5), significa que la diferencia entre las dos medias poblacionales estará entre 3 y 5 con una probabilidad del 95%.

Por lo tanto, en estadística el intervalo de confianza para la diferencia de medias se usa para estimar dos valores entre los cuales se encuentra la diferencia entre dos medias poblacionales. De manera que a partir de los datos de dos muestras, se puede aproximar cuál es la diferencia entre las medias de las poblaciones.

Fórmula del intervalo de confianza para la diferencia de medias

La fórmula del intervalo de confianza para la diferencia de medias depende de si se conocen las varianzas de las poblaciones y, en caso contrario, de si se puede suponer que las varianzas poblacionales son iguales o no. Así pues, a continuación veremos cómo se calcula el intervalo de confianza para la diferencia de medias en cada caso.

Varianzas conocidas

La fórmula para calcular el intervalo de confianza para la diferencia de medias cuando se conocen las varianzas de las dos poblaciones con un nivel de confianza de 1-α es la siguiente:

\displaystyle (\overline{x_1}-\overline{x_2})\pm Z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}

Donde:

  • \overline{x_i} es la media de la muestra i.
  • \sigma_i es la desviación estándar de la población i.
  • Z_{\alpha/2} es el valor de la distribución normal estándar con una probabilidad de α/2.
  • n_i es el tamaño de la muestra i.

Este caso es el menos habitual, ya que generalmente no se sabe el valor de las varianzas de las poblaciones.

Varianzas desconocidas e iguales

Cuando se desconocen las varianzas de las dos poblaciones pero pueden aproximarse como iguales, la fórmula para calcular el intervalo de confianza para la diferencia de medias con un nivel de confianza de 1-α es la siguiente:

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}

Donde:

  • \overline{x_i} es la media de la muestra i.
  • s_p es la desviación estándar combinada.
  • t_{\alpha/2} es el valor de la distribución t de Student de n1+n2-2 grados de libertad con una probabilidad de α/2.
  • n_i es el tamaño de la muestra i.

Como en este caso se supone que las varianzas poblacionales son equivalentes, en el cálculo del intervalo de confianza interviene la desviación estándar combinada, que se calcula con la siguiente fórmula:

\displaystyle s_p=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}

Donde s_i es la desviación estándar de la muestra i.

Varianzas desconocidas y diferentes

Cuando se desconocen las varianzas de las dos poblaciones y no se puede suponer que son iguales, la fórmula para calcular el intervalo de confianza para la diferencia de medias con un nivel de confianza de 1-α es la siguiente:

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}

Donde:

  • \overline{x_i} es la media de la muestra i.
  • s_i es la desviación estándar de la muestra i.
  • t_{\alpha/2} es el valor de la distribución t de Student con una probabilidad de α/2.
  • n_i es el tamaño de la muestra i.

En este caso, los grados de libertad de la distribución t de Student se calculan mediante la siguiente fórmula:

\displaystyle GL=\frac{\displaystyle\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2}{\displaystyle\frac{\displaystyle\frac{s_1^2}{n_1}}{n_1-1}+\frac{\displaystyle\frac{s_2^2}{n_2}}{n_2-1}}

Donde s_i es la desviación estándar de la muestra i.

Ejemplo resuelto del intervalo de confianza para la diferencia de medias

Una vez hemos visto la definición del intervalo de confianza para la diferencia de medias y cuáles son las diferentes fórmulas, a continuación veremos un ejemplo resuelto para acabar de asimilar cómo se calcula el intervalo de confianza para la diferencia de dos medias.

  • Se quiere estudiar el efecto del tabaco en el peso de los niños al nacer. Para ello, se compara dos muestras: la primera muestra está formada por niños cuyas madres no eran fumadoras y la segunda muestra está formada por niños cuyas madre sí que fumaban (los parámetros muestrales se indican a continuación). Calcula el intervalo de confianza para la diferencia de medias con un nivel de confianza del 95%.
    1. Madres no fumadoras: \overline{x_1}=3,1 \ kg \quad s_1=0,6 \ kg \quad n_1=39
    2. Madres fumadoras: \overline{x_2}=3,5 \ kg \quad s_2=0,4 \ kg\quad n_2=43

En este caso, no conocemos los valores de las varianzas de las poblaciones, sin embargo, se pueden suponer que las varianzas poblacionales son equivalentes porque se trata de dos poblaciones con características muy similares. Por lo tanto, la fórmula del intervalo de confianza para la diferencia de medias que debemos usar es la siguiente:

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}

Así pues, calculamos la desviación estándar combinada a partir de las desviaciones estándar de las dos muestras:

\begin{aligned}\displaystyle s_p&=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}\\[2ex]\displaystyle s_p&=\sqrt{\frac{(39-1)\cdot 0,6^2+(43-1)\cdot 0,4^2}{39+43-2}}\\[2ex]\displaystyle s_p&=0,50\end{aligned}

Asimismo, debemos buscar el valor de la distribución t de Student de 80 grados de libertad con una probabilidad de 2,5% en la tabla de la distribución de probabilidad t de Student:

1-\alpha=0,95 \ \color{orange}\bm{\longrightarrow}\color{black} \ \alpha=0,05 \ \color{orange}\bm{\longrightarrow}\color{black}\ \alpha/2=0,025

\begin{array}{c}t_{\alpha/2| n_1+n_2-2}= \ \color{orange}\bm{?}\\[4ex]t_{0,025|80}=1,990\end{array}

Finalmente, sustituimos los datos en la fórmula del intervalo de confianza para la diferencia de medias y hacemos los cálculos:

\displaystyle (\overline{x_1}-\overline{x_2})\pm t_{\alpha/2}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}

\displaystyle (3,1-3,5)\pm 1,990\cdot 0,5\cdot\sqrt{\frac{1}{39}+\frac{1}{43}}

\displaystyle -0,4\pm 0,22

De modo que el intervalo de confianza para la diferencia de medias del problema es el siguiente:

(-0,61,-0,18)

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ir arriba