Prueba de hipótesis para la diferencia de medias

En este post se explica qué es la prueba de hipótesis para la diferencia de medias en estadística y para qué sirve. Asimismo, encontrarás cómo hacer una prueba de hipótesis para la diferencia de medias y un ejercicio resuelto paso a paso.

¿Qué es la prueba de hipótesis para la diferencia de medias?

La prueba de hipótesis para la diferencia de medias es una prueba estadística que sirve para rechazar o aceptar la hipótesis de que las medias de dos poblaciones son diferentes. Es decir, la prueba de hipótesis para la diferencia de medias se usa para determinar si dos medias poblacionales son iguales o distintas.

Ten en cuenta que las decisiones tomadas en las pruebas de hipótesis se basan en un nivel de confianza previamente establecido, por lo que no se puede garantizar que el resultado de una prueba de hipótesis sea siempre el acertado, sino que es el resultado más probable de que sea verdad.

La prueba de hipótesis para la diferencia de dos medias consiste en calcular el estadístico de la prueba y compararlo con el valor crítico para rechazar o no rechazar la hipótesis nula. Más abajo veremos cómo se hace una prueba de hipótesis para la diferencia de medias.

Finalmente, recuerda que en estadística las pruebas de hipótesis también se pueden decir contrastes de hipótesis, test de hipótesis o pruebas de significación.

Fórmula de la prueba de hipótesis para la diferencia de medias

La fórmula que se debe usar para hacer la prueba de hipótesis para la diferencia de medias varia según si se conocen las varianzas de las poblaciones y, en caso contrario, de si se puede suponer que son iguales o distintas. Así pues, en este apartado veremos cuál es la fórmula que debemos utilizar según el caso.

Varianzas conocidas

La fórmula para calcular el estadístico de la prueba de hipótesis para la diferencia de medias cuando las varianzas son conocidas es la siguiente:

\displaystyle Z=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}

Donde:

  • Z es el estadístico de la prueba de hipótesis para la diferencia de dos medias con varianza conocida, el cual sigue una distribución normal estándar.
  • \mu_1 es la media de la población 1.
  • \mu_2 es la media de la población 2.
  • \overline{x_1} es la media de la muestra 1.
  • \overline{x_2} es la media de la muestra 2.
  • \sigma_1 es la desviación estándar de la población 1.
  • \sigma_2 es la desviación estándar de la población 2.
  • n_1 es el tamaño de la muestra 1.
  • n_2 es el tamaño de la muestra 2.

Ten en cuenta que este es el caso menos habitual, de manera que esta fórmula solo se utiliza en algunos casos concretos.

Varianzas desconocidas e iguales

La fórmula para calcular el estadístico de la prueba de hipótesis para la diferencia de medias cuando las varianzas poblacionales son desconocidas pero se suponen iguales es la siguiente:

\displaystyle t=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}

Donde:

  • t es el estadístico de la prueba de hipótesis para la diferencia de medias con varianzas desconocidas, el cual sigue una distribución t Student con n1+n2-2 grados de libertad.
  • \mu_1 es la media de la población 1.
  • \mu_2 es la media de la población 2.
  • \overline{x_1} es la media de la muestra 1.
  • \overline{x_2} es la media de la muestra 2.
  • s_p es la desviación estándar combinada.
  • n_1 es el tamaño de la muestra 1.
  • n_2 es el tamaño de la muestra 2.

La desviación estándar combinada de las dos muestras se calcula con la siguiente fórmula:

\displaystyle s_p=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}

Varianzas desconocidas y diferentes

Cuando se desconocen las varianzas de las poblaciones y, además, se suponen que son diferentes, la fórmula para calcular el estadístico de la prueba de hipótesis para la diferencia de medias es la siguiente:

\displaystyle t=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle \sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}

Donde:

  • t es el estadístico de la prueba de hipótesis para la diferencia de medias con varianzas desconocidas, el cual sigue una distribución t Student.
  • \mu_1 es la media de la población 1.
  • \mu_2 es la media de la población 2.
  • \overline{x_1} es la media de la muestra 1.
  • \overline{x_2} es la media de la muestra 2.
  • \sigma_1 es la desviación estándar de la población 1.
  • \sigma_2 es la desviación estándar de la población 2.
  • n_1 es el tamaño de la muestra 1.
  • n_2 es el tamaño de la muestra 2.

Sin embargo, en este caso los grados de libertad de la distribución t de Student se calculan mediante la siguiente fórmula:

\displaystyle GL=\frac{\displaystyle\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2}{\displaystyle\frac{\displaystyle\frac{s_1^2}{n_1}}{n_1-1}+\frac{\displaystyle\frac{s_2^2}{n_2}}{n_2-1}}

Ejemplo resuelto de la prueba de hipótesis para la diferencia de medias

Para acabar de asimilar el concepto de la prueba de hipótesis para la diferencia de medias, vamos a ver un ejemplo resuelto de este tipo de pruebas de hipótesis.

  • Se quiere hacer un estudio estadístico sobre el salario de dos empresas competidoras, en concreto, se quiere determinar si el salario medio de las dos empresas es diferente. Para ello, se toma una muestra de 47 trabajadores de una empresa y otra muestra de 55 trabajadores de la otra empresa. Se obtiene un salario medio de 40000 dólares y una desviación típica de 12000 dólares de la primera muestra, mientras que de la segunda muestra se obtiene un salario medio de 46000 dólares y una desviación típica de 18000 dólares. Realiza una prueba de hipótesis con un nivel de significación del 5% para determinar si los salarios medios son distintos o no.

En este caso, la hipótesis nula y la hipótesis alternativa de la prueba de hipótesis para la diferencia de las dos medias son las siguientes:

\begin{cases}H_0: \mu_1-\mu_2=0\\[2ex] H_1:\mu_1-\mu_2\neq 0 \end{cases}

En este caso, no se conocen las varianzas de las poblaciones, pero se puede suponer que son iguales porque son empresas competidores y las condiciones laborales del mercado en el que operan son muy similares. Por lo tanto, la fórmula del estadístico de la prueba de hipótesis para la diferencia de medias que debemos usar es la siguiente:

\displaystyle t=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}

Así pues, calculamos la desviación estándar combinada de las dos muestras:

\begin{aligned}\displaystyle s_p&=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}\\[2ex]\displaystyle s_p&=\sqrt{\frac{(47-1)\cdot 12000^2+(55-1)\cdot 18000^2}{47+55-2}}\\[2ex]s_p&=15530,61\end{aligned}

Ahora aplicamos la fórmula de la prueba de hipótesis para la diferencia de medias:

\displaystyle t=\frac{\displaystyle (\overline{x_1}-\overline{x_2})-(\mu_1-\mu_2)}{\displaystyle s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}=\cfrac{(40000-46000)-0}{\displaystyle 15530,61\sqrt{\frac{1}{47}+\frac{1}{55}}}=-1,94

Por otro lado, buscamos el valor crítico de la prueba de hipótesis para la diferencia de medias en la tabla de la t Student:

\alpha=0,05 \ \color{orange}\bm{\longrightarrow}\color{black}\ \alpha/2=0,025

\begin{array}{c}t_{\alpha/2| n_1+n_2-2}= \ \color{orange}\bm{?}\\[4ex]t_{0,025| 100}=1,984\end{array}

Entonces, como el valor absoluto del estadístico de la prueba es menor que el valor crítico de la prueba, se acepta la hipótesis nula y se rechaza la hipótesis alternativa.

|-1,94|=1,94<1,984 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Se rechaza } H_1

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ir arriba