Prueba de bondad de ajuste

En este artículo se explica qué es una prueba de bondad de ajuste y para qué sirve en estadística. También se muestra cómo se hace una prueba de bondad de ajuste y, además, podrás ver un ejercicio resuelto paso a paso.

¿Qué es una prueba de bondad de ajuste?

La prueba de bondad de ajuste es una prueba estadística que permite determinar si una muestra de datos se ajusta a una determinada distribución de probabilidad o no. Es decir, la prueba de bondad de ajuste sirve para verificar si los datos observados se ajustan a los datos esperados.

Frecuentemente, intentamos hacer predicciones sobre un fenómeno y, por tanto, tenemos unos valores esperados acerca de dicho fenómeno que creemos que sucederán. No obstante, luego debemos hacer la recolección de los datos y comprobar si efectivamente los datos recopilados son los que esperábamos. Así pues, las pruebas de bondad de ajuste nos permite decidir mediante un criterio estadístico si los datos esperados y los datos observados son similares o no.

De modo que la prueba de bondad de ajuste es una prueba de hipótesis cuya hipótesis nula es que los valores observados son iguales a los valores esperados, por otro lado, la hipótesis alternativa de la prueba indica que los valores observados son estadísticamente diferentes a los valores esperados.

\begin{cases}H_0: f(x)=f_o(x)\\[2ex]H_1: f(x)\neq f_o(x)\end{cases}

En estadística, la prueba de bondad de ajuste también se conoce como prueba chi-cuadrado, ya que la distribución de referencia de la prueba es la distribución chi-cuadrado.

Fórmula de la prueba de bondad de ajuste

El estadístico de la prueba de bondad de ajuste es igual al sumatorio de los cuadrados de la diferencias entre los valores observados y los valores esperados partido por los valores esperados.

Así pues, la fórmula de la prueba de bondad de ajuste es la siguiente:

\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}

Donde:

  • \chi^2 es el estadístico de la prueba de bondad de ajuste, el cual sigue una distribución chi-cuadrado con k-1 grados de libertad.
  • k es el tamaño de la muestra de datos.
  • O_i es el valor observado para el dato i.
  • E_i es el valor esperado para el dato i.

Así pues, dado un nivel de significación \alpha, el estadístico de la prueba calculado se debe comparar con el valor crítico de la prueba para determinar si rechazar la hipótesis nula o la hipótesis alternativa del contraste de hipótesis:

  • Si el estadístico de la prueba es menor que el valor crítico \chi_{1-\alpha|k-1}^2, se rechaza la hipótesis alternativa (y se acepta la hipótesis nula).
  • Si el estadístico de la prueba es mayor que el valor crítico \chi_{1-\alpha|k-1}^2, se rechaza la hipótesis nula (y se acepta la hipótesis alternativa).

\begin{array}{l}\text{Si } \chi^2<\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_1\\[3ex]\text{Si } \chi^2>\chi^2_{1-\alpha|k-1}\text{ se rechaza } H_0\end{array}

Cómo hacer una prueba de bondad de ajuste

Para hacer una prueba de bondad de ajuste se deben seguir los siguientes pasos:

  1. Primero establecemos la hipótesis nula y la hipótesis alternativa de la prueba de bondad de ajuste.
  2. En segundo lugar, escogemos el nivel de confianza, y por tanto el nivel de significación, de la prueba de bondad de ajuste.
  3. Luego calculamos el estadístico de la prueba de bondad de ajuste, cuya fórmula está en el apartado de arriba.
  4. Hallamos el valor crítico de la prueba de bondad de ajuste mediante la tabla de la distribución chi-cuadrado.
  5. Comparamos el estadístico de la prueba con el valor crítico:
    • Si el estadístico de la prueba es menor que el valor crítico, se rechaza la hipótesis alternativa (y se acepta la hipótesis nula).
    • Si el estadístico de la prueba es mayor que el valor crítico, se rechaza la hipótesis nula (y se acepta la hipótesis alternativa).

Ejemplo de una prueba de bondad de ajuste

  • La propietaria de una tienda afirma que el 50% de sus ventas son del producto A, 35% de sus ventas son del producto B y 15% de sus ventas son del producto C. No obstante, las unidades vendidas de cada producto son las que se muestran en la siguiente tabla. Analiza si los datos teóricos de la propietaria son estadísticamente diferentes a los datos reales recopilados.
ProductoVentas observadas (Oi)
Producto A453
Producto B268
Producto C79
Total800

Para determinar si los valores observados son equivalentes a los valores esperados, llevaremos a cabo una prueba de bondad de ajuste. La hipótesis nula y la hipótesis alternativa de la prueba son:

\begin{cases}H_0: f(x)=f_o(x)\\[2ex]H_1: f(x)\neq f_o(x)\end{cases}

En este caso, utilizaremos un nivel de confianza del 95% para la prueba, por lo que el nivel de significación será del 5%.

\alpha=0,05

Para saber los valores de las ventas esperadas tenemos que multiplicar el porcentaje de ventas esperado de cada producto por el número de ventas totales producidas:

\begin{array}{c}E_A=800\cdot 0,50=400\\[2ex]E_B=800\cdot 0,35=280\\[2ex]E_A=800\cdot 0,15=120\end{array}

Por lo tanto, la tabla de frecuencias del problema queda de la siguiente manera:

ProductoVentas observadas (Oi)Ventas esperadas (Ei)
Producto A453400
Producto B268280
Producto C79120
Total800800

Ahora que ya hemos calculado todos los valores, aplicamos la fórmula de la prueba chi-cuadrado para calcular el estadístico de la prueba:

\begin{array}{c}\displaystyle\chi^2=\sum_{i=1}^k\frac{(O_i-E_i)^2}{E_i}\\[6ex]\chi^2=\cfrac{(453-400)^2}{400}+\cfrac{(268-280)^2}{280}+\cfrac{(79-120)^2}{120}\\[6ex]\chi^2=7,02+0,51+14,00\\[6ex]\chi^2=21,53\end{array}

Una vez calculado el valor del estadístico de la prueba, utilizamos la tabla de la distribución chi-cuadrado para hallar el valor crítico de la prueba. La distribución chi-cuadrado tiene k-1=3-1=2 grados de libertad y el nivel de significación es \alpha=0,05, por tanto:

\begin{array}{c}\chi^2_{1-\alpha|k-1}=\ \color{orange}\bm{?}\color{black}\\[4ex]\chi^2_{0,95|2}=5,991\end{array}

Así que el estadístico de la prueba (21,53) es mayor que el valor crítico de la prueba (5,991), por lo tanto, se rechaza la hipótesis nula y se acepta la hipótesis alternativa. Esto significa que los datos son significativamente diferentes y, por tanto, la propietaria de la tienda esperaba unas ventas distintas a las que realmente se han producido.

21,53>5,991 \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Se rechaza } H_0

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio