Valor p

En este post se explica qué es el valor p y cómo se interpreta. Así pues, encontrarás qué significa el valor p en estadística, cómo calcular el valor p y un ejercicio resuelto paso a paso.

¿Qué es el valor p?

En estadística, el valor p (o p-valor) es la probabilidad de haber obtenido un estadístico de prueba suponiendo que la hipótesis nula es cierta. Es decir, el valor p es un valor entre 0 y 1 que se usa en el contraste de hipótesis para rechazar o aceptar la hipótesis nula.

Concretamente, la hipótesis nula se rechaza si el valor p es menor que el nivel de significación. Por otro lado, si el valor p es mayor que el nivel de significación, se acepta la hipótesis nula y se rechaza la hipótesis alternativa. Más abajo entraremos en detalle en la interpretación del valor p.

En definitiva, el valor p sirve para aceptar o rechazar la hipótesis de una investigación, pues ayuda a diferenciar un resultado que es debido a la casualidad de un resultado que es estadísticamente significativo.

En ocasiones, el valor p también se llama p-value, ya que es un término que proviene del inglés y muchos estudios estadísticos están publicados en inglés.

Interpretación del valor p

Ahora que ya hemos visto la definición del valor p, vamos a ver cómo interpretar correctamente el valor p en una prueba estadística.

Básicamente, el valor p se interpreta de la siguiente manera:

  • Si el valor p es menor que el nivel de significación, se rechaza la hipótesis nula (se acepta la hipótesis alternativa).
  • Si el valor p es mayor que el nivel de significación, se rechaza la hipótesis alternativa (se acepta la hipótesis nula).

Por lo tanto, la interpretación del valor p depende del nivel de significación elegido. En general, se establece el nivel de significación en 0,05 o 0,01, pero es un valor arbitrario que decide el investigador.

Ten en cuenta que el valor del p-valor no implica que una hipótesis sea obligatoriamente cierta, sino que simplemente se rechaza una hipótesis o no se rechaza una hipótesis porque gracias al p-valor hay evidencia estadística para hacerlo. No obstante, se puede cometer un error y rechazar la hipótesis nula cuando es cierta, o al revés, no rechazar la hipótesis nula cuando es falsa. Aunque la probabilidad de cometer un error es muy baja, cabe la posibilidad de haberse equivocado.

En definitiva, decimos que el valor p es significativo cuando es inferior al nivel de significación (normalmente α=0,05), porque si el valor p es menor que el nivel de significación quiere decir que existe evidencia significativa para rechazar la hipótesis nula.

Ejemplo del valor p

Para que puedas entender mejor el significado del valor p en estadística, a continuación puedes ver un ejemplo en el que se resuelve una prueba de hipótesis calculando el valor p.

  • Para fabricar un juguete una empresa compra una de las piezas del juguete a una empresa externa y luego la ensambla con el resto de piezas. En teoría, la pieza que compra debe tener una longitud de 5 cm, sin embargo, últimamente se están produciendo muchos defectos en el ensamblaje y la empresa sospecha que la longitud media de las piezas compradas es diferente. Para asegurarse, pide a la empresa externa una muestra de 10000 unidades, mide una pieza aleatoria y mide 5,25 cm. Así pues, para aceptar o rechazar su hipótesis inicial decide llevar a cabo un contraste de hipótesis.

En este caso, la hipótesis nula y la hipótesis alternativa del contraste de hipótesis son las siguientes:

\begin{cases}H_0: \mu=5,00 \text{ cm} \\[2ex]H_1: \mu\neq 5,00 \text{ cm}\end{cases}

Para resolver este problema tomaremos un nivel de significación del 5%.

\alpha=0,05

El valor que hemos cogido aleatoriamente (5,25 cm) está desviado 0,25 cm respecto a la media teórica (5,00 cm). Así pues, para calcular el p valor de este contraste de hipótesis, tenemos que determinar cuántos valores se han desviado 0,25 cm o más. Tras analizar la muestra de 10000 unidades, hemos visto que 183 unidades están por debajo de 4,75 cm y, por otro lado, 209 unidades están por encima de 5,25 cm.

Piezas que miden 4,75 cm o menos: 183
Piezas que miden 5,25 cm o más: 209

Así pues, para calcular el valor p de este contraste de hipótesis tenemos que dividir las piezas encontradas con un desviación de 0,25 cm o más entre el tamaño de la muestra.

p=\cfrac{183+209}{10000}=0,0392

Entonces, el p-valor calculado es menor que el nivel de significación escogido previamente:

p< \alpha \ \color{orange}\bm{\longrightarrow}\color{black} \ \text{Se rechaza } H_0

En consecuencia, rechazamos la hipótesis nula y, por lo tanto, tenemos evidencia estadística significativa de que las piezas que compramos tienen de media una longitud diferente a la pactada inicialmente.

Como has podido ver en este ejemplo, se puede determinar el valor p de un contraste de hipótesis sin conocer la distribución de referencia, aunque no es habitual. Para ver más ejemplos de cómo se calcula el valor p, puedes consultar los ejemplos de contrastes de hipótesis de nuestra página web.

Conclusiones del valor p

Para terminar, te dejamos las conclusiones más importantes del valor p a modo de resumen.

  • El valor p no representa la probabilidad de que la hipótesis nula sea cierta, sino que simplemente se supone que la hipótesis nula es cierta y bajo esta suposición se calcula el valor p que nos permitirá rechazar o no la hipótesis nula.
  • El valor p sirve para rechazar o no rechazar una hipótesis de un contraste de hipótesis. Si el valor p es menor que el nivel de significación, significa que es poco probable que la hipótesis nula sea cierta y por tanto se rechaza. En cambio, si el valor p es mayor que el nivel de significación, quiere decir que es muy probable que la hipótesis nula sea cierta y por tanto no se rechaza.
  • Aunque el valor p indique si la hipótesis nula es muy probable o poco probable de que sea cierta, el valor p no proporciona la certeza de que la hipótesis nula sea cierta o falsa. Siempre cabe la posibilidad de cometer un error.
  • El valor p está relacionado con la fiabilidad de la investigación, de manera que cuanto menor sea el valor p más fiable es el resultado obtenido del análisis estadístico.
  • El nivel de significación es arbitrario y lo decide el investigador, de modo que la importancia del valor p también la establece el investigador.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ir arriba