En este post te explicamos cómo calcular la probabilidad empírica. Encontrarás qué es la probabilidad empírica, cuál es su fórmula, un ejemplo y cuáles son las diferencias entre la probabilidad empírica y la probabilidad teórica.
Índice
¿Qué es la probabilidad empírica?
La probabilidad empírica es una medida estadística que se basa en un experimento o en hechos empíricos e indica cuánto de probable es que ocurra un evento.
Es decir, la probabilidad empírica se calcula a partir de los resultados de un experimento y nos dice la probabilidad de ocurrencia de un evento.
Cuantas más veces se haga el experimento, más precisa será la probabilidad empírica obtenida. Por eso este tipo de probabilidad se suele determinar utilizando programas informáticos que simulan miles de iteraciones y son capaces de analizarlas en muy poco tiempo.
La probabilidad empírica es un número entre 0 y 1. Cuanto más probable de que suceda sea un evento, mayor será la probabilidad empírica, y al contrario, cuanto menos probable sea la ocurrencia de un evento, menor será su probabilidad empírica.
Fórmula de la probabilidad empírica
La fórmula de la probabilidad empírica es el número de veces que ocurrió un evento durante un experimento dividido entre el número total de veces que se ha realizado el experimento.
Por ejemplo, si miramos un árbol diez veces distintas y en siete ocasiones hemos visto un pájaro en el árbol, la probabilidad empírica de ver un pájaro al mirar el árbol será:
Ejemplo de la probabilidad empírica
Vista la definición de probabilidad empírica, vamos a resolver un ejercicio paso a paso de este tipo de probabilidad. Así podrás ver cómo se calcula la probabilidad empírica.
- Calcula la probabilidad empírica de los eventos elementales que componen el experimento aleatorio de lanzar un dado.
En primer lugar, calcularemos la probabilidad teórica para ir comparando los resultados experimentales obtenidos con los resultados teóricos. Existen seis posibles resultados del lanzamiento de un dado (1, 2, 3, 4, 5 y 6), por lo tanto, la probabilidad teórica de cada suceso elemental es:
Para resolver este ejercicio tenemos que simular el lanzamiento de un dado muchas veces y anotar los resultados en una tabla de contingencias. Para ello podemos utilizar, por ejemplo, el programa Excel.
Para que puedas ver la importancia del número de experimentos realizados, simularemos primero diez lanzamientos, luego cien, y finalmente mil. Así pues, los resultados obtenidos de la simulación de los primeros 10 lanzamientos aleatorios de un dado son los siguientes:

Como puedes comprobar, las probabilidades empíricas obtenidas al simular solamente diez lanzamientos no se parecen a las probabilidades teóricas (0,167).
Pero a medida que aumentamos el número de experimentos estas dos medidas se parecen más, fíjate en la simulación de 100 lanzamientos:

Ahora la probabilidad empírica calculada para cada número del dado es más similar a la probabilidad teórica, sin embargo, aún conseguimos algunos valores muy distintos.
Por último, hacemos el mismo procedimiento pero simulando 1000 lanzamientos:

Como se aprecia en la última tabla de contingencia, ahora los valores de las probabilidades empíricas se acercan mucho a las probabilidades teóricas.
En resumen, a medida que aumentamos el número de experimentos realizados, más próximo será el valor de la probabilidad empírica de un suceso a su probabilidad de ocurrencia teórica. Esta regla se define como la ley de los números grandes, la cual establece que cuantos más datos haya, más próximos serán los valores experimentales a los valores teóricos.
Además, si comparas las tres tablas de frecuencias, puedes ver que la probabilidad empírica no es definitiva, sino que va cambiando en función del número de experimentos realizados. Lo que significa que debemos saber interpretar los valores obtenidos.
Probabilidad empírica y probabilidad teórica
Por último, analizaremos el concepto de probabilidad empírica y el de probabilidad teórica, pues si bien son dos tipos de probabilidades, tienen un significado totalmente distinto.
La diferencia entre la probabilidad empírica y la probabilidad teórica (o probabilidad clásica) es que la probabilidad empírica se calcula a partir de los datos recopilados de un experimento real, en cambio, la probabilidad teórica se calcula considerando circunstancias ideales sin hacer ningún experimento.
Es decir, para hallar la probabilidad empírica se debe simular un experimento y hacer el cálculo a partir de los resultados conseguidos. Pero para averiguar la probabilidad teórica no se debe realizar ningún experimento, sino que se hace un cálculo teórico.
Además, se define el nivel de sesgo como la diferencia entre la probabilidad empírica y la probabilidad teórica. El sesgo puede ser positivo o negativo, pero es muy difícil que el sesgo sea cero, ya que significaría que de un experimento aleatorio se consigue justo la probabilidad teórica y esto es muy poco probable de que suceda.