Distribución hipergeométrica

En este post te explicamos qué es la distribución hipergeométrica y cómo se calcula una probabilidad con este tipo de distribución. Encontrarás la fórmula de la distribución hipergeométrica, cuáles son sus características, y una calculadora para calcular la probabilidad de la distribución hipergeométrica online.

¿Qué es la distribución hipergeométrica?

La distribución hipergeométrica es una distribución de probabilidad que describe el número de casos de éxito en una extracción aleatoria y sin remplazo de n elementos de una población.

Es decir, la distribución hipergeométrica sirve para calcular la probabilidad de obtener x éxitos al extraer n elementos de una población sin reemplazar ninguno.

La distribución hipergeométrica tiene tres parámetros:

  • N: es el número de elementos de la población (N = 0, 1, 2,…).
  • K: es el número máximo de casos de éxito (K = 0, 1, 2,…,N). Como en una distribución hipergeométrica un elemento solo puede considerarse «éxito» o «fracaso», N-K es el número máximo de casos de fracaso.
  • n: es el número de extracciones sin reemplazo que se hacen.

X \sim HG(N,K,n)

Por ejemplo, una variable aleatoria discreta X que tiene una distribución hipergeométrica con parámetros N=8, K=5 y n=3 se define de la siguiente manera:

X \sim HG(8,5,3)

Fórmula de la distribución hipergeométrica

La fórmula de la distribución hipergeométrica es el producto del número combinatorio de K sobre x por el número combinatorio de N-K sobre n-x dividido por el número combinatorio de N sobre n.

distribucion hipergeometrica

Donde N es el tamaño de la población, K el número total de casos favorables, n es el número de extracciones sin remplazo, y x es el número de casos favorables del cual se quiere calcular la probabilidad de ocurrencia.

👉 Puedes usar la calculadora que hay más abajo para calcular la probabilidad de un evento de una variable que sigue la distribución hipergeométrica.

Ejemplo de la distribución hipergeométrica

Una vez hemos visto la definición y la fórmula de la distribución hipergeométrica, a continuación resolveremos un ejemplo paso a paso para que sepas cómo calcular la probabilidad de una distribución hipergeométrica.

  • En una bolsa metemos 20 bolas de color azul y 30 bolas de color rojo, es decir, en total hay 50 bolas dentro de la bolsa. Si extraemos 12 bolas sin reponer ninguna, calcula cuál es la probabilidad de sacar 4 bolas de color azul.

Lo primero que debemos hacer para resolver el ejercicio es identificar los parámetros de la distribución hipergeométrica. En este caso, el número total de elementos de la población es 50 (N=50), el número máximo de casos favorables es 20 (K=20), y sacamos 12 bolas (n=12).

\left.\begin{array}{c}N=50\\[2ex]K=20\\[2ex]n=12\end{array}\right\} \longrightarrow \ X\sim HG(50,20,12)

Queremos calcular la probabilidad de sacar 4 bolas azules (x=4), por lo tanto, aplicamos la fórmula de la distribución hipergeométrica, sustituimos las variables por sus correspondientes valores y hacemos el cálculo:

P\bigl[X=x\bigr]=\cfrac{\begin{pmatrix}K\\x\end{pmatrix}\begin{pmatrix}N-K\\n-x\end{pmatrix}}{\begin{pmatrix}N\\n\end{pmatrix}}

\begin{aligned}P\bigl[X=4\bigr]&=\cfrac{\begin{pmatrix}20\\4\end{pmatrix}\begin{pmatrix}50-20\\12-4\end{pmatrix}}{\begin{pmatrix}50\\12\end{pmatrix}} \\[1.5ex]&=\cfrac{\begin{pmatrix}20\\4\end{pmatrix}\begin{pmatrix}30\\8\end{pmatrix}}{\begin{pmatrix}50\\12\end{pmatrix}} \\[1.5ex]&=0,2336 \end{aligned}

Calculadora de la distribución hipergeométrica

Introduce los parámetros de la distribución hipergeométrica en la siguiente calculadora online para calcular la probabilidad de ocurrencia del evento deseado.

Recuerda que N es el tamaño de la población, K es el número total de casos favorables, n es el tamaño de la muestra, y x es el valor del cuál se quiere hallar la probabilidad de que suceda.

  • N =
  • K =
  • n =
  • x =

Características de la distribución hipergeométrica

La distribución hipergeométrica tiene las siguientes propiedades:

  • La el valor esperado de una distribución hipergeométrica es igual al número de elementos de la muestra por el número total de casos favorables partido por el número de elementos de la población.

E[X]=\cfrac{n\cdot K}{N}

  • La moda de una distribución hipergeométrica es el valor redondeado hacia abajo del producto de n+1 por K+1 dividido entre N+2.

\displaystyle M=\Bigg\lfloor \frac{(n+1)(K+1)}{N+2}\Bigg\rfloor

  • La varianza de una distribución hipergeométrica se puede sacar utilizando la siguiente expresión:

\displaystyle Var[X]=\cfrac{nK}{N}\left(\frac{N-K}{N}\right)\left(\frac{N-n}{N-1}\right)

  • La función generadora de momentos de una distribución hipergeométrica es la siguiente:

\cfrac{{N-K \choose n} \scriptstyle{\,_2F_1(-n, -K; N - K-n+1; e^{t}) } }{{N \choose n}}

  • La función característica de la distribución hipergeométrica es la siguiente:

\cfrac{{N-K \choose n} \scriptstyle{\,_2F_1(-n, -K; N - K - n + 1; e^{it}) }}{{N \choose n}}

  • Se puede calcular la probabilidad de ocurrencia de un número determinado de eventos a partir de la probabilidad del número anterior usando la fórmula recursiva de la distribución hipergeométrica:

P[X=x+1]=\cfrac{(K-x)(n-x)}{(x+1)(N-K-n+x-1)}\cdot P[X=x]

Distribución hipergeométrica y distribución binomial

La diferencia entre la distribución hipergeométrica y la distribución binomial es el reemplazo. La distribución hipergeométrica se usa cuando no se remplazan las extracciones, en cambio, en la distribución binomial sí que se remplazan las extracciones.

Por ejemplo, si sacamos al azar cinco cartas de una baraja y queremos calcular cuál es la probabilidad de obtener una determinada carta, si cada carta que sacamos no la reemplazamos debemos utilizar la distribución hipergeométrica para hacer el cálculo. Pero si al sacar una carta la volvemos a poner antes de realizar la siguiente extracción, entonces tenemos que usar la distribución binomial para hacer el cálculo de la probabilidad.

Cuando el número N es grande, la proporción n/N es pequeña y el número de casos favorables deseados es muy bajo, podemos usar la distribución hipergeométrica como una aproximación de la distribución binomial. Sin embargo, no te lo aconsejo porque el resultado no será tan fiable y, además, es más fácil calcular probabilidades con la distribución binomial que con la distribución hipergeométrica.

Deja un comentario

Tu dirección de correo electrónico no será publicada.

Ir arriba