En este post se explican cuáles son los diferentes tipos de distribuciones de probabilidad en estadística. Así pues, encontrarás cuántos tipos de distribuciones de probabilidad hay y cuáles son las diferencias entre ellas.
Índice
¿Cuáles son los tipos de distribuciones de probabilidad?
Los tipos de distribuciones de probabilidad son:
- Distribuciones de probabilidad discretas:
- Distribución uniforme discreta.
- Distribución de Bernoulli.
- Distribución binomial.
- Distribución de Poisson.
- Distribución multinomial.
- Distribución geométrica.
- Distribución binomial negativa.
- Distribución hipergeométrica.
- Distribuciones de probabilidad continuas:
- Distribución uniforme continua.
- Distribución normal.
- Distribución lognormal.
- Distribución chi-cuadrado.
- Distribución t de Student.
- Distribución F de Snedecor.
- Distribución exponencial.
- Distribución beta.
- Distribución gamma.
- Distribución de Weibull.
- Distribución de Pareto.
A continuación se explica cada tipo de distribución de probabilidad detalladamente.
Distribuciones de probabilidad discretas
Una distribución de probabilidad discreta es aquella distribución que define las probabilidades de una variable aleatoria discreta. Por lo tanto, una distribución de probabilidad discreta solo puede tomar un número finito de valores (generalmente valores enteros).
Distribución uniforme discreta
La distribución uniforme discreta es una distribución de probabilidad discreta en la cual todos los valores son equiprobables, es decir, en una distribución uniforme discreta todos los valores tienen la misma probabilidad de ocurrir.
Por ejemplo, el lanzamiento de un dado se puede definir con una distribución uniforme discreta, ya que todos los posibles resultados (1, 2, 3, 4, 5 o 6) tienen la misma probabilidad de ocurrencia.
En general, una distribución uniforme discreta tiene dos parámetros característicos, a y b, que definen el intervalo de los posibles valores que puede tomar la distribución. Así pues, cuando una variable está definida por una distribución uniforme discreta, se escribe Uniforme(a,b).
La distribución uniforme discreta se puede usar para describir experimentos aleatorios, ya que si todos los resultados tienen la misma probabilidad significa que existe aleatoriedad en el experimento.
Distribución de Bernoulli
La distribución de Bernoulli, también conocida como distribución dicotómica, es una distribución de probabilidad que representa una variable discreta la cual solo puede tener dos resultados: «éxito» o «fracaso».
En la distribución de Bernoulli, «éxito» es el resultado que esperamos que ocurra y tiene el valor de 1, mientras que el resultado de «fracaso» es un resultado distinto al esperado y su valor es 0. Así pues, si la probabilidad del resultado de «éxito» es p, la probabilidad del resultado de «fracaso» es q=1-p.
La distribución de Bernoulli recibe este nombre en honor al estadístico suizo Jacob Bernoulli.
En estadística, la distribución de Bernoulli tiene principalmente una aplicación, que es definir las probabilidades de los experimentos en los que solo hay dos posibles resultados: éxito y fracaso. Así pues, un experimento que usa la distribución de Bernoulli se llama ensayo de Bernoulli o experimento de Bernoulli.
Distribución binomial
La distribución binomial, también llamada distribución binómica, es una distribución de probabilidad que cuenta el número de éxitos al realizar una serie de experimentos dicotómicos e independientes con una probabilidad de éxito constante. Es decir, la distribución binomial es una distribución que describe el número de resultados con éxito de una secuencia de ensayos de Bernoulli.
Por ejemplo, el número de veces que sale «cara» al lanzar una moneda 25 veces es una distribución binomial.
En general, el número total de experimentos realizados se define con el parámetro n, mientras que p es la probabilidad de éxito de cada experimento. De modo que una variable aleatoria que sigue una distribución binomial se escribe de la siguiente manera:
Ten en cuenta que en una distribución binomial se repite exactamente el mismo experimento n veces y los experimentos son independientes entre sí, de modo que la probabilidad de éxito de cada experimento es la misma (p).
Distribución de Poisson
La distribución de Poisson es una distribución de probabilidad que define la probabilidad de que ocurra un determinado número de eventos durante un período de tiempo. Es decir, la distribución de Poisson sirve para modelizar variables aleatorias que describen el número de veces que se repite un fenómeno en un intervalo de tiempo.
Por ejemplo, el número de llamadas que recibe una central telefónica por minuto es una variable aleatoria discreta que se puede definir utilizando la distribución de Poisson.
La distribución de Poisson tiene un parámetro característico, que se representa con la letra griega λ e indica el número de veces que se espera que ocurra el evento estudiado durante un intervalo dado.
Distribución multinomial
La distribución multinomial (o distribución multinómica) es una distribución de probabilidad que describe la probabilidad de que varios eventos excluyentes ocurran un número determinado de veces tras realizar varios ensayos.
Es decir, si un experimento aleatorio puede dar como resultado tres o más eventos excluyentes y se conocen la probabilidad de que ocurra cada evento por separado, la distribución multinomial sirve para calcular la probabilidad de que al realizar varios experimentos suceda un número determinado de veces cada evento.
Por lo tanto, la distribución multinomial es una generalización de la distribución binomial.
Distribución geométrica
La distribución geométrica es una distribución de probabilidad que define el número de ensayos de Bernoulli necesarios hasta obtener el primer resultado con éxito. Es decir, una distribución geométrica modela aquellos procesos en los que se repiten experimentos de Bernoulli hasta que se consigue uno con un resultado de éxito.
Por ejemplo, el número de coches que pasan por una carretera hasta ver un coche amarillo es una distribución geométrica.
Recuerda que un ensayo de Bernoulli es un experimento que tiene dos posibles resultados: «éxito» y «fracaso». De modo que si la probabilidad de «éxito» es p, la probabilidad de «fracaso» es q=1-p.
Por lo tanto, la distribución geométrica depende del parámetro p, que es la probabilidad de éxito que tienen todos los experimentos realizados. Además, la probabilidad p es igual para todos los experimentos.
Distribución binomial negativa
La distribución binomial negativa es una distribución de probabilidad que describe el número de ensayos de Bernoulli necesarios para obtener un número determinado de resultados con éxito.
Por lo tanto, una distribución binomial negativa tiene dos parámetros característicos: r es el número de resultados con éxito deseado y p es la probabilidad de éxito de cada experimento de Bernoulli realizado.
Así pues, una distribución binomial negativa define un proceso en el que se hacen tantos ensayos de Bernoulli necesarios para conseguir r resultados de éxito. Además, todos estos ensayos de Bernoulli son independientes y tienen una probabilidad de éxito p constante.
Por ejemplo, una variable aleatoria que sigue una distribución binomial negativa es el número de veces que se debe lanzar un dado hasta conseguir tres veces el número 6.
Distribución hipergeométrica
La distribución hipergeométrica es una distribución de probabilidad que describe el número de casos de éxito en una extracción aleatoria y sin remplazo de n elementos de una población.
Es decir, la distribución hipergeométrica sirve para calcular la probabilidad de obtener x éxitos al extraer n elementos de una población sin reemplazar ninguno.
Por lo tanto, la distribución hipergeométrica tiene tres parámetros:
- N: es el número de elementos de la población (N = 0, 1, 2,…).
- K: es el número máximo de casos de éxito (K = 0, 1, 2,…,N). Como en una distribución hipergeométrica un elemento solo puede considerarse «éxito» o «fracaso», N-K es el número máximo de casos de fracaso.
- n: es el número de extracciones sin reemplazo que se hacen.
Distribuciones de probabilidad continuas
Una distribución de probabilidad continua es una distribución que puede tomar cualquier valor dentro de un intervalo, incluyendo valores decimales. Por lo tanto, una distribución de probabilidad continua define las probabilidades de una variable aleatoria continua.
Distribución uniforme continua
La distribución uniforme continua, también llamada distribución rectangular, es un tipo de distribución de probabilidad continua en la cual todos los valores tienen la misma probabilidad de ocurrencia. Es decir, la distribución uniforme continua es una distribución en la que la probabilidad se distribuye uniformemente a lo largo de un intervalo.
La distribución uniforme continua se utiliza para describir variables continuas que tienen una probabilidad constante. Asimismo, la distribución uniforme continua se usa para definir procesos aleatorios, ya que si todos los resultados tienen la misma probabilidad significa que existe aleatoriedad en el resultado.
La distribución uniforme continua tiene dos parámetros característicos, a y b, que definen el intervalo de equiprobabilidad. Así pues, el símbolo de la distribución uniforme continua es U(a,b), donde a y b son los valores característicos de la distribución.
Por ejemplo, si el resultado de un experimento aleatorio puede tomar cualquier valor entre 5 y 9 y todos los posibles resultados tienen la misma probabilidad de ocurrir, el experimento se puede simular con una distribución uniforme continua U(5,9).
Distribución normal
La distribución normal es una distribución de probabilidad continua cuya gráfica tiene forma de campana y es simétrica respecto a su media. En estadística, la distribución normal sirve para modelizar fenómenos de características muy diferentes, por eso es tan importante esta distribución.
De hecho, en estadística la distribución normal se considera, por mucho, la distribución más importante de todas las distribuciones de probabilidad, ya que no solo permite modelizar un gran número de fenómenos reales, sino que además la distribución normal se puede usar para aproximar otros tipos de distribuciones bajo ciertas condiciones.
El símbolo de la distribución normal es la letra mayúscula N. Así pues, para indicar que una variable sigue una distribución normal se indica con la letra N y se añade entre paréntesis los valores de su media aritmética y su desviación estándar.
La distribución normal recibe muchos nombres diferentes, entre ellos destacan distribución de Gauss, distribución gaussiana y distribución de Laplace-Gauss.
Distribución lognormal
La distribución lognormal, o distribución normal logarítmica, es una distribución de probabilidad que define una variable aleatoria cuyo logaritmo sigue una distribución normal.
Por lo tanto, si la variable X tiene una distribución normal, entonces la función exponencial ex tiene una distribución lognormal.
Ten en cuenta que la distribución lognormal solo puede usarse cuando los valores de la variable son positivos, ya que el logaritmo es una función que solamente admite un argumento positivo.
Entre la diferentes aplicaciones de la distribución lognormal, en estadística destaca el uso de esta distribución para analizar inversiones financieras y para hacer análisis de fiabilidad.
La distribución lognormal también se conoce como distribución de Tinaut, asimismo, a veces se escribe distribución log normal o distribución log-normal.
Distribución chi-cuadrado
La distribución chi-cuadrado es una distribución de probabilidad cuyo símbolo es χ². En concreto, la distribución chi-cuadrado es la suma del cuadrado de k variables aleatorias independientes con distribución normal.
Así pues, la distribución chi-cuadrado tiene k grados de libertad. Por lo tanto, una distribución chi-cuadrada tiene tantos grados de libertad como la suma de los cuadrados de variables con distribución normal que representa.
La distribución chi-cuadrado también se conoce como distribución de Pearson.
La distribución chi-cuadrado se utiliza mucho en inferencia estadística, por ejemplo, se usa en el contraste de hipótesis y en los intervalos de confianza. Más abajo veremos cuáles son las aplicaciones de este tipo de distribución de probabilidad.
Distribución t de Student
La distribución t de Student es una distribución de probabilidad muy utilizada en estadística. En concreto, la distribución t de Student se usa en la prueba t de Student para determinar la diferencia entre dos medias muestrales y para hacer intervalos de confianza.
La distribución t de Student fue desarrollada por el estadístico William Sealy Gosset en el año 1908 bajo el pseudónimo «Student».
La distribución t de Student queda definida con su número de grados de libertad, que se obtiene restando una unidad al número total de observaciones. Por lo tanto, la fórmula para determinar los grados de libertad de una distribución t de Student es ν=n-1.
Distribución F de Snedecor
La distribución F de Snedecor, también llamada distribución F de Fisher-Snedecor o simplemente distribución F, es una distribución de probabilidad continua que se usa en la inferencia estadística, especialmente en el análisis de la varianza.
Una de las propiedades de la distribución F de Snedecor es que queda definida por el valor de dos parámetros reales, m y n, que indican sus grados de libertad. Así pues, el símbolo de la distribución F de Snedecor es Fm,n, donde m y n son los parámetros que definen la distribución.
Matemáticamente, la distribución F de Snedecor es igual al cociente entre una distribución chi-cuadrado y sus grados de libertad partido por el cociente entre otra distribución chi-cuadrado y sus grados de libertad. De modo que la fórmula que define la distribución F de Snedecor es la siguiente:
La distribución F de Fisher-Snedecor recibe este nombre en honor al estadístico inglés Ronald Fisher y al estadístico estadounidense George Snedecor.
En estadística, la distribución F de Fisher-Snedecor tiene diferentes aplicaciones. Por ejemplo, la distribución F de Fisher-Snedecor se usa para comparar diferentes modelos de regresión lineal, asimismo, esta distribución de probabilidad se utiliza en el análisis de la varianza (ANOVA).
Distribución exponencial
La distribución exponencial es una distribución de probabilidad continua que sirve para modelizar el tiempo de espera para la ocurrencia de un fenómeno aleatorio.
En concreto, la distribución exponencial permite describir el tiempo de espera entre dos fenómenos que siguen una distribución de Poisson. Por lo tanto, la distribución exponencial está estrechamente relacionada con la distribución de Poisson.
La distribución exponencial tiene un parámetro característico, que se representa con la letra griega λ e indica el número de veces que se espera que ocurra el evento estudiado durante un periodo de tiempo determinado.
Asimismo, la distribución exponencial también se usa para modelizar el tiempo que transcurre hasta que se produce un fallo. De modo que la distribución exponencial tiene varias aplicaciones en fiabilidad y en la teoría de la supervivencia.
Distribución beta
La distribución beta es una distribución de probabilidad definida en el intervalo (0,1) y parametrizada por dos parámetros positivos: α y β. Es decir, los valores de la distribución beta dependen de los parámetros α y β.
Por lo tanto, la distribución beta sirve para definir variables aleatorias continuas cuyo valor oscila entre 0 y 1.
Existen varias notaciones para denotar que una variable aleatoria continua está regida por una distribución beta, las más comunes son:
En estadística, la distribución beta tiene aplicaciones muy variadas. Por ejemplo, la distribución beta se usa para estudiar las variaciones de porcentajes en diferentes muestras. Asimismo, en la gestión de proyectos se utiliza la distribución beta para llevar a cabo un análisis Pert.
Distribución gamma
La distribución gamma es una distribución de probabilidad continua definida por dos parámetros característicos, α y λ. Es decir, la distribución gamma depende del valor de sus dos parámetros: α es el parámetro de forma y λ es el parámetro de escala.
El símbolo de la distribución gamma es la letra griega mayúscula Γ. Por lo tanto, si una variable aleatoria sigue una distribución gamma se escribe de la siguiente manera:
La distribución gamma también se puede parametrizar usando el parámetro de forma k=α y el parámetro inverso de escala θ=1/λ. En cualquier caso, los dos parámetros que definen la distribución gamma son números reales positivos.
En general, la distribución gamma se utiliza para modelar conjuntos de datos que son asimétricos a la derecha, de manera que existe una mayor concentración de datos en la parte izquierda de la gráfica. Por ejemplo, la distribución gamma se usa para modelar la fiabilidad de componentes eléctricos.
Distribución de Weibull
La distribución de Weibull es una distribución de probabilidad continua que queda definida por dos parámetros característicos: el parámetro de forma α y el parámetro de escala λ.
En estadística, la distribución de Weibull se usa principalmente para el análisis de supervivencia. Asimismo, la distribución de Weibull tiene muchas aplicaciones en diferentes ámbitos.
Dependiendo del autor, la distribución de Weibull también se puede parametrizar con tres parámetros. Entonces, se añade un tercer parámetro llamado valor umbral, el cual indica la abscisa en la que empieza la gráfica de la distribución.
La distribución de Weibull recibe el nombre del sueco Waloddi Weibull, quien la describió en detalle en 1951. No obstante, la distribución de Weibull fue descubierta por Maurice Fréchet en 1927 y aplicada por primera vez por Rosin y Rammler en 1933.
Distribución de Pareto
La distribución de Pareto es una distribución de probabilidad continua que se usa en estadística para modelizar el principio de Pareto. Por lo tanto, la distribución de Pareto es una distribución de probabilidad que tiene unos pocos valores cuya probabilidad de ocurrencia es mucho mayor que el resto de valores.
Recuerda que la ley de Pareto, también llamada regla del 80-20, es un principio estadístico que dice que la mayor parte de la causa de un fenómeno es debida a una pequeña parte de la población.
La distribución de Pareto tiene dos parámetros característicos: el parámetro de escala xm y el parámetro de forma α.
Originalmente, la distribución de Pareto se usaba para describir la distribución de la riqueza de la población, ya que la mayor parte era debida a una pequeña proporción de la población. Pero actualmente la distribución de Pareto tiene muchas aplicaciones, por ejemplo, en los controles de calidad, en economía, en ciencia, en el ámbito social, etc.