Distribución de probabilidad continua

En este artículo se explica qué son las distribuciones de probabilidad continuas y para qué sirven en estadística. De modo que encontrarás qué significa que una distribución de probabilidad sea continua, ejemplos de distribuciones continuas y cuáles son los diferentes tipos de distribuciones continuas.

¿Qué es una distribución de probabilidad continua?

Una distribución de probabilidad continua es una distribución cuya función de distribución es continua. Por lo tanto, una distribución de probabilidad continua define las probabilidades de una variable aleatoria continua.

Por ejemplo, la distribución normal y la distribución t de Student son distribuciones de probabilidad continuas.

Una de las características de las distribuciones de probabilidad continuas es que pueden tomar cualquier valor dentro de un intervalo. De modo que, a diferencia de las distribuciones de probabilidad discretas, las distribuciones de probabilidad continuas pueden tomar valores decimales.

En las distribuciones continuas, para calcular una probabilidad acumulada se debe hallar el área bajo la curva de la distribución, por lo que en este tipo de distribuciones de probabilidad la función de probabilidad acumulada es equivalente a la integral de la función de densidad.

\displaystyle P[X\leq x]=\int_{-\infty}^x f(x)dx

Ejemplos de distribuciones de probabilidad continuas

Una vez hemos visto la definición de distribución de probabilidad continua, vamos a ver varios ejemplos de este tipo de distribuciones para entender mejor el concepto.

Ejemplos de distribuciones de probabilidad continuas:

  1. El peso de los alumnos de un curso.
  2. El tiempo de duración de un componente eléctrico.
  3. La rentabilidad de las acciones de las empresas que cotizan en bolsa.
  4. La velocidad de un coche.
  5. El precio de unas acciones bursátiles.

Tipos de distribuciones de probabilidad continuas

Los principales tipos de distribuciones de probabilidad continuas son los siguientes:

  • Distribución uniforme continua
  • Distribución normal
  • Distribución lognormal
  • Distribución chi-cuadrado
  • Distribución t de Student
  • Distribución F de Snedecor
  • Distribución exponencial
  • Distribución beta
  • Distribución gamma
  • Distribución de Weibull
  • Distribución de Pareto

A continuación se explica cada tipo de distribución de probabilidad continua detalladamente.

Distribución uniforme continua

La distribución uniforme continua, también llamada distribución rectangular, es un tipo de distribución de probabilidad continua en la cual todos los valores tienen la misma probabilidad de ocurrencia. Es decir, la distribución uniforme continua es una distribución en la que la probabilidad se distribuye uniformemente a lo largo de un intervalo.

La distribución uniforme continua se utiliza para describir variables continuas que tienen una probabilidad constante. Asimismo, la distribución uniforme continua se usa para definir procesos aleatorios, ya que si todos los resultados tienen la misma probabilidad significa que existe aleatoriedad en el resultado.

La distribución uniforme continua tiene dos parámetros característicos, a y b, que definen el intervalo de equiprobabilidad. Así pues, el símbolo de la distribución uniforme continua es U(a,b), donde a y b son los valores característicos de la distribución.

X\sim U(a,b)

Por ejemplo, si el resultado de un experimento aleatorio puede tomar cualquier valor entre 5 y 9 y todos los posibles resultados tienen la misma probabilidad de ocurrir, el experimento se puede simular con una distribución uniforme continua U(5,9).

Distribución normal

La distribución normal es una distribución de probabilidad continua cuya gráfica tiene forma de campana y es simétrica respecto a su media. En estadística, la distribución normal sirve para modelizar fenómenos de características muy diferentes, por eso es tan importante esta distribución.

De hecho, en estadística la distribución normal se considera, por mucho, la distribución más importante de todas las distribuciones de probabilidad, ya que no solo permite modelizar un gran número de fenómenos reales, sino que además la distribución normal se puede usar para aproximar otros tipos de distribuciones bajo ciertas condiciones.

El símbolo de la distribución normal es la letra mayúscula N. Así pues, para indicar que una variable sigue una distribución normal se indica con la letra N y se añade entre paréntesis los valores de su media aritmética y su desviación estándar.

X\sim N(\mu,\sigma)

La distribución normal recibe muchos nombres diferentes, entre ellos destacan distribución de Gauss, distribución gaussiana y distribución de Laplace-Gauss.

Distribución lognormal

La distribución lognormal, o distribución normal logarítmica, es una distribución de probabilidad que define una variable aleatoria cuyo logaritmo sigue una distribución normal.

Por lo tanto, si la variable X tiene una distribución normal, entonces la función exponencial ex tiene una distribución lognormal.

X\sim \text{Lognormal}(\mu,\sigma^2)

Ten en cuenta que la distribución lognormal solo puede usarse cuando los valores de la variable son positivos, ya que el logaritmo es una función que solamente admite un argumento positivo.

Entre la diferentes aplicaciones de la distribución lognormal, en estadística destaca el uso de esta distribución para analizar inversiones financieras y para hacer análisis de fiabilidad.

La distribución lognormal también se conoce como distribución de Tinaut, asimismo, a veces se escribe distribución log normal o distribución log-normal.

Distribución chi-cuadrado

La distribución chi-cuadrado es una distribución de probabilidad cuyo símbolo es χ². En concreto, la distribución chi-cuadrado es la suma del cuadrado de k variables aleatorias independientes con distribución normal.

Así pues, la distribución chi-cuadrado tiene k grados de libertad. Por lo tanto, una distribución chi-cuadrada tiene tantos grados de libertad como la suma de los cuadrados de variables con distribución normal que representa.

\displaystyle X\sim\chi^2_k \ \color{orange}\bm{\longrightarrow}\color{black}\ \begin{array}{l}\text{Distribuci\'on chi-cuadrado}\\[2ex]\text{con k grados de libertad}\end{array}

La distribución chi-cuadrado también se conoce como distribución de Pearson.

La distribución chi-cuadrado se utiliza mucho en inferencia estadística, por ejemplo, se usa en el contraste de hipótesis y en los intervalos de confianza. Más abajo veremos cuáles son las aplicaciones de este tipo de distribución de probabilidad.

Distribución t de Student

La distribución t de Student es una distribución de probabilidad muy utilizada en estadística. En concreto, la distribución t de Student se usa en la prueba t de Student para determinar la diferencia entre dos medias muestrales y para hacer intervalos de confianza.

La distribución t de Student fue desarrollada por el estadístico William Sealy Gosset en el año 1908 bajo el pseudónimo «Student».

La distribución t de Student queda definida con su número de grados de libertad, que se obtiene restando una unidad al número total de observaciones. Por lo tanto, la fórmula para determinar los grados de libertad de una distribución t de Student es ν=n-1.

\begin{array}{c}\nu=n-1\\[2ex]X\sim t_\nu\end{array}

Distribución F de Snedecor

La distribución F de Snedecor, también llamada distribución F de Fisher-Snedecor o simplemente distribución F, es una distribución de probabilidad continua que se usa en la inferencia estadística, especialmente en el análisis de la varianza.

Una de las propiedades de la distribución F de Snedecor es que queda definida por el valor de dos parámetros reales, m y n, que indican sus grados de libertad. Así pues, el símbolo de la distribución F de Snedecor es Fm,n, donde m y n son los parámetros que definen la distribución.

F_{m,n}\qquad m,n>0

Matemáticamente, la distribución F de Snedecor es igual al cociente entre una distribución chi-cuadrado y sus grados de libertad partido por el cociente entre otra distribución chi-cuadrado y sus grados de libertad. De modo que la fórmula que define la distribución F de Snedecor es la siguiente:

\left.\begin{array}{c} X\sim \chi_m^2\\[2ex] Y\sim \chi_n^2\end{array}\right\}\color{orange}\bm{\longrightarrow}\color{black}\ F_{m,n}= \cfrac{X/m}{Y/n}

La distribución F de Fisher-Snedecor recibe este nombre en honor al estadístico inglés Ronald Fisher y al estadístico estadounidense George Snedecor.

En estadística, la distribución F de Fisher-Snedecor tiene diferentes aplicaciones. Por ejemplo, la distribución F de Fisher-Snedecor se usa para comparar diferentes modelos de regresión lineal, asimismo, esta distribución de probabilidad se utiliza en el análisis de la varianza (ANOVA).

Distribución exponencial

La distribución exponencial es una distribución de probabilidad continua que sirve para modelizar el tiempo de espera para la ocurrencia de un fenómeno aleatorio.

En concreto, la distribución exponencial permite describir el tiempo de espera entre dos fenómenos que siguen una distribución de Poisson. Por lo tanto, la distribución exponencial está estrechamente relacionada con la distribución de Poisson.

La distribución exponencial tiene un parámetro característico, que se representa con la letra griega λ e indica el número de veces que se espera que ocurra el evento estudiado durante un periodo de tiempo determinado.

X\sim \text{Exp}(\lambda)

Asimismo, la distribución exponencial también se usa para modelizar el tiempo que transcurre hasta que se produce un fallo. De modo que la distribución exponencial tiene varias aplicaciones en fiabilidad y en la teoría de la supervivencia.

Distribución beta

La distribución beta es una distribución de probabilidad definida en el intervalo (0,1) y parametrizada por dos parámetros positivos: α y β. Es decir, los valores de la distribución beta dependen de los parámetros α y β.

Por lo tanto, la distribución beta sirve para definir variables aleatorias continuas cuyo valor oscila entre 0 y 1.

Existen varias notaciones para denotar que una variable aleatoria continua está regida por una distribución beta, las más comunes son:

\begin{array}{c}X\sim B(\alpha,\beta)\\[2ex]X\sim Beta(\alpha,\beta)\\[2ex]X\sim \beta_{\alpha,\beta}\end{array}

En estadística, la distribución beta tiene aplicaciones muy variadas. Por ejemplo, la distribución beta se usa para estudiar las variaciones de porcentajes en diferentes muestras. Asimismo, en la gestión de proyectos se utiliza la distribución beta para llevar a cabo un análisis Pert.

Distribución gamma

La distribución gamma es una distribución de probabilidad continua definida por dos parámetros característicos, α y λ. Es decir, la distribución gamma depende del valor de sus dos parámetros: α es el parámetro de forma y λ es el parámetro de escala.

El símbolo de la distribución gamma es la letra griega mayúscula Γ. Por lo tanto, si una variable aleatoria sigue una distribución gamma se escribe de la siguiente manera:

X\sim \Gamma(\alpha,\lambda)

La distribución gamma también se puede parametrizar usando el parámetro de forma k=α y el parámetro inverso de escala θ=1/λ. En cualquier caso, los dos parámetros que definen la distribución gamma son números reales positivos.

En general, la distribución gamma se utiliza para modelar conjuntos de datos que son asimétricos a la derecha, de manera que existe una mayor concentración de datos en la parte izquierda de la gráfica. Por ejemplo, la distribución gamma se usa para modelar la fiabilidad de componentes eléctricos.

Distribución de Weibull

La distribución de Weibull es una distribución de probabilidad continua que queda definida por dos parámetros característicos: el parámetro de forma α y el parámetro de escala λ.

En estadística, la distribución de Weibull se usa principalmente para el análisis de supervivencia. Asimismo, la distribución de Weibull tiene muchas aplicaciones en diferentes ámbitos.

X\sim\text{Weibull}(\alpha,\lambda)

Dependiendo del autor, la distribución de Weibull también se puede parametrizar con tres parámetros. Entonces, se añade un tercer parámetro llamado valor umbral, el cual indica la abscisa en la que empieza la gráfica de la distribución.

La distribución de Weibull recibe el nombre del sueco Waloddi Weibull, quien la describió en detalle en 1951. No obstante, la distribución de Weibull fue descubierta por Maurice Fréchet en 1927 y aplicada por primera vez por Rosin y Rammler en 1933.

Distribución de Pareto

La distribución de Pareto es una distribución de probabilidad continua que se usa en estadística para modelizar el principio de Pareto. Por lo tanto, la distribución de Pareto es una distribución de probabilidad que tiene unos pocos valores cuya probabilidad de ocurrencia es mucho mayor que el resto de valores.

Recuerda que la ley de Pareto, también llamada regla del 80-20, es un principio estadístico que dice que la mayor parte de la causa de un fenómeno es debida a una pequeña parte de la población.

La distribución de Pareto tiene dos parámetros característicos: el parámetro de escala xm y el parámetro de forma α.

X\sim \text{Pareto}(\alpha,x_m)

Originalmente, la distribución de Pareto se usaba para describir la distribución de la riqueza de la población, ya que la mayor parte era debida a una pequeña proporción de la población. Pero actualmente la distribución de Pareto tiene muchas aplicaciones, por ejemplo, en los controles de calidad, en economía, en ciencia, en el ámbito social, etc.

Distribución de probabilidad continua y discreta

Las distribuciones de probabilidad se pueden clasificar en distribuciones continuas y distribuciones discretas. Así pues, para terminar, veremos cuál es la diferencia entre estos dos tipos de distribuciones de probabilidad.

La diferencia entra las distribuciones de probabilidad continuas y las distribuciones de probabilidad discretas son el número de valores que pueden tomar. Las distribuciones continuas pueden tomar un número infinito de valores dentro de un intervalo, en cambio, las distribuciones discretas solo pueden tomar un número contable de valores dentro de un intervalo.

Por lo tanto, en general, una manera de diferenciar las distribuciones continuas de las distribuciones discretas es mediante el tipo de números que pueden tomar. Normalmente, una distribución continua puede tomar cualquier valor incluyendo números decimales, mientras que las distribuciones discretas solo pueden tomar números enteros.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ir arriba