Número de clases (estadística)

En este post se explica cómo saber el número de clases en estadística. También encontrarás cómo se calcula la amplitud de los intervalos después de hallar el número de clases y, además, podrás ver varios ejemplos resueltos.

Cómo calcular el número de clases en estadística

Principalmente, en estadística existen dos métodos para calcular el número de clases idóneo de una muestra de datos: la regla de Sturges, que es una fórmula, y el método de la raíz, que consiste en hallar la raíz cuadrada del número total de datos.

Dependiendo de la muestra, conviene utilizar un método u otro. A continuación se explican los dos métodos con un ejemplo.

Regla de Sturges

La regla de Sturges es una regla que sirve para calcular el número clases o intervalos idóneo en los que se debe dividir un conjunto de datos. En concreto, la fórmula de la regla de Sturges dice que el número de clases adecuado es igual a uno más el logaritmo en base dos del número total de datos.

c=1+\log_2(N)

Donde c es el número de clases o intervalos y N es el número total de observaciones de la muestra.

La mayoría de calculadoras solo permiten hacer cálculos con logaritmos de base 10. En tal caso, puedes utilizar esta fórmula equivalente:

c=1+\cfrac{\log(N)}{\log(2)}

Por ejemplo, si tenemos una muestra estadística con 100 observaciones, según la regla de Sturges el número de clases con el que se deben agrupar los datos se calcula de la siguiente manera:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(100)\\[2ex]c=1+6,64\\[2ex]c=7,64\\[2ex]c\approx 8\end{array}

De modo que para una muestra con un total de 100 datos se deberían dividir los datos en 8 intervalos diferentes.

Método de la raíz

Aunque seguramente la regla de Sturges es más conocida, otro método muy usado en estadística para sacar el número de clases es calculando la raíz cuadrada del tamaño de la muestra.

Así pues, otra fórmula para calcular el número de clases idóneo es la siguiente:

c=\sqrt{N}

Donde c es el número de clases o intervalos y N es el número total de datos de la muestra.

Por ejemplo, si tenemos un total de 150 datos, el cálculo del número de intervalos en el que debemos dividir los datos sería:

c=\sqrt{150}=12,25 \approx 12

La fórmula anterior se usa cuando el tamaño muestral es menor de 200, pero cuando tenemos 200 o más datos es mejor calcular el número de clases haciendo la raíz cúbica:

c=\sqrt[3]{N}

Donde c es el número de clases o intervalos y N es el número total de datos de la muestra.

Número de clases y amplitud de intervalo

Una vez hemos calculado el número de clases, podemos calcular la amplitud que debe tener cada intervalo mediante la siguiente fórmula:

 \text{Amplitud de intervalo}=\cfrac{\text{Rango}}{\text{N\'umero de clases}}

A modo de ejemplo, a continuación se resuelve un ejercicio para que puedas ver cómo se calcula la amplitud de los intervalos

  • Se han registrado los siguientes datos estadísticos. Calcula el número de clases con la regla de Sturges y luego determina la amplitud de cada intervalo.

35\ 18\ 25\ 2\ 45\ 34\ 68\ 42\ 9\ 41\ 62\ 85\ 53

21\ 4\ 86\ 50\ 32\ 71\ 59\ 29\ 12\ 38\ 91\ 63\ 7

67\ 37\ 23\ 70\ 65\ 47\ 76\ 83\ 54\ 27\ 25\ 19\ 98

Tal y como hemos visto más arriba, para determinar el número de clases en el que se deben agrupar los datos aplicamos la regla de Sturges. En este caso tenemos 39 datos, por lo que en la fórmula debemos sustituir el parámetro N por 39:

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(39)\\[2ex]c=1+5,28\\[2ex]c=6,28\\[2ex]c\approx 6\end{array}

Ahora que ya conocemos el número de clases adecuado, vamos a calcular el ancho de cada clase. Para ello, primero tenemos que calcular el rango de la muestra de datos:

R=98-2=96

Y una vez sabemos el rango de la muestra, dividimos el valor hallado entre el número de clases calculado anteriormente (6):

\text{Amplitud de intervalo}=\cfrac{96}{6}=16

De modo que el ancho de todas las clases debe ser de 16 unidades. Por lo tanto, las clases que podríamos hacer son las siguientes:

\begin{array}{l}[2,18)\\[2ex][18,34)\\[2ex][34,50)\\[2ex][50,66)\\[2ex][66,82)\\[2ex][82,98]\end{array}

Número de clases en una distribución de frecuencias

Por último, cabe destacar que el cálculo del número de clases es importante cuando se hace una distribución de frecuencias (o tabla de frecuencias), de este modo se pueden separar rápidamente los datos en diferentes intervalos y luego hallar todos los tipos de frecuencias de cada intervalo.

Por si no sabes qué es, una distribución de frecuencias es una tabla en la que se ponen todos los tipos de frecuencias de cada intervalo. De manera que cada fila es una clase diferente y cada columna un tipo de frecuencia diferente.

Para ver un ejemplo de una distribución de frecuencias con datos agrupados en intervalos, haz clic en el siguiente enlace:

Deja un comentario

Tu dirección de correo electrónico no será publicada.

Ir arriba