Estadística básica

En este post se explica en qué consiste la estadística básica y cuáles son los conceptos básicos de estadística. También encontrarás cuáles son las medidas estadísticas fundamentales y, además, un ejercicio resuelto paso a paso.

¿Qué es la estadística básica?

Por estadística básica entendemos como aquel conjunto de técnicas y métodos estadísticos que sirven para recopilar datos, organizarlos, resumirlos y analizarlos de manera genérica, sin entrar demasiado en detalle.

Así pues, podríamos definir la estadística básica como aquella parte de la estadística que nos permite estudiar un grupo de datos de manera sencilla, simplemente sirve para darnos una idea de cómo son.

Por ejemplo, imagina que estás tratando de entender si a tu equipo favorito le está yendo bien o mal esta temporada. ¿Cómo sabes si están mejorando o si solo es una racha de buena suerte? Gracias a la estadística básica podemos analizar de manera sencilla los resultados del equipo y comprender mejor qué está pasando. Lógicamente, con solo estadística básica no podremos hacer un pronóstico fiable sobre en qué posición acabará la temporada, pero al menos podremos saber la situación actual del equipo.

Por lo tanto, la estadística básica se diferencia de la estadística avanzada por la complejidad de los métodos que utiliza. En la estadística básica se usan técnicas y procedimientos mucho más sencillos que en la estadística avanzada. Por oro lado, la estadística avanzada nos proporciona un análisis más exhaustivo de los datos, de manera que con métodos estadísticos avanzados podemos identificar más relaciones entre las variables de estudio.

Conceptos de estadística básica

Los conceptos más importantes de la estadística básica son los siguientes:

  • Población: conjunto de elementos con unas características similares sobre el cual se pretende hacer un estudio estadístico.
  • Muestra: parte de la población sobre la cual se realiza el estudio estadístico.
  • Individuo: cada uno de los elementos que forman parte de la población.
  • Carácter: cada una de las características que poseen todos los individuos de una población y que, por tanto, puede ser objeto de un estudio estadístico.
  • Muestreo: proceso por el que se selecciona la muestra de una población. Existen diferentes métodos de muestreo.
  • Variable estadística: característica de los individuos de una población que puede adoptar diferentes valores y puede medirse. Suele ser la característica que se estudia en una investigación estadística.
  • Parámetro estadístico: valor que resume las características de una muestra.
  • Experimento estadístico: procedimiento que proporciona un resultado, ya sea numérico o no numérico, y sirve para calcular la probabilidad de ocurrencia de cada posible resultado.

Medidas estadísticas básicas

Las medidas estadísticas son cálculos que se hacen para saber las características de un conjunto de datos. A continuación se resumen las medidas estadísticas que más se utilizan en estadística.

Media

Para calcular la media se deben sumar todos los valores y luego dividir entre el número total de datos. Por lo tanto, la fórmula de la media es la siguiente:

\displaystyle\overline{x}=\frac{\displaystyle\sum_{i=1}^n x_i}{n}

En estadística, la media también se conoce como media aritmética o promedio.

Mediana

La mediana es el valor del medio de todos los datos ordenados de menor a mayor. Es decir, la mediana divide todo el conjunto de datos ordenados en dos partes iguales.

El cálculo de la mediana depende de si el número total de datos es par o impar:

  • Si el número total de datos es impar, la mediana será el valor que está justo en el medio de los datos. Es decir, el valor que está en la posición (n+1)/2 de los datos ordenados.
  • Me=x_{\frac{n+1}{2}

  • Si el número total de datos es par, la mediana será la media de los dos datos que están en el centro. Esto es, la media aritmética de los valores que están en la posiciones n/2 y n/2+1 de los datos ordenados.
  • Me=\cfrac{x_{\frac{n}{2}}+x_{\frac{n}{2}+1}}{2}

Donde n es el número total de datos de la muestra y el símbolo Me indica mediana.

Moda

En estadística, la moda es el valor del conjunto de datos que tiene una mayor frecuencia absoluta, es decir, la moda es el valor que más se repite de un conjunto de datos.

Por lo tanto, no existe una fórmula concreta para la moda, sino que para calcular la moda de un conjunto de datos estadísticos basta con contar el número de veces que aparece cada dato en la muestra, y el dato más repetido será la moda.

La moda también se puede decir moda estadística o valor modal.

Desviación estándar

La desviación estándar, también llamada desviación típica, es igual a la raíz cuadrada de la suma de los cuadrados de las desviaciones de la serie de datos partido por el número total de observaciones.

Por lo tanto, la fórmula de la desviación estándar es la siguiente:

\displaystyle\sigma=\sqrt{\frac{\displaystyle\sum_{i=1}^n(x_i-\overline{x})^2}{n}}

Varianza

La varianza es igual a la suma de los cuadrados de los residuos partido por el número total de observaciones. Así que la fórmula de esta métrica estadística es la siguiente:

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

Donde:

  • X es la variable aleatoria de la que se quiere calcular la varianza.
  • x_i es el valor del dato i.
  • n es el número total de observaciones.
  • \overline{X} es la media de la variable aleatoria X.

Rango

El rango estadístico es una medida de dispersión que indica la diferencia entre el valor máximo y el valor mínimo de los datos de una muestra. Por lo tanto, para calcular el rango de una población o muestra estadística se debe restar el valor máximo menos el valor mínimo.

R=\text{M\'ax}-\text{M\'in}

Ejemplo de estadística básica

A modo de ejemplo, en este apartado resolveremos un problema para que puedas ver la aplicación de la estadística básica.

  • Las calificaciones obtenidas por nueve alumnos seleccionados al azar de un instituto son las mostradas a continuación. Calcula la media, la mediana, la moda, la varianza, la desviación estándar y el rango de esta serie de datos.

\begin{array}{c}7\quad 5\quad 6 \quad 6\quad 9\\[2ex]7\quad 8\quad 4\quad 7\end{array}

Para hallar la media aritmética tenemos que sumar todos los datos y luego dividir por el número total de datos, que es 9.

\displaystyle\overline{x}=\frac{\displaystyle\sum_{i=1}^n x_i}{n}

\displaystyle\overline{x}=\frac{7+5+6+6+9+7+8+4+7}{9}=6,56

La mediana es el valor del medio de todos los datos ordenados de menor a mayor. Así que para determinar la mediana primero debemos ordenar de manera ascendente los datos:

4\quad 5\quad 6 \quad 6\quad 7\quad 7\quad 7\quad 8\quad 9

En este caso tenemos nueve datos, por lo que el valor del medio es el quinto dato, que corresponde al 7.

Luego, la moda es el valor que más se repite, por lo tanto, la moda es el 7 porque se repite tres veces.

Ahora utilizamos la fórmula de la varianza para sacar su valor:

Var(X)=\cfrac{\displaystyle\sum_{i=1}^n\left(x_i-\overline{x}\right)^2}{n}

\displaystyle Var(X)=\cfrac{\begin{array}{l}(7-6,56)^2+(5-6,56)^2+(6-6,56)^2+\\[2ex]+(6-6,56)^2+(9-6,56)^2+(7-6,56)^2+\\[2ex]+(8-6,56)^2+(4-6,56)^2+(7-6,56)^2\end{array}}{9}=2,02

La desviación estándar es la raíz cuadrada de la varianza, por tanto:

\sigma=\sqrt{Var(X)}=\sqrt{2,02}=1,42

Por último, el rango estadístico es la diferencia entre el valor máximo (9) y el valor mínimo (4) del conjunto de datos:

R=\text{M\'ax}-\text{M\'in}

R=9-4=5

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio