Estadística bidimensional

En este artículo te explicamos en qué consiste la estadística bidimensional. Asimismo, encontrarás todas aquellas fórmulas relacionadas con la estadística bidimensional y, además, un ejemplo de la aplicación de la estadística bidimensional.

¿Qué es la estadística bidimensional?

Entendemos por estadística bidimensional aquella rama de la estadística que se encarga de estudiar distribuciones bidimensionales, es decir, distribuciones en las que cada elemento le corresponde los valores de dos variables.

Es decir, la estadística bidimensional es aquella parte de la estadística que se aplica a conjuntos datos en los que cada dato son un par de valores (X, Y).

Por ejemplo, si queremos analizar la relación entre las horas de estudio y las calificaciones obtenidas en un examen en una muestra de 50 alumnos, a cada alumno le corresponderán dos valores: las horas que ha dedicado y la nota que ha sacado.

Fórmulas de estadística bidimensional

A continuación veremos varias fórmulas que nos permitirán hacer un análisis estadístico bidimensional

Covarianza

En estadística, la covarianza es un valor que indica el grado de variación conjunta de dos variables aleatorias. De modo que covarianza sirve para analizar la dependencia entre las dos variables de una distribución bidimensional.

Lla fórmula para calcular la covarianza entre dos variables es la siguiente:

Cov(X,Y)=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{n}

Correlación

La correlación es una medida estadística que indica el grado de relación entre dos variables. En concreto, la correlación lineal sirve para determinar cuánto de correlacionadas linealmente están dos variables distintas.

Dos variables están relacionadas cuando al variar los valores de una variable también cambian los valores de la otra variable. Por ejemplo, si al aumentar la variable A también aumenta la variable B, existe una correlación entre las variables A y B.

El coeficiente de correlación es el valor de la correlación entre dos variables. La fórmula para calcularlo es la siguiente:

\rho_{XY}=\cfrac{Cov(X,Y)}{\sqrt{Var(X)\cdot Var(Y)}}

El coeficiente de correlación se usa para analizar la relación entre las dos variables que componen la distribución bidimensional.

Regresión lineal

La recta de un modelo de regresión lineal es la recta que mejor se ajusta a una nube de puntos y que, por tanto, mejor describe un conjunto de datos formado por dos variables. Es decir, la recta de regresión sirve para determinar un modelo que describe una determinada distribución bidimensional.

Así pues, la ecuación de la recta de regresión relaciona matemáticamente las dos variables de una distribución bidimensional. Aunque generalmente la recta de regresión no es capaz de determinar con exactitud el valor de cada observación, sí que nos permite obtener una aproximación de su valor.

recta de regresión

Como puedes ver en la gráfica anterior, la recta de regresión nos ayuda a ver la tendencia de un conjunto de datos, además, es útil para predecir el valor de las variables.

Ejemplo de estadística bidimensional

Después de ver la definición de estadística bidimensional, vamos a ver un ejemplo aplicado para acabar de entender su significado.

  • En la siguiente tabla de doble entrada se han recogido las notas de matemáticas y estadística de una muestra de 20 alumnos. Representa el conjunto de datos en un gráfico y analízalo.

Para representar los datos de la distribución bidimensional en un gráfico simplemente debemos dibujar dos ejes, calibrarlos y representar un punto en la gráfica por cada pareja de datos. Recuerda que un punto en una gráfica se pone donde se cortan las rectas imaginarias correspondientes a cada uno de sus valores.

ejemplo de diagrama de dispersion

Cada eje del gráfico de dispersión representa una variable, en concreto, el eje X pertenece a la nota conseguida en matemáticas y, por otro lado, el eje Y corresponde a la nota obtenida en estadística.

Una vez hemos representado los datos gráficamente, procedemos a analizar la relación entre las dos variables. Para ello, calculamos la media de cada variable:

\overline{x}=6,25

\overline{y}=6,5

Luego calculamos la covarianza de las dos variables:

Cov(X,Y)=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{n}= 4,08

Ahora calculamos el coeficiente de correlación entre las dos variables:

\rho_{XY}=\cfrac{Cov(X,Y)}{\sqrt{Var(X)\cdot Var(Y)}}=0,84

Y finalmente calculamos la recta de regresión que ajusta el modelo entre las dos variables:

b_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}=0,817

b_0=\overline{y}-b_1\overline{x}=1,3935

y=1,3935+0,817x

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio