Media, mediana, moda, varianza, desviación estándar y puntaje Z

Cuando tienes un montón de datos, lo primero que quieres es resumirlos sin perder lo importante. Estas medidas sirven justo para eso: unas te dicen dónde está el centro y otras te dicen qué tan regados están los valores.

Media

La media es el promedio de toda la vida. Sumas todos los valores y los divides entre cuántos datos tienes. Es útil, pero se puede mover mucho si hay números muy extremos.

Mediana

La mediana es el valor de en medio cuando ordenas los datos. Si tienes un número par de datos, es el promedio de los dos del centro. Lo bueno de la mediana es que no se deja engañar tanto por valores muy grandes o muy pequeños.

Moda

La moda es el valor que más se repite. A veces hay una moda clara, a veces hay varias, y a veces no hay ninguna si casi todos son distintos.

Varianza

La varianza te dice qué tanto se separan los datos de la media. Si la varianza sale grande, significa que los datos están muy regados. Si sale pequeña, significa que están más juntitos. No siempre se interpreta tan fácil porque queda en unidades al cuadrado, pero es la base para la siguiente.

Desviación estándar

La desviación estándar es como la versión más entendible de la varianza, porque vuelve a las mismas unidades de los datos. En pocas palabras, te dice qué tan lejos suelen quedar los valores del promedio, en promedio.

Puntaje Z

El puntaje Z sirve para saber qué tan arriba o qué tan abajo está un dato comparado con el promedio, pero medido en desviaciones estándar. Si el Z es 0, estás justo en la media. Si es 1, estás una desviación estándar arriba. Si es -1, estás una abajo. Es muy útil para comparar resultados aunque vengan de escalas diferentes.




Comentarios

Entradas más populares de este blog

Pruebas paramétricas y no paramétricas

Alcances de una investigación

campana de Gauss