Las medidas de tendencia central son parámetros estadísticos que indican el centro de la distribución de una muestra o población estadística. En otras palabras, es el número en el centro de la distribución del rango de observaciones o medidas en las que se encuentra el conjunto de datos.
El propósito de una medida de tendencia central es aportar al analista algunos valores cuantitativos de la ubicación central para definir dónde se encuentra la media típica de una unidad o grupo o serie de datos.
Además, las medidas de tendencia central nos ayudan a comparar datos e interpretar los resultados obtenidos a partir de diferentes series de datos. Entonces lo que podemos determinar es la diferencia entre un valor y otro.
Los tres tipos principales de medidas de tendencia central son:
1. Media
La medida de la muestra es simplemente el promedio numérico. Se representa con la siguiente fórmula:
2. Mediana
La mediana tiene el propósito de reflejar la tendencia central de la muestra de manera que no se vea influida por valores extremos. Puede ser calculada con la siguiente fórmula:
3. Moda
La moda es simplemente el valor que más se repite en la muestra estadística o población. A pesar de que se puede calcular con la fórmula siguiente, lo más sencillo es determinar cuál valor se repite mayor cantidad de veces.
A continuación, un ejemplo del cálculo de las tres medidas de tendencia central con Python:
import numpy as np
from scipy import stats
velocidad = [99, 24, 67, 44, 56, 78, 58, 34, 34]
media = np.mean(velocidad)
mediana = np.median(velocidad)
moda = stats.mode(velocidad)
print("Los datos obtenidos son: ")
print("La media de los datos es: ", media)
print("La mediana de los datos es: ", mediana)
print("La moda de los datos es: ", moda)
Resultado:
Los datos obtenidos son:
La media de los datos es: 54.888888888888886
La mediana de los datos es: 56.0
La moda de los datos es: ModeResult(mode=array([34]), count=array([2]))