Tema 5: Estadísticos univariables: Medidas resumen para variables cuantitativas: Medidas de tendencia central. Medidas de dispersión. Medidas de posición. Forma de distribución: asimetría y curtosis.
Resumen numérico de una serie estadística
• Además de las tablas podemos
resumir una serie de observaciones
mediante “estadísticos”: “Función de los datos observados”
• Tres grandes tipos de medidas
estadísticas:
– Medidas de tendencia central
– Medidas de dispersión o variabilidad
– Medidas de posiciónMedidas de tendencia central
– Se calcula para variables
cuantitativas y se trata del centro geométrico o de gravedad de nuestros datos.
Es la suma de todos valores de la variable observada entre el total de
observaciones.
– Cuando los datos son agrupados, para calcular la media utilizamos como valor de referencia de cada intervalo su marca de clase
• Mediana:
– Es el valor de la observación tal
que un 50% de los datos es menor y otro 50% es mayor.
– Si el número de observaciones es
impar el valor de la observación será justamente la observación que ocupa la
posición (n/2)+1
– Si el número de observaciones es par, el valor de la
mediana corresponde a la media entre los dos valores centrales
•
Moda:
– Es el valor con mayor frecuencia
(que más veces se repite)
– Si hay más de una se dice que la
muestra es bimodal (dos modas) o multimodal (más de dos)
– Se puede calcular para cualquier
tipo de variable
Medidas de posición
•
Cuantiles:
– Se calculan para variables
cuantitativas
– Los cuantiles más usuales son los percentiles, los
deciles y los cuartiles, según dividan la muestra ordenada en 100, 10 ó 4
partes, respectivamente
•
Percentiles:
– Dividen la muestra ordenada en 100
partes
– El percentil “i” (Pi), es aquél
valor que, ordenadas las observaciones en forma creciente, el i% de ellas son
menores que él y el (100-i)% restante son mayores
– El valor del P50corresponde al
valor de la mediana
•
Deciles:
– Dividen la muestra ordenada en 10
partes
– El decil “i” (Di), es aquél valor
que, ordenadas las observaciones en forma creciente, el i/10% de ellas son
menores que él y el (100-i)/10% restante son mayores
– El valor del D5corresponde al
valor de la mediana y, por tanto, al del P50
•
Cuartiles:
– Dividen la muestra ordenada en 4
partes
– El Q1, primer cuartil = 25%.
– El Q2, segundo cuartil = 50%. Por tanto, el Q2
coincide con el valor del D5, con al
valor de la mediana P50
– El Q3, tercer cuartil = 75%
– El Q4, cuarto cuartil =100%
Medidas
de dispersión
- Rango o recorrido
- Desviación
media
- Desviación típica
- Recorrido intercuartílico: Diferencia entre el tercer y el primer cuartil= |Q3-Q1|
- Coeficiente de variación: es una medida de dispersión relativa
(adimensional) ya que todas las demás se expresan en la unidad de medida de la
variable. Nos sirve para comparar la heterogeneidad de dos series numéricas con
independencia de las unidades de medidas
Distribuciones
normales
• Probabilidad de
variable continua que con más frecuencia aparece en fenómenos reales.
• La gráfica de su función de
densidad tiene una forma acampanada y es simétrica respecto de los valores
posición central (media, mediana y moda, que coinciden en estas distribuciones)
• Esta curva se conoce como campana
de Gauss.
Asimetrías
y curtosis
• Coeficiente de asimetría de una
variable: Grado de asimetría de la distribución de sus datos en torno a su
media.
• Es adimensional y adopta valores entre -1 y 1
Asimetrías
Los resultados pueden ser los
siguientes:
•
g 1 = 0, distribución simétrica
• g1 > 0, distribución
asimétrica positiva
• g1 < 0, distribución
asimétrica negativa
Curtosis
o apuntamiento
• Coeficiente de apuntamiento o
curtosis de una variable, sirve para medir el grado de concentración de los
valores que toma en torno a su media.
• Se elige como referencia una
variable con distribución normal, el coeficiente de
curtosis es 0.
• Valores entre -1 y
1.
Los resultados pueden ser los
siguientes:
•
g 2 = 0 (distribución mesocúrtica) . Presenta un grado de concentración
medio alrededor de los valores centrales de la variable (el mismo que presenta
una distribución normal).
• g2 > 0 (distribución leptocúrtica ). Presenta un elevado grado
de concentración alrededor de los valores centrales de la variable.
•
g2 < 0 (distribución platicúrtica). Presenta un reducido grado de
concentración alrededor de los valores centrales de la variable
No hay comentarios:
Publicar un comentario