En el eje Z se presenta la mayor dispersión de datos respecto la mediana, esta ultima también se encuentra más alejada de la ausencia de error, asimismo se observa una mayor concentración de valores por encima de la mediana lo cual indica una asimetria negativa. La mediana más cerca del error cero pertenece al eje X y presenta la menor dispersión de datos con asimetria ligeramente positiva aunque es llamativa la presencia de varios valores extremos. El eje Y presenta una una distribución homogénea en sus valores.
Es necesario hacer una serie de estudios y análisis con los datos de la variable para determinar la mejor forma de representar los datos.
-análisis de tendencia central (mediana)
-análisis de dispersión a través del rango intercuartilico
-Análisis de forma ( lo que queremos saber es si la mediana está cerca del cuartil 3 o del cuartil 1.
Si deseamos hacer un análisis estadístico donde la media es necesaria entonces primero debemos hacer un estudio exploratorio de la variable, una especie de radiografía a los datos para saber qué tipo de análisis es el más adecuado.
El beneficio más importante de utilizar el diagrama de cajas es que podemos determinar la existencia de datos extremos o atípicos.
El beneficio más importante de utilizar el diagrama de cajas es que podemos determinar la existencia de datos extremos o atípicos.
No hay comentarios:
Publicar un comentario