ANÁLISIS CLÚSTER CON DATOS ESPACIALES
Resumen:
Felipe Carranza, alumno del Máster de Estadística Aplicada para la Ciencia de Datos, junto con Metzi Aguilar, han realizado una investigación para caracterizar sectores rurales y urbanos de El Salvador utilizando variables socio-demográficas y luces satelitales nocturnas.
Utilizando análisis cluster y visualización con Sistemas de Información Geográfica (SIG) para identificar grupos de municipios con comportamientos similares en cuanto a PIB per cápita, consumo eléctrico per cápita, tasa de pobreza, densidad poblacional y luz nocturna.
Empezaron con clustering jerárquico, pero al no poder caracterizar el área rural, usaron métodos no lineales (t-SNE) para reducir las dimensiones y luego aplicaron clustering jerárquico nuevamente, logrando clasificar el área rural en 9 clusters.
Han identificado 9 clusters a nivel nacional que clasifican de manera más detallada el área rural, proporcionando un primer avance exploratorio que necesita validación mediante métodos supervisados.
Este estudio muestra cómo la Ciencia de Datos puede ayudar a entender mejor las características socio-demográficas y de consumo de diferentes áreas, y destaca la importancia de validar los resultados obtenidos con métodos supervisados.
Autor: Felipe Carranza
Director TFM: Juan Luis López
Fecha: 13/04/2020
Descarga el TFM
