
EXPERIENCIAS REALES EN CIENCIAS DE DATOS: ANÁLISIS CLÚSTER CON DATOS ESPACIALES
¿Quieres conocer cómo la Ciencia de Datos puede ayudar a identificar grupos de municipios con perfiles similares según su demografía y consumo?
Descubre ejemplos reales de analítica aplicada de la mano de nuestros alumnos y cómo Máxima Formación les ha ayudado en este proceso.
En el post de hoy, te enseñamos la investigación de Felipe Carranza, alumno del Máster de Estadística Aplicada para la Ciencia de Datos. Felipe es especialista de Inteligencia artificial en Optima Servicios Financieros, donde realiza modelos de machine learning supervisado y no supervisado, modelos estadísticos avanzados, modelos espacio-temporales, teledetección (con R, python, Qgis, Google earth engine), así como el seguimiento a la implementación de proyectos de inteligencia artificial.

En esta investigación Felipe Carranza y su compañera Metzi Aguilar, nos muestra cómo caracterizar los sectores rurales y urbanos de El Salvador, utilizando variables socio-demográficas y la aplicación de luces satelitales nocturnas. Mediante análisis cluster y visualización con Sistemas de Información Geográfica (SIG), logran identificar grupos de municipios con comportamiento similar en cuanto a sus variables socio-demográficas y de consumo.
El análisis fue un estudio exploratorio de agrupación no supervisada de 4 variables económicas-demográficas: PIB per cápita, consumo eléctrico per cápita, tasa de pobreza, densidad poblacional y la luz nocturna. En la figura 1 se ilustra la metodología de esta investigación de manera general.

Mediante la técnica de clustering jerárquico se intentó agrupar el territorio mediante 5 variables de estudio y no fue posible caracterizar el área rural, por lo que se procedió al uso de métodos no lineales (t-SNE) que mediante computación estadística con múltiples pruebas de parámetros se obtuvieron reducciones a dos dimensiones de tipo no lineal, estas fueron la entrada de los cluster jerárquicos consiguiendo clasificar el área rural con mayor detalle. Se obtuvieron 9 clusters a nivel nacional para El Salvador que clasificaron de manera más detallada el área rural (Figura 14). Con este estudio se ha dado un primer avance a nivel exploratorio el cual tiene que ser validado mediante un método supervisado para la aceptación de la hipótesis de subdivisión del territorio salvadoreño.

Puedes descargar el proyecto de investigación de Felipe Carranza y Metzi Aguilar debajo.
Y si te gustó esta investigación, por favor comparte y comenta.
2 comentarios
Excelente información
Marta Montano 18 de abril de 2022, 17:47
¡Muchas gracias Marta!
Rosana Ferrero 18 de abril de 2022, 18:01