EXPERIENCIAS REALES EN DATA SCIENCE: Análisis de factores que impulsan el uso de dispositivos vestibles de seguridad con XGBoost
En el post de hoy, te enseñamos el Trabajo Fin de Máster (TFM) de Óscar Hernández que nos muestra cuáles son los factores que influyen la decisión comportamental de los individuos a usar dispositivos vestibles para incrementar la seguridad en entornos industriales (Safety Wearable Devices). Su extraordinario trabajo ha incluido algoritmos de Gradient Boosting (XGBoost) y métodos de estadística clásica como son el Análisis de Correspondencia Múltiple (MCA) y la Regresión Logística.
¡Una aproximación novedosa para analizar a fondo la percepción y aceptación de los usuarios respecto al uso de dispositivos portátiles o también llamados vestibles (wearable devices) en entornos industriales para incrementar la seguridad! No te pierdas sus resultados.
Cómo un algoritmo de Gradient Boosting puede ayudarnos a descubrir los factores clave detrás del uso efectivo de dispositivos vestibles de seguridad en entornos industriales
Investigación realizada por nuestro alumno del Máster en Ciencia de Datos con R
Óscar Hernández, Managing Director en RP Compounds GmbH, es el responsable final de las funciones de EHS (Enviromental, Health and Safety), donde se enmarca este estudio. Óscar tiene 32 años de Experiencia profesional en industrias tales como Consultoría, Automoción, Textil, IT y Transformación de Plásticos. Este trabajo se enmarca en el Máster en Estadística Aplicada para Data Science con R Software.
Óscar Hernández - Perfil de Linkedin
Factores que impulsan el uso de dispositivos vestibles de seguridad
Aunque se han desarrollado numerosos modelos sociológicos que describen los factores que influyen en la decisión comportamental de comprar y usar tecnologías de la información para el uso privado, no existen muchos estudios que validen su utilización en entornos empresariales con dispositivos vestibles para incrementar la seguridad de los usuarios.
El objetivo de Óscar fue encontrar un modelo que explique los factores que influyen en la percepción y predicen la aceptación de los usuarios respecto al uso de dispositivos portátiles o también llamados vestibles (wearable devices) en entornos industriales para incrementar la seguridad, comparando estos factores con los constructos enunciados por la teoría UTAUT2 (Unified Theory of Acceptance and Use of Technology).
El método de investigación incluyó una encuesta compuesta por 31 preguntas, respondidas por 871 empleados de empresas brasileñas y europeas (Alemania, Bélgica, España, Italia y Turquía) de diversos sectores industriales. Las preguntas incluyen en la escala de Likert, unipolar y bipolar, para identificar las características de los participantes, la experiencia en el uso de las tecnologías, su percepción de la tecnología y su preocupación por la gestión de los datos recogidos, entre otros factores.
Un estudio basado en Machine Learning y estadística
Se han utilizado metodologías de Machine Learning de fácil interpretación, como XGboost, con distintas configuraciones para los hiperparámetros, validando y comparando los resultados por medio de modelos de Regresión Logística y Análisis de Correspondencia Múltiple con R Software.
El resultado indicó que las variables asociadas a los principales constructos (factores) enunciados por la teoría UTAUT2 influyen significativamente y predicen la aceptación de las tecnologías vestibles en la muestra estudiada. También se comprobó adicionalmente que las técnicas estadísticas clásicas como la Regresión Logística y Análisis de Correspondencia Múltiple confirman los resultados obtenidos las técnicas de Machine Learning aunque con resultados sensiblemente inferiores en las métricas de evaluación.
Toma decisiones inteligentes basadas en la experiencia de los datos
Estrategias industriales basadas en SHAP (SHapley Additive exPlanations)
Aunque la estadística se desarrolló en gran medida en los estudios de sociología es una de las áreas donde es más difícil encontrar resultados concluyentes. Para mejorar la interpretación de las variables significativas se utilizaron las técnicas típicas de cada tipo de estudio, destacando la interpretación por valores SHAP (SHapley Additive exPlanations). Los valores SHAP son un método basado en la teoría de juegos cooperativos y que incrementa la transparencia y la interpretabilidad de los modelos de aprendizaje automático. Con los gráficos SHAP y los gráficos de dependencia parcial podemos ver claramente la importancia y el efecto de cada variable en el modelo de aceptación.
Los resultados del estudio permiten diseñar una estrategia para mejorar la aceptación del uso de estos dispositivos de seguridad, antes y durante su implementación en un entorno industrial.
Si te gustó conocer esta aplicación del Machine Learning aplicada al mundo del futbol, comenta y comparte la publicación. ¡Nos encantaría conocer tu opinión!
Puedes descargar el TFM de Óscar Hernández debajo.
0 comentarios
Nadie ha publicado ningún comentario aún. ¡Se tu la primera persona!