Interpretación local en modelos de Machine Learning para la estimación del incumplimiento crediticio bajo la regulación financiera chilena
Resumen:
Busca mejorar el desempeño de los modelos de Credit Score utilizando Machine Learning (modelos de caja negra) en comparación con metodologías clásicas. Además, se enfoca en la interpretación de los atributos que determinan el incumplimiento crediticio.
Se han empleado técnicas de Machine Learning como Regresión Logística, Regresión Lasso, Árboles de Clasificación, XGBoost, Random Forest y Redes Neuronales. Las métricas de evaluación incluyeron AUC y KS.
Los modelos de caja negra han superado a los tradicionales en todas las métricas. El desafío ha sido interpretar los parámetros, para lo cual se utilizó la metodología LIME (Local Interpretable Model-agnostic Explanations).
En Chile, existen restricciones para el uso de modelos de Machine Learning en problemas de Credit Score debido a la falta de transparencia en los atributos que influyen en el incumplimiento crediticio.
H demostrado que los modelos de caja negra, interpretados localmente con LIME, pueden mejorar la clasificación crediticia y romper el paradigma de los modelos clásicos, aumentando la discriminación, predicción e interpretación.
Autora: Macarena del Pino
Director TFM: Nacho García
Fecha: 12/12/2021
Descarga el TFM
