5 consejos para evitar problemas en modelos de regresión
Sigue estos 5 consejos para no cometer errores en los modelos de regresión lineal.
Los modelos de regresión lineal permiten dar explicación a la relación que existe entre una variable dependiente o predictora y un conjunto de variables independientes o explicativas, ambas cuantitativas.
Contenidos
- Consejo 1: revisa la literatura antes de comenzar
- Consejo 2: crea un modelo simple siempre que sea posible
- Consejo 3: la correlación no implica causalidad
- Consejo 4: Incluye gráficos, intervalos de confianza y predicción
- Consejo 5: Verifica los gráficos de residuos
Consejo 1: revisa la literatura antes de comenzar
Este paso te permitirá, obtener los datos adecuados para tú análisis y desarrollar una mejor comprensión de:
- Las variables relevantes.
- Sus relaciones.
- Los signos de coeficientes.
- Las magnitudes de los efectos esperados.
En la era del Big Data es tentador probar todas las variables predictoras/explicativas que tienes para seleccionar el modelo de regresión adecuado, pero esto puede crear graves problemas, porque puedes obtener un modelo engañoso, con variables significativas y un buen R cuadrado, pero con relaciones que se dan simplemente por azar.
(…) quizás la fuente de error más grave radica en permitir que los procedimientos estadísticos tomen decisiones por usted (…) No se apresure a encender la computadora. Pasar por alto el cerebro para calcular por reflejo es una receta segura para el desastre
Good and Hardin, Common Errors in Statistics (and How to Avoid Them), p.3, p.152)
Consejo 2: crea un modelo simple siempre que sea posible
La simplificación produce modelos más precisos y más fáciles de entender y explicar.
Comienza con un modelo simple y añádele complejidad solo cuando sea realmente necesario, por ejemplo:
- Cuando la evaluación del modelo mediante los residuos te lo indique,
- o cuando la capacidad de predecir del modelo resulte insuficiente para tus objetivos.
Y cuando tengas varios modelos con capacidades predictivas similares, selecciona el más sencillo y parsimonioso.
El sobreajuste reduce la generalización y produce resultados no confiables.
Consejo 3: la correlación no implica causalidad
Las variables significativas en un modelo de regresión solo revelan correlación. La causalidad es un asunto completamente diferente. Por lo general, para establecer la causalidad, debe desarrollar y aplicar un experimento diseñado con aleatorización.
Sin embargo, la correlación puede ayudarnos a predecir el resultado, pero no siempre necesita variables que tengan relaciones causales con la variable respuesta.
Consejo 4: Incluye gráficos, intervalos de confianza y predicción
Incluir gráficos, intervalos de confianza y predicción te ayudará a encontrar las interpretaciones correctas del modelo y a comunicar mejor tus resultados.
Para comprender este punto te recomiendo consultar «el cuarteto de Anscombe» en honor al estadístico Anscombe que en los años 70 creó 4 conjuntos de datos para convencer a sus colegas de la importancia del análisis gráfico de los datos.
¡Realizar gráficos apropiados es parte esencial del análisis de datos!
Consejo 5: Verifica los gráficos de residuos
Los gráficos de residuos son una forma sencilla y eficaz para verificar si tu modelo de regresión presenta problemas, y también cómo mejorarlos.
En los modelos de regresión lineal, los coeficientes de regresión estimados y los valores predichos pueden ser difíciles de interpretar. Si los predictores están correlacionados, la magnitud e incluso el signo de los coeficientes de regresión estimados pueden ser muy variables, aunque los valores predichos sean estables. Cuando hay valores atípicos, tanto los coeficientes de regresión estimados como los valores predichos pueden verse afectados.
Si te interesa ampliar este punto, te recomendamos consultar el artículo Diagnóstico de regresión de Naomi Altman y Martin Krzywinski, en el que se analizan los diagnósticos de la robustez de las estimaciones y de la inferencia estadística
Esperamos que estos consejos de análisis de regresión te hayan resultado útiles!
¿Tienes alguno para compartir? Déjanos un comentario.