5 consejos para evitar problemas en modelos de regresión

5 consejos para evitar problemas en modelos de regresión

nov´20 Mario Rocafull 0 comentarios

Sigue estos 5 consejos para no cometer errores en los modelos de regresión lineal.

Los modelos de regresión lineal permiten dar explicación a la relación que existe entre una variable dependiente o predictora y un conjunto de variables independientes o explicativas, ambas cuantitativas.

Contenidos

Consejo 1: revisa la literatura antes de comenzarad

Este paso te permitirá, obtener los datos adecuados para tú análisis y desarrollar una mejor comprensión de:

  • Las variables relevantes.
  • Sus relaciones.
  • Los signos de coeficientes.
  • Las magnitudes de los efectos esperados.

En la era del Big Data es tentador probar todas las variables predictoras/explicativas que tienes para seleccionar el modelo de regresión adecuado, pero esto puede crear graves problemas, porque puedes obtener un modelo engañoso, con variables significativas y un buen R cuadrado, pero con relaciones que se dan simplemente por azar.

(…) quizás la fuente de error más grave radica en permitir que los procedimientos estadísticos tomen decisiones por usted (…) No se apresure a encender la computadora. Pasar por alto el cerebro para calcular por reflejo es una receta segura para el desastre

Good and Hardin, Common Errors in Statistics (and How to Avoid Them), p.3, p.152)

Consejo 2: crea un modelo simple siempre que sea posible

La simplificación produce modelos más precisos y más fáciles de entender y explicar.

Comienza con un modelo simple y añádele complejidad solo cuando sea realmente necesario, por ejemplo:

  • Cuando la evaluación del modelo mediante los residuos te lo indique,
  • o cuando la capacidad de predecir del modelo resulte insuficiente para tus objetivos.

Y cuando tengas varios modelos con capacidades predictivas similares, selecciona el más sencillo y parsimonioso.

El sobreajuste reduce la generalización y produce resultados no confiables.

Consejo 3: la correlación no implica causalidad

Las variables significativas en un modelo de regresión solo revelan correlación. La causalidad es un asunto completamente diferente. Por lo general, para establecer la causalidad, debe desarrollar y aplicar un experimento diseñado con aleatorización.

Sin embargo, la correlación puede ayudarnos a predecir el resultado, pero no siempre necesita variables que tengan relaciones causales con la variable respuesta.

Consejo 4: Incluye gráficos, intervalos de confianza y predicción

Incluir gráficos, intervalos de confianza y predicción te ayudará a encontrar las interpretaciones correctas del modelo y a comunicar mejor tus resultados.

Para comprender este punto te recomiendo consultar «el cuarteto de Anscombe» en honor al estadístico Anscombe que en los años 70 creó 4 conjuntos de datos para convencer a sus colegas de la importancia del análisis gráfico de los datos.

¡Realizar gráficos apropiados es parte esencial del análisis de datos!

Consejo 5: Verifica los gráficos de residuos

Los gráficos de residuos son una forma sencilla y eficaz para verificar si tu modelo de regresión presenta problemas, y también cómo mejorarlos.

En los modelos de regresión lineal, los coeficientes de regresión estimados y los valores predichos pueden ser difíciles de interpretar. Si los predictores están correlacionados, la magnitud e incluso el signo de los coeficientes de regresión estimados pueden ser muy variables, aunque los valores predichos sean estables. Cuando hay valores atípicos, tanto los coeficientes de regresión estimados como los valores predichos pueden verse afectados.

Si te interesa ampliar este punto, te recomendamos consultar el artículo Diagnóstico de regresión de Naomi Altman y Martin Krzywinski, en el que se analizan los diagnósticos de la robustez de las estimaciones y de la inferencia estadística

Esperamos que estos consejos de análisis de regresión te hayan resultado útiles!

¿Tienes alguno para compartir? Déjanos un comentario.

En Máxima Formación utilizamos cookies propias y de terceros con finalidad analítica y publicitaria. En nuestra política de cookies te contamos cuáles usamos y cómo desactivarlas si quieres. Aceptar todas Configurar/Rechazar

Diseño web: Albin Soft.