6 errores comunes al usar pruebas de hipótesis clásicas

6 errores comunes al usar pruebas de hipótesis clásicas

sep´17 Rosana Ferrero 4 comentarios

La mayoría de investigadores usan pruebas de hipótesis clásicas como la t de Student, ANOVA o regresión, sin comprobar si se cumplen sus supuestos clave. Esto puede llevar a conclusiones erróneas. Hoy te mostramos los errores más comunes y cómo evitarlos con métodos estadísticos robustos.

PROBLEMAS DE LAS PRUEBAS MÉTRICAS CLÁSICAS

Revisemos los principales problemas de los métodos paramétricos clásicos para entender su importancia.

  • Los datos reales suelen ser multimodales, asimétricos y con largas colas en su distribución de valores, por lo que raramente son normales.
  • La igualdad de varianza poblacional (i.e. homogeneidad de varianza u homocedasticidad) suele no cumplirse, debido a la naturaleza de los diseños experimentales y de las muestras.
  • Variabilidad inherente a los datos. Los grupos definidos por un factor pre-existente pueden tener varianzas diferentes. Por ejemplo, la respuesta a un test cognitivo es más variable en personas mayores que en los jóvenes. También puede ocurrir que una variable experimental cause diferencias en la variabilidad entre grupos. Por ejemplo, la respuesta de los sujetos ante un nuevo fármaco pueden generar gran variabilidad en el grupo experimental, mientras que el grupo control tendrá una respuesta bastante homogénea; aún cuando en el pre-test los grupos fueran homogéneos en su respuesta.

El incumplimiento de la normalidad y homogeneidad de varianza puede tener gran influencia en los resultados de las pruebas paramétricas clásicas, en particular en las probabilidades de error tipo I y tipo II.

  • El error tipo I ocurre cuando falsamente se rechaza la hipótesis nula (i.e. concluimos que existe un efecto cuando realmente no ocurre). El nivel de confianza (1-alfa) es la probabilidad de no cometer el error tipo I.
  • El error tipo II ocurre cuando la hipótesis nula no es rechazada aún cuando a pesar de que es falsa (i.e. concluimos falsamente que no existe efecto). La potencia (1-beta) de una prueba es la probabilidad de que el error tipo II no ocurra.

ERRORES COMUNES AL APLICAR PRUEBAS DE HIPÓTESIS CLÁSICAS

Estos son los 6 errores más comunes que cometen los investigadores al usar las pruebas de hipótesis clásicas:

1. No comprobar los supuestos básicos

Por olvido o por desconocimiento. Además, softwares como el SPSS no son muy útiles para ello. Por ejemplo, cuando los tamaños muestrales son pequeños, el test de Levene para la homogeneidad de varianza, puede dar resultados engañosos pero no es fácil encontrar alternativas en SPSS. También, las pruebas para corroborar los supuestos tienen sus propios supuestos. Las pruebas de normalidad asumen homocedasticidad, y las pruebas de homocedasticidad asumen normalidad.

No se debemos utilizar solamente pruebas estadísticas para corroborar los supuestos, tendremos que ayudarnos con gráficos para determinar qué ocurre con nuestros datos.

2. Confiar en que las pruebas clásicas son "resistentes"

Se suele decir que las pruebas paramétricas clásicas son resistentes a las variaciones en los supuestos de normalidad y homocedasticidad, negando así la necesidad de utilizar procedimientos alternativos. Sin embargo, esta afirmación se basa en estudios que solo analizan el impacto de pequeñas desviaciones de la normalidad y homocedasticidad, no en grandes desviaciones que son las más frecuentes en los datos reales. Incluso estos estudios suelen analizar dichos supuestos de manera aislada cuando en la práctica los dos supuestos se incumplen al mismo tiempo.

Las pruebas paramétricas clásicas son resistentes solo en un número limitado de circunstancias, no para la mayoría de ellas. Además, aún si un investigador insiste en que las pruebas clásicas son resistentes, debemos recordarle que las pruebas robustas son más potentes.

3. Aplicar mal las transformaciones de datos

Algunos investigadores suelen optar por transformar sus datos para cumplir los supuestos clásicos. Sin embargo, las transformaciones son problemáticas: i) a menudo fallan en conseguir la normalidad y homocedasticidad, ii) no se ocupan de los outliers, iii) pueden reducir la potencia, iv) dificultan la interpretación de los resultados ya que los hallazgos se basan en la transformación, no en los datos originales. Recomendamos utilizar los métodos robustos en lugar de utilizar los métodos clásicos con datos transformados.

4. Mal uso de pruebas no paramétricas

Estas pruebas no son robustas ante la hetorocedasticidad, y solo son útiles para análisis simples (a no ser que se incluyan técnicas de remuestreo o bootstrap).

5. Pensar que los métodos robustos no están disponibles

Como no están disponibles de manera sencilla en los softwares más comerciales (SPSS, SAS, etc.) no los uso. ¡Error! Ya existen complementos en estos programas y además están disponibles en softwares gratuitos y avanzados como R.

6. Creer que los métodos robustos "descartan datos importantes"

Vale, entiendo que sea contraintuitivo que las pruebas más precisas sean aquellas que eliminan información (outliers). Por ello hay que ser cuidadosos en evaluar primero a qué se debe la presencia de casos atípicos, pero si su presencia no se explica por otras variables no consideradas, tiene sentido aplicar técnicas robustas para disminuir su influencia en nuestros resultados.

¿QUÉ HACER CUANDO LOS CLÁSICOS FALLAN?

En muchas ocasiones no se cumplen los supuestos de la estadística clásica (normalidad y homocedasticidad) y por ende, las técnicas paramétricas no nos son útiles. En estos casos tenemos 3 posibles soluciones:

  • la transformación de los datos, de tal manera de que sigan una distribución normal y/o homocedástica.
  • Esta opción no siempre es útil ya que, por ejemplo, la nueva variable transformada puede no ser sencilla de interpretar; además, no solucionan los problemas de outliers, pueden reducir la potencia estadística, etc..
  • utilizar pruebas no paramétricas
  • Esta es una buena alternativa ya que las pruebas no paramétricas no se basan en ninguna suposición en cuanto la distribución de los datos (normalidad; pero sí sigue asumiendo homocedasticidad).
  • utilizar pruebas robustas.
  • Son similares a las paramétricas pero resistentes a la presencia de datos extremos, y son estables respecto a pequeñas desviaciones del modelo paramédico asumido (desviaciones de la normalidad y homocedasticidad).

Este texto es una adaptación del artículo:Erceg-Hurn, D. M., & Mirosevich, V. M. (2008). Modern robust statistical methods: an easy way to maximize the accuracy and power of your research. American Psychologist, 63(7), 591.

4 comentarios

Información Básica sobre Protección de datos. Responsable: Máxima Formación, S.L. Finalidad: Enviar la información solicitada. Legitimación: Consentimiento del interesado. Destinatarios: No se comunicarán datos a terceros. Derechos: Acceso, rectificación o supresión, oposición, así como otros derechos. Más información: política de privacidad.

¹ Todos los campos son obligatorios.
² Tu correo electrónico no será publicado.

  • En realidad es mejor abandonar el uso de p, existen alternativas [[https://www.tandfonline.com/doi/full/10.1080/00031305.2016.1154108]]

    Responder

    Daniel 20 de enero de 2022, 12:58

    • Gracias Daniel por tu comentario! Bueno, hay una gran discusión al respecto, yo creo que no hay que abusar de ellos pero no es necesario abandonarlos. Te invito a leer este artículo de Daniel Lakens del 2021 https://journals.sagepub.com/doi/10.1177/1745691620958012, dice «la mejor alternativa al p-valor es utilizarlo correctamente».
      Saludos

      Responder

      Rosana Ferrero 20 de enero de 2022, 17:35

  • Hola:
    Muy buen resumen/extracción de una reflexión que hace muchísima falta en investigación. He percibido una especie de obsesión con las pruebas paramétricas (más que con las clásicas) y con ciertos paquetes estadísticos de meter datos y sacar resultados como si fuesen churros (paquetes carísimos algunos, será que tienen caché) muy venerados (paquetes y/o cierto tipo de tests «clásicos») por no pocos asesores de universidades o incluso de unidades de investigación, que cuando reciben una tesis o TFG o TFM critican el no haber usado pruebas paramétricas o el SPSS, sin preguntar ni tan siquiera por los supuestos o plantear alternativas. ¿Tienes algún post en el que saques a colación algo más sobre estas pruebas robustas? Lástima que en lo que respecta a R tenga pendiente un curso que quise hacer hace unos años. Gracias por el artículo.

    Responder

    ROSA ANA DULANTO BANDA 30 de junio de 2022, 21:30

Te llamamos

Introduce los siguientes datos y nos pondremos en contacto contigo para atender tus dudas sin compromiso.

Responsable: Máxima Formación, S.L.U., finalidad: Dar respuesta a las solicitudes de información legitimación: consentimiento del interesado, destinatarios: no se comunicarán datos a terceros, derechos: Acceder, rectificar y suprimir los datos, así como otros derechos, como se explica en la información adicional. Política de privacidad

Te llamamos

Muchas gracias por solicitar información.
Te contactaremos lo antes posible.

Diseño web: Albin Soft.