Ratio: 5 / 5

Inicio activadoInicio activadoInicio activadoInicio activadoInicio activado
 
Elegir las pruebas estadisticas

LA GUÍA DEFINITIVA PARA ELEGIR LA PRUEBA ESTADÍSTICA QUE BUSCAS

 

En este post no voy a describir cómo se calcula o realiza cada prueba estadística, porque no es el objetivo de este post y porque eso puedes encontrarlo rápidamente en cualquier sitio web o libro. Solo quiero que tengas todo en orden, bien clasificado, para que sepas cuándo aplicar cada técnica. Si estás muy perdido y estos términos no te suenan de nada, te recomiendo que primero visites el primer capítulo de cualquier libro básico de estadística.

Aquí veremos la estadística inferencial (o técnicas explicativas) que utiliza muestras representativas de una población para comprobar la certeza de nuestras afirmaciones (llamadas hipótesis; técnicas explicativas). Esta certeza se expresa en términos de probabilidad. Si la probabilidad es alta, entonces consideraremos que la afirmación "es correcta". En caso contrario, la rechazaremos por incorrecta.

Para seleccionar la prueba estadística correcta solo tienes que hacerte dos preguntas: ¿Cuál es tu objetivo? y ¿Qué tipo de datos tienes?.

 

¿Cuál es tu objetivo?

Podemos distinguir entre dos objetivos principales para las técnicas explicativas: ASOCIAR O COMPARAR

Ambos buscan establecer relaciones (semejanzas o diferencias) entre elementos pero, a diferencia de las pruebas de asociación, la apruebas de comparación evalúan estas relaciones entre uno o varios grupos

Como ejemplo veamos las preguntas que intentan responder ambos tipos de técnicas:

ASOCIACIÓN. ¿Existe algún tipo de relación significativa entre las variables?, ¿cómo es esta relación (positiva o negativa)?, ¿qué tan fuerte es la relación (magnitud)?, ¿la relación se mantiene si controlamos la influencia de terceras variables?.

COMPARACIÓN. ¿Cuál es la media de la variable de estudio en la población?, dado un conjunto de poblaciones ¿son similares?, ¿entre cuáles de ellas hay diferencias significativas?, ¿qué variables explican esas diferencias? y ¿existen efectos de interacción en las variables explicativas?.

Si quieres profundizar aún más en la selección de las técnicas explicativas debes considerar cómo son tus muestras (independientes o relacionadas).

 

Muestras.

  • Muestras independientes: cada observación corresponde a un sujeto o caso distinto

  • Muestras relacionadas (o pareadas): tenemos varias observaciones del mismo sujeto o caso. Las muestras relacionadas aparecen en experimentos del tipo antes-depués, como por ejemplo el estudio de pacientes donde se compara los resultados antes y después de la aplicación de un tratamiento. Es decir, cada dato de una muestra tiene un homónimo en la otra con el que está relacionado, de ahí el nombre alternativo de muestras pareadas.

Ejemplos

Supongamos que se desea estudiar el efecto de un fármaco que presuntamente reduce la presión arterial. Podemos imaginar dos posibles casos:

  • Se toman 30 pacientes hipertensos al azar, se les suministra el fármaco a 15 de ellos y a los otros 15 se les aplica un placebo. Transcurrido un tiempo se miden las presiones sanguíneas de ambos grupos y se contrasta si las medias son iguales o no.

VD: presión sanguínea (numérica)

VI: grupo (categórica: tratamiento y placebo). Las dos muestras están formadas por individuos distintos, sin relación entre sí: muestras independientes.

  • Se administra el fármaco a los 30 pacientes hipertensos disponibles y se anota su presión sanguínea antes y después de la administración del mismo.

VD: presión sanguínea (numérica).

VI: tiempo (categórica: antes y después de aplicar el fármaco). En este caso los datos vienen dados por parejas (presión antes y después) y parece lógico que tales datos se encuentren relacionados entre sí: muestras relacionadas.

 

También deberás elegir entre pruebas PARAMÉTRICAS, pruebas NO PARAMÉTRICAS y pruebas ROBUSTAS.

Para ello tienes que responder a las siguientes preguntas: ¿las variables se distribuyen normalmente (distribución gaussiana)?, ¿son grupos homogéneos?. Recuerda que las pruebas paramétricas asumen normalidad y homogeneidad de varianza (homocedasticidad). 

NOTA: además la prueba paramétrica de asociación para la correlación de Pearson asume linealidad entre las variables. 

[message_box title="" type="error" close="yes|no"]"All models are wrong, but some are useful", Box (1979).[/message_box]

 

Cuando trabajas con datos reales en la mayoría de las ocasiones no se cumplen los supuestos de la estadística clásica (normalidad -distribución gaussiana- y homocedasticidad) y por ende, las técnicas paramétricas no nos son útiles. En estos casos tenemos 3 posibles soluciones:

  • la transformación de los datos, de tal manera de que sigan una distribución normal y/o homocedástica.

  • utilizar pruebas no paramétricas o

  • utilizar pruebas robustas.

La primera opción no siempre es útil ya que, por ejemplo, la nueva variable transformada puede no ser sencilla de interpretar; además, no solucionan los problemas de outliers, pueden reducir la potencia estadística, etc.. La segunda opción es una buena alternativa ya que las pruebas no paramétricas no se basan en ninguna suposición en cuanto la distribucón de los datos (normalidad; pero sí sigue asumiendo homocedasticidad). La tercera opción contempla las pruebas robustas, que son similares a las paramétricas pero resistentes a la presencia de datos extremos, y son estables respecto a pequeñas desviaciones del modelo paramédico asumido (desviaciones de la normalidad y homocedásticidad).

 

Razones para utilizar pruebas paramétricas

  • Si la distribución se aparta poco de la normalidad, y las muestras no son muy pequeñas (n>30), pueden ser válidas teniendo ciertos cuidados.

  • Si la falta de homogeneidad en cada grupo no es muy grande, existen maneras en la prueba t o en el ANOVA de incluir esta condición. Sin embargo las no paramétricas no permiten solucionar este inconveniente.

  • Generalmente tienen mayor poder estadístico que las pruebas no paramétricas. Es decir, con ellas tenemos más probabilidad de detectar un efecto significativo cuando realmente existe.

 

Razones para utilizar pruebas no paramétricas

  • Cuando tu área de estudio se representa mejor mediante la mediana (e.g. para distribuciones asimétricas). Cuando la distribución de frecuencias de los datos es muy asimétrica, la media se ve muy afectada mientras que la mediana refleja mejor la centralidad de la distribución.

  • Cuando tienes un tamaño muestral pequeño. Cuando tenemos pocos datos las pruebas de normalidad pierden poder estadístico y no estamos seguros del tipo de distribución de los datos. Sin embargo, para realizar pruebas no paramétricas el tamaño muestral tampoco debe ser muy pequeño.

  • Cuando analizamos datos ordinales o de rango. Las pruebas paramétricas sirven para analizar datos de escala y sus resultados se ven muy afectados por la presencia de outliers. Aunque a veces la interpretación de los rangos medios puede ser difícil.

 

Razones para utilizar pruebas robustas

  • Son estables respecto a pequeñas desviaciones del modelo paramétrico asumido (normalidad y homocedasticidad). A diferencia de los procedimientos no paramétricos, los procedimientos estadísticos robustos no tratan de comportarse necesariamente bien para una amplia clase de modelos, pero son de alguna manera óptimos en un entorno de cierta distribución de probabilidad, por ejemplo, normal.

  • Solucionan los problemas de influencia de los outliers.

  • Son más potentes que las pruebas paramétricas y no paramétricas cuando los datos no son normales y/o no son homocedásticos.

Los métodos robustos modernos son diseñados para obtener un buen desempeño cuando los supuestos clásicos se cumplen y también cuando se incumplen. Por lo tanto, hay poco que perder y mucho que ganar a la hora de utilizar estas técnicas en lugar de las clásicas.

 

¿Qué tipo de datos tienes?

La otra cuestión que debes considerar es el tipo de variables quieres asociar o comparar. Seguro que tienes claro cuáles son los tipos de variables, así comienzan el 99% de los cursos de estadística de grado, pero hagamos un pequeño repaso para desempolvar estos conceptos. 

Tenemos variables categóricas, que son de dos tipos: las llamadas variables nominales (que son categorías sin orden) como el sexo; y las variables ordinales (que sí representan un orden), como el nivel de estudios. Recuerda que las variables nominales pueden ser binarias o dicotómicas (e.g. fumador/no fumador, enfermo/sano).

Por otra parte tenemos las variables numéricas, que pueden ser discretas si vienen dadas por números enteros, como el número de hijos, o continuas como el peso que se representa por números reales. 

 

Seleccionar la prueba estadística

La figura siguiente indica a grosso modo el camino a seguir mediante un mapa de las técnicas más usuales de asociación y comparación. 

tecnicas estadisticas

 

Resumiendo, estos son los principales pasos a seguir en la selección de la técnica explicativa correcta:

  1. Escribir claramente el objetivo de análisis (asociación o comparación)

  2. ¿Qué tipo de variables tengo?  

  3. Si el objetivo es comparar, ¿son muestras independientes o relacionadas?

  4. ¿Se pueden aplicar técnicas paramétricas? Analizar los supuestos: 

    • Normalidad. 

    • Homogeneidad de varianza.

    • Linealidad (en caso de que sea necesario)

  1. ¿Qué prueba debo realizar? Seleccionar la prueba adecuada según el mapa que te he enseñado.

  2. ¿La asociación/comparación es estadísticamente significativa? Realizar la prueba de hipótesis.

  3. Interpretar y graficar los resultados.

    • Si estamos asociando nos preguntaremos ¿cómo es esta relación? ¿qué tan fuerte es?

    • Si estamos comparando nos preguntaremos ¿entre qué grupos/muestras? 

      • Si son 2 grupos/muestras realizar estadísticos descriptivos y/o gráficos para decidir.

      • Si son más de 2 grupos/muestras realizar comparaciones múltiples pareadas post hoc y en aquellos pares de variables significativamente distintos realizar estadísticos descriptivos y/o gráficos para decidir.

¿Qué te parece nuestro mapa para la selección de técnicas estadísticas? ¿te ha sido útil?

Comentarios (0)

Rated 0 out of 5 based on 0 votes
There are no comments posted here yet

Deja tus comentarios

Posting comment as a guest.
Archivos adjuntos (0 / 3)
Share Your Location
Escribe el texto que se muestra en la siguiente imagen. ¿No lo ves claro?