¿Cómo encontrar la prueba de hipótesis que buscas?
Este esquema no es una receta de cocina, recuerda pensar primero en la pregunta de investigación, en el diseño del estudio, en el contexto y mantener el pensamiento crítico.
Recuerda: "No hay preguntas estadísticas de rutina. Solo rutinas estadísticas cuestionables" - Hammersley
En este post veremos cómo elegir la prueba de hipótesis estadística que puedes aplicar a tus datos. Las estadística inferencial incluye técnicas explicativas que utilizan muestras representativas de una población para evaluar la evidencia en contra de nuestras afirmaciones (llamadas hipótesis). La evidencia se expresa en términos de incertidumbre. Comprender cuánto pueden diferir nuestros resultados si volvemos a realizar el estudio con otra muestra, o cuán inciertos son nuestros hallazgos, nos permite tener en cuenta esta incertidumbre al sacar conclusiones. Nos permite, por ejemplo, nos permite hacer afirmaciones sobre si nuestro estudio proporciona evidencia para rechazar una hipótesis. La idea es sencilla, ¿verdad? El problema muchas veces viene en el momento en el que queremos seleccionar la prueba estadística correcta.
No podemos reducir el pensamiento estadístico a una simple tabla de consulta sin una cuidadosa consideración del diseño y muchos otros temas. Este esquema está pensado para aquellos que ya han realizado algún curso de introducción a la inferencia estadística y quieren un esquema (incompleto pero sencillo) de las principales pruebas de hipótesis que se pueden encontrar.
Para ponértelo fácil lo resumo en tan solo dos preguntas: ¿Cuál es tu objetivo? y ¿Qué tipo de datos tienes?.Y... ¡al final de este post incluyo las funciones que debes usar en R para llevar a cabo cada análisis!
ÚLTIMAS PLAZAS EN MASTERS
Máster Data Science
CONVOCATORIA ABIERTA I Logra la máxima precisión y rigor en tus proyectos de Ciencia de Datos.
Ver convocatorias 2022MAster en MAchine learning
CONVOCATORIA ABIERTA | Automatiza procesos y crea tus propios algoritmos de Machine Learning.
Ver convocatorias 2022El camino a seguir
La siguiente figura indica a grosso modo el camino a seguir mediante un mapa de las técnicas usuales de asociación y comparación.
Veamos paso a paso qué decisiones tienes que tomar.
1. ¿Cuál es tu objetivo?
Asociar o comparar
Podemos distinguir entre dos objetivos principales para las técnicas explicativas: ASOCIAR O COMPARAR. Ambos buscan establecer relaciones (semejanzas o diferencias) entre elementos pero, a diferencia de las pruebas de asociación, las pruebas de comparación evalúan estas relaciones entre uno o varios grupos. Veamos un par de ejemplos para identificar el tipo de preguntas que intentan responder ambos tipos de técnicas:
- ASOCIACIÓN. ¿Existe algún tipo de relación significativa entre las variables?, ¿cómo es esta relación (positiva o negativa)?, ¿qué tan fuerte es la relación (magnitud)?, ¿la relación se mantiene si controlamos la influencia de terceras variables?.
- COMPARACIÓN. ¿Cuál es el promedio/variabilidad de la variable de estudio en la población?, dado un conjunto de poblaciones ¿son similares?, ¿entre cuáles de ellas hay diferencias significativas?, ¿qué variables explican esas diferencias? y ¿existe interacción entre las variables explicativas?.
Si quieres profundizar aún más en la selección de las técnicas explicativas debes considerar cómo son tus muestras (independientes o relacionadas).
¿Qué tipo de muestras tienes?
También debes saber distinguir cómo son tus muestras:
- Muestras independientes: cada observación corresponde a un sujeto o caso distinto.
- Muestras relacionadas (o pareadas): tenemos varias observaciones del mismo sujeto o caso. Las muestras relacionadas aparecen en experimentos del tipo antes-depués, como por ejemplo el estudio de pacientes donde se comparan los resultados antes y después de la aplicación de un tratamiento.
Ejemplo. Imaginemos que queremos estudiar el efecto de un fármaco que presuntamente reduce la presión arterial. El problema puede estar planteado de dos maneras distintas según se consideren muestras relacionadas o independientes:
- Se toman 30 pacientes hipertensos al azar, se les suministra elfármaco a 15 de ellos y a los otros 15 se les aplica un placebo.Transcurrido un tiempo se miden las presiones sanguíneas deambos grupos y se contrasta si las medias son iguales o no.
- variable respuesta: presión sanguínea (numérica)
- variable explicativa: grupo (categórica: tratamiento y placebo). Las dos muestras están formadas por individuos distintos, sin relación entre sí: muestras independientes.
- Se administra el fármaco a los 30 pacientes hipertensosdisponibles y se anota su presión sanguínea antes y despuésde la administración del mismo.
- variable repuesta: presión sanguínea (numérica).
- variable explicativa: tiempo (categórica: antes y después de aplicar el fármaco). En este caso los datos vienen dados por parejas (presión antes y después) por lo cual los datos están relacionados entre sí: muestras relacionadas.
2. ¿Qué tipo de datos tienes?
¿Cómo son tus variables?
Seguro que tienes claro cuáles son los tipos de variables, así comienzan el 99% de los cursos de estadística de grado, pero hagamos un pequeño repaso para desempolvar estos conceptos.
Tenemos variables categóricas, que son de dos tipos: las llamadasvariables nominales (que son categorías sin orden) como el sexo; ylas variables ordinales (que sí representan un orden), como el nivelde estudios.
Recuerda que las variables nominales pueden ser binarias o dicotómicas (e.g. fumador/no fumador, enfermo/sano).Por otra parte tenemos las variables numéricas, que pueden ser discretas si vienen dadas por números enteros, como el número de hijos, o continuas como el peso que se representa por números reales.
¿Se cumplen los supuestos clásicos?
En segundo lugar debes corroborar si tus datos cumplen o no con los supuestos de las pruebas estadísticas clásicas (normalidad, homogeneidad, independencia). Esto te permitirá elegir entre pruebas PARAMÉTRICAS, pruebas NO PARAMÉTRICASy pruebas ROBUSTAS. Para ello tienes que responder a las siguientes preguntas: ¿las variables se distribuyen según la curva normal (gaussiana)?, ¿los son grupos tienen dispersión similar (son homogéneos)?, "All models are wrong, but some are useful ", Box (1979).Cuando trabajas con datos reales en la mayoría de las ocasiones no se cumplen los supuestos de la estadística clásica.En estos casos las técnicas paramétricas no nos demasiado útiles; pero como mencionamos en la entrada anterior (ver AQUÍ) tenemos 3 posibles soluciones:
- la transformación de los datos, cuando los datos no siguen una distribución normal o queremos disminuir su variabilidad.
- utilizar las pruebas no paramétricas cuando los datos no siguen una distribución normal
- utilizar las pruebas robustas cuando tienes datos atípicos.
Razones para utilizar pruebas paramétricas
- Si la distribución se aparta poco de la normalidad, y las muestras no son muy pequeñas (n>30), pueden ser válidas teniendo ciertos cuidados.
- Si la falta de homogeneidad de varianza en cada grupo no es muy grande, existen maneras en la prueba t o en el ANOVA de incluir esta condición. Sin embargo las no paramétricas no permiten solucionar este inconveniente.
- Generalmente tienen mayor poder estadístico que laspruebas no paramétricas. Es decir, con ellas tenemos más probabilidad de detectar un efecto significativo cuando realmente existe.
Razones para utilizar pruebas no paramétricas
- Si puedes utilizar contrastes que solo necesiten establecer supuestos poco exigentes (como simetría o continuidad) o quieres analizar las propiedades nominales u ordinales de losdatos.
Ten en cuenta que muchas de estas pruebas utilizan la mediana en lugar de la media para sus cálculos.Cuando la distribución de frecuencias de los datos es muyasimétrica, la media se ve muy afectadamientras que la mediana refleja mejor la centralidad de la distribución.
- Cuando tienes un tamaño muestral pequeño.
Cuando tenemos pocos datos las pruebas de normalidad pierden poder estadístico y no estamos seguros del tipo de distribución de losdatos. Sin embargo, para realizar pruebas no paramétricas el tamaño muestral tampoco debe ser muy pequeño.
- Cuando analizamos datos ordinales o de rango.
Las pruebas paramétricas sirven para analizar datos de escala y sus resultados se ven muy afectados por la presencia de outliers. Aunque a veces la interpretación de los rangos medios puede ser difícil.
Razones para utilizar pruebas robustas
- Son estables respecto a pequeñas desviaciones delmodelo paramétrico asumido (normalidad yhomocedasticidad).
A diferencia de los procedimientos no paramétricos, los procedimientos estadísticos robustos no tratan de comportarse necesariamente bien para una amplia clase de modelos, pero son de alguna manera óptimos en un entorno de cierta distribución de probabilidad, por ejemplo, normal.
- Solucionan los problemas de influencia de los outliers.
- Son más potentes que las pruebas paramétricas y noparamétricas cuando los datos no son normales y/o no sonhomocedásticos.
- Los métodos robustos modernos son diseñados para obtener un buen desempeño cuando los supuestos clásicos se cumplen y también cuando se incumplen. Por lo tanto, haypoco que perder y mucho que ganar a la hora de utilizar estastécnicas en lugar de las clásicas.
Manos a la obra... aplicación en el Software R
Lo prometido es deuda, aquí tienes el resumen de las funciones que debes utilizar en R para realizar cada tipo de prueba.
Pasos finales
Potencia estadística
No te quedes solo con el resultado de la prueba estadística (p-valor), analiza si realmente puedes confiar en los resultados. Cuando mis resultados no son significativos, ¿realmente no existe un efecto o es que el estudio no fue capaz de detectarlo? O, por el contrario, cuando tengo resultados significativos ¿son realmente tan positivos o es que el experimento sobreestima los efectos del tratamiento?
Esto te lo dirá la potencia estadística.
Tamaño del efecto
Explica el significado real (práctico) de los resultados de tu investigación. Es esencial que interpretemos no sólo la significación estadística de los resultados (el ya archiconocido p-valor), sino también su significación práctica o real.
Revisa el post de tamaño de efecto para saber cómo actuar.
Gráficos
Resumiendo, que es gerundio
Estos son los principales pasos a seguir en la selección de la técnica explicativa correcta:
- Escribir claramente el objetivo de análisis (asociación o comparación)
- ¿Qué tipo de variables tengo?
- ¿Son muestras independientes o relacionadas?
- ¿Se pueden aplicar técnicas paramétricas? Analizar los supuestos:
- Normalidad.
- Homogeneidad de varianza.
- Linealidad (en caso de que sea necesario).
- ¿Qué prueba debo realizar? Seleccionar la prueba adecuada según el mapa que te he enseñado.
- ¿La asociación/comparación es estadísticamente significativa? Realizar la prueba de hipótesis.
- Interpretar y graficar los resultados.
- Si estamos asociando nos preguntaremos ¿cómo es esta relación? ¿qué tan fuerte es?
- Si estamos comparando nos preguntaremos ¿entre qué grupos/muestras?
- Si son 2 grupos/muestras realizar estadísticos descriptivos y/o gráficos para decidir.
- Si son más de 2 grupos/muestras realizar comparaciones múltiples pareadas post hoc y en aquellos pares de variables significativamente distintos realizar estadísticos descriptivos y/o gráficos para decidir.
Espero que este post te sea útil ¡y ya no tengas dudas a la hora de elegir tus pruebas!Saludos.
686 comentarios
Buenas tardes, tengo una consulta.
En un proyecto de investigación en una laguna, he planteado 3 variables : ph como variable dependiente ,DBO y oxigeno disuelto como variable independientes con el fin de enconotrar la relacion o correlacion entre estas. Sin embargo revisando la DATA de la DBO encuentro muchos valores inconcistentes o irregulares . En que medida puedo desarrollar y/o explicar esta limitacion de la DBO. Que metodo me corresponderia usar.
Carmen 4 de diciembre de 2022, 22:02
Hola, desde luego una infrmación estupenda, pero aún así me quedan dudas. Tengo un unico grupo, de que solo he tomado loa datos una vez, pero para tres condiciones diferentes, (sonrisa, tristeza, neutra), y para colmo la n=38, con lo cual es muy pequeñita, estoy perdidísima….
Verónica 29 de diciembre de 2022, 07:42
Hola muchas gracias por toda esta informacion. Quiero plantear la siguiente pregunta:
Resulta que en Kenia hay unos leones que estan atacando a los coches de turistas qye se acercan a hacerles fotos.
Yo divido a esta poblacion de 41 leones en 6 grupos:
1- cachorros y juveniles hembra
2. cachorros y juveniles macho
3. adolescentes hembra
4. adolescentes macho
5. adultos hembra
6. adultos macho
cada grupo tiene un numero distinto de individuos
cada grupo ademas tiene un numero distinto de individuos q atacan- ademas en algunos grupos no hay ataques
mi hipotesis nula dice que no hay ninguna diferencia entre estos grupos a la hora de atacar, es decir que todos atacan por igual
q test me recomiendan para aprobar o rechazar dicha hipotesis? y si la rechazo q otro test para demostrar que hay grupos que atacan mas que otos
finalmente si yo se de antemano que el grupo q mas ataca (casi monopoliza los ataques) son los los machos adolescentes que test me permitiria decir:
«Ser macho y adolescente son los mejores predictores para saber q un leon va a atacar a un coche de turista»
muchas gracias
Manu 26 de enero de 2023, 18:32
Hola!
Mi consulta es la siguiente:
Quiero caracterizar un cierto evento (numero de antenciones que realiza un profesional de salud) durante un rango de años. En mi base de datos, tengo el total de atenciones que realiza segun cada año (ej, 2015: 2354, 2016 4123, 2017: 2456, etc hasta el 2022).
¿Debo considerar que cada año es un grupo, por ende 8 grupos, o solo es un grupo(por ser un evento) que varia segun el año? Frente a la forma adecuada de analizar lo anterior, ¿que analisis/pruebas corresponderian?
Jorge 15 de febrero de 2023, 14:03
Hola. tenemos un problema en un laboratorio de urgencias de un htal con la rotacion de los profesionales. Somos 8 profesionales para repartir en 7 dias de la semana. Manteniendo dia fijo de lunes a vier para 5 de ellos.
como lo resuelvo?.
Gracias.
Fernanda 18 de febrero de 2023, 21:48
Hola que estadísticas aplicaría para un estudio correlacional
Relación entre clima organizacional y desempeño laboral.
Liz 10 de septiembre de 2023, 17:44
Al rechazar la H1 cometemos un error tipo II- ¿A que hace referencia este error?
ERICK 23 de noviembre de 2023, 02:45
hola . necesito ayuda en conocer que tipo de prueba estadistica pudiera utilizar. tengo 100 pacientes con glaucoma absoluto y voy a crear tres grupos , un grupo tratamiento con crioterapia, el otro con inyeccion retrobulbar de clorpromacina, el otros con ciclofotocoagulacion . variables a utilizar sexo, edad, dolor antes y despues, tension ocular antes y despues del tratamiento
gracias, uso de colirios hipotensores antes y despues y complicaciones de cada proceder quirurgico
juan carlos 22 de enero de 2024, 03:52
Primero que todo, quisiera felicitarte, pues se nota que le pones pasión a tu trabajo y que te gusta enseñar; muchas gracias!
Estimado, quisiera consultarle por consejo para elegir una prueba estadística para evaluar correlación:
Verá, estoy evaluando el performance deportivo de algunos jugadores de un deporte con respecto a una medición de un cuestionario validado que evalúa el grado de actividad física que los deportistas hacen.
La idea del estudio es evaluar qué tanto influye el nivel de actividad realizado y el performance en dicho deporte.
a) El performance es una variable cuantitativa continua, la cual ya tenemos como medirlo, pero no sabemos como abordar la correlación
b) El grado de actividad física tiene 2 posibilidades de plantearse
b.i.) Cantidad de energía gastada en actividad física en una semana (en METS/semana; unidad de medida cuantitativa continua)
b.ii.) Clasificación de cantidad física que realizan los deportistas derivada de la cantidad de METS semanales que los deportistas hacen (baja, media y alta).
La distribución en METS nos arrojó una distribución no normal, pero quisiera preguntarte
Qué tipo de prueba podemos utilizar para evaluar la correlación entre
a) Performance (cuantitativo continuo) y cantidad de METS (cuantitativa continua) con distribución no normal. Pensaba utilizar spearman, pero no estoy seguro si es la mejor o si mi planteamiento es acertado
y b) Entre Perormance (cuantitativo continuo) y variable ordinal (baja, media y alta). Desconozco cómo plantearlo.
cualquier respuesta se la agradezco enormemente y de antemano, muchas gracias por su trabajo!
Karl 15 de abril de 2024, 16:47
Gracias Karl por tus amables palabras.
Respecto a tus preguntas:
1) sí, puedes analizar la correlación enter dos variables cuantitativas continuas con distribución no normal, mediante la correlación de Spearman.
2) Cuando tienes una variable cuantitativa continua y otra ordinal, tienes varias opciones posibles según tu caso:
– Las variables ordinales son fundamentalmente categóricas, la opción más sencilla es ignorar el orden en las categorías de la variable y tratarla como nominal. Esto es válido si tiene sentido, es decir, cuando hay pocas categorías y el orden no es central para la pregunta de investigación.
– Si el orden de las categorías se fundamental para la pregunta de investigación, puedes hacer lo contrario, tratarla como numérica. Esta opción requiere que la distancia entre cada categoría sea la misma, lo cuál a veces no ocurre (e.g. escala de likert).
– Otra opción es utilizar pruebas no paramétricas que clasifican en rango los valores numéricos. Estas pruebas utilizan como información el orden, no la distancia entre valores.
– Por último, si la variable ordinal es tu respuesta, podrías utilizar modelos ordinales para regresión logística (o probit ).
Espero sea de ayuda, saludos!
Rosana Ferrero 6 de mayo de 2024, 09:43
Saludos, mi estudio es de pretest y postest con dos grupos, uno experimental y uno de control, cada uno de más de 50 participantes como muestra. Quisiera me ayudara con la estadística a aplicar en cada momento y los pasos a seguir. Estaré agradecido.
Elmys 24 de noviembre de 2024, 04:19
¡Hola! Este tipo de diseño es muy común en estudios experimentales y permite analizar el impacto de una intervención o tratamiento.
Pasos para realizar el análisis estadístico:
1. Definición de las variables:
Variable dependiente (VD): Es la variable que estás midiendo antes y después de la intervención. Puede ser, por ejemplo, una medida de salud, rendimiento académico, bienestar psicológico, etc.
Grupo: Esta variable indica a qué grupo pertenece cada participante (experimental o control).
Tiempo (pretest y postest): Se refiere a las mediciones antes y después de la intervención. Es importante tener claro que estás comparando el efecto del tiempo dentro de cada grupo, así como las diferencias entre grupos.
2. El ANOVA de dos vías mixto es una excelente opción para analizar tus datos, especialmente si tienes una variable independiente entre sujetos (como el grupo experimental vs control) y una variable independiente intra sujetos (como el pretest y postest). Este diseño es adecuado porque permite evaluar tanto los efectos principales de las variables (grupo y tiempo) como la posible interacción entre ellas.
El ANOVA de dos vías mixto analizará tres efectos:
– Efecto principal del grupo (entre sujetos): ¿El grupo experimental difiere significativamente del grupo de control en la medición final (postest)?
– Efecto principal del tiempo (dentro de sujetos): ¿Hay una diferencia significativa entre el pretest y postest en ambos grupos?
– Interacción entre el grupo y el tiempo: ¿El efecto del tiempo (pretest vs postest) varía dependiendo del grupo? Esto es clave para entender si la intervención en el grupo experimental tiene un efecto diferente al del grupo control.
3. Consideraciones finales:
– Los resultados pueden depender del tamaño de la muestra, por lo que es importante considerar el tamaño del efecto junto con los p-valores.
– Es esencial evaluar que los datos cumplan con ciertos supuestos estadísticos, ya que la validez de los resultados depende de ello.
– Evalúa el tamaño del efecto, una medida crucial para evaluar la magnitud de las diferencias encontradas entre grupos. No basta con saber si una diferencia es estadísticamente significativa; es importante conocer si esa diferencia tiene relevancia práctica en el área de estudio.
Saludos
Rosana Ferrero 25 de noviembre de 2024, 11:15