AUTORA
Rosana Ferrero
Data Scientist
Rosana Ferrero
Data Scientist
AUTOR
Juan L. López
Data Scientist
Juan L. López
Data Scientist
Esta guía es una breve introducción al ANOVA de una vía o de un factor entre-grupos, veremos cuáles son los supuestos de la prueba y cuándo debes usarla. Te mostraremos cómo realizar el ANOVA, cómo interpretar los resultados y cómo informar de ellos en formato científico.
Obtén más información de nuestro Máster de Estadística con R (XI edición)
Buenas tardes! tengo una duda sobre la posibilidad de introducir una ANOVA en un estudio en el que en principio estoy analizando la varianza sólo con la t de student, tanto para grupos relacionados (Grupo Experimental con pre y post tratamiento) y grupos separados para comparar grupo experimental de grupo control. Les explico las variables:
Se trata de medir el efecto (VI) de un tratamiento multimodal de estilo de vida saludable (en principio considerado como un bloque -y por eso la t de student) pero que en realidad está compuesto de 1) ejercicios 2) alimentación sana y 3) meditación… sobre (VD) el afrontamiento de situaciones de confinamiento (COVID19), (para lo cual evaluaré también un conjunto de indicadores: estrés, ansiedad, depresión y calidad de vida relacionada con la salud…
Mi duda son entonces:
1.- Qué otra prueba estadística emplear si quisiera valorar el efecto del tratamiento (como bloque) sobre cada síntoma (ansiedad, depresión, estrés y calidad de vida), ya que la premisa para la ANOVA debe ser que la VI tenga más de tres valores, y no la VD… ¿qué pasa entonces cuando es la dependiente, la que posee más de 1 valor? tengo que usar otra cosa que no sea t?
2.- ¿Pudo usar la ANOVA al desglosar el efecto de cada técnica de tratamiento multimodal sobre los efectos de cada síntoma del confinamiento ? es decir, ¿puedo desglosar ambas variables, VI y VD? no sé si para esto podría usar un multifactorial…
De antemano muchísimas gracias por este post porque me ha aclarado ya varias dudas, son cosas que he visto hace ya mucho tiempo y siempre me generaron dudas… Gracias a todos también por sus dudas y a ustedes por tomare el tiempo en respondernos. Un saludo!
Hola Elaisa,
te invito a que visites nuestro post: https://www.maximaformacion.es/blog-dat/guia-para-encontrar-tu-prueba-estadistica/
Ahí hemos intentado resumir los principales tipos de pruebas de hipótesis y cómo elegir cada una.
Dale un vistazo y si sigues con dudas nos vuelves a escribir.
Saludos
Sus explicaciones me han sido ayudado a aclarar el problema. Muchas gracias.
¡Gracias a ti Gladys! Nos alegra conocer vuestras experiencias. 😉
Excelente información agradezco enormemente,
Me surge una inquietud, este diseño de una vía es el mismo que se conoce como diseño completamente al azar?
Gracias a ti Rodrigo, nos alegra conocer vuestras opiniones acerca del blog ;).
El ANOVA de 1 vía o 1 factor es la herramienta estadística que se utiliza para analizar datos obtenidos por un diseño completamente al azar. Estos diseños sólo consideran dos fuentes de variación: los tratamientos y el error aleatorio.
Saludos
Hola
Muy buena la información, muy didacticos los temas
Muchas gracias
¡Gracias Juan por tu comentario!
Rosana, Juan
podrían explicar por favor (para un inexperto como yo) como se calcula el valor de p en este ejemplo que nos comparten?
de antemano muchas gracias
miguel
Hola Miguel,
en este post explicamos todos los pasos para realizar el ANOVA en R: https://www.maximaformacion.es/blog-dat/como-realizar-el-anova-de-una-via-en-r/
¡Gracias por seguirnos! Saludos
Buenas noches:
Tengo una variable dependiente «COMPETITIVIDAD» y una independiente «INNOVACIÓN», esta última compuesta por varios elementos. Quisiera calcular el ANOVA pero no me queda clara la forma de interpretar los resultados. Agradecería algún tipo de colaboración académica.
Hola José,
si quieres aprender cómo interpretar los resultados de un ANOVA en R te invito a que visites los siguientes post que hemos creado:
– para muestras independientes: https://www.maximaformacion.es/blog-dat/como-realizar-el-anova-de-una-via-en-r/
– para muestras relacionadas (medidas repetidas): https://www.maximaformacion.es/blog-dat/anova-de-medidas-repetidas-tutorial-en-rsoftware/
Saludos
Muchas gracias por compartir esta información me ha sido muy útil.
Una pregunta tengo datos de 10 años cada año con 5 subdatos es correcto aplicar el ANOVA de una vía para ver si tienen diferencia significativa?
los tengo que comparar año por año o puedo considerar cada año como un grupo diferente? y que prueba me recomiendan para post hoc.
Espero sus comentarios.
Saludos cordiales.
Hola José Luis,
espero que el post te sea de ayuda. Para datos temporales, si no tienes patrones de tendencia o peridicidad, podrías utilizar el ANOVA de medidas repetidas. Revisa los siguientes post que hemos elaborado al respecto:
https://www.maximaformacion.es/blog-dat/anova-de-medidas-repetidas-tutorial-en-rsoftware/
https://www.maximaformacion.es/blog-dat/anova-de-medidas-repetidas-tutorial-en-rsoftware/
Ahí mismo verás las técnicas de comparación múltiple post hoc.
Sobre qué es lo que «debes» comparar, depende de tus objetivos. Si lo que quieres es evaluar las diferencias entre años, pues compara los años.
Aprovecho para comentarte que 5 observaciones (datos) por año es muy poco, si puedes aumentar el número de datos mejor, sino intenta con pruebas no paramétricas o alguna otra solución (no sé si en tu caso podría tener sentido agrupar cada 2 o 5 años, no sé la problemática abordas).
¡Saludos!
Me encantó el blog. La información es muy fácil de entender y de gran ayuda!
Muchísimas gracias
¡Muchas gracias por tu comentario Yenith! Saludos
Muchas gracias por la explicación. Puedo obtener el PDF del documento?
Hola Magally, gracias a ti por tu comentario. Puedes imprimir la página en pdf, si tienes problemas me avisas y genero un enlace.
También te recomiendo visitar estos dos post prácticos de aplicación en R que he realizado:
– https://www.maximaformacion.es/blog-dat/como-realizar-el-anova-de-una-via-en-r/
– https://www.maximaformacion.es/blog-dat/anova-de-medidas-repetidas-tutorial-en-rsoftware/
Saludos
Hola. me quedo una duda… Al momento de ver si hay una diferencia significativa entre o dentro de los grupos, en que me debo fijar, entiendo que debo ver F pero no se más allá de eso? me debe dar algún resultado en especifico?
Hola Tamara,
la prueba F (tabla ANOVA) te indica si existe algún grupo donde la media de la respuesta (teniendo en cuenta la variación) es distinta al resto. Luego, para identificar exactamente entre qué grupos hay diferencias debes realizar las pruebas de comparaciones múltiples post hoc, y ayudarte con los estadísticos descriptivos para determinar qué grupo tiene mayor/menor media.
Saludos
Hola, está super bien explicado. Muchas gracias .
Aun tengo una duda: tengo dos variables, la dependiente es la preferencia alimentaria de un grupo de alimentos y mi variable independiente son los genotipos de ghrelina (AA, AG, GG) ¿puedo utilizar esta prueba para correlacionarlas si la distribución de mis datos es normal? y si no lo es ¿kruskal-wallis me sirve?
Gracias
Hola Astrid, gracias por tu comentario. ¿Cómo está medida la variable respuesta «preferencia alimentaria de un grupo de alimentos? es decir, ¿los encuestados seleccionan una opción alimenticia de varias posibles? En ese caso sería una variable categórica, al igual que la variable explicativa «genotipos de ghrelina». Cuando quieres evaluar si existe una relación (o no) entre 2 variables categóricas, puedes utilizar la prueba de independencia Chi-cuadrado. Si la variable respuesta «preferencia alimentaria de un grupo de alimentos» está medida como número de veces que el sujeto consume un determinado alimento en el año, por ejemplo, en ese caso sí sería una variable numérica y deberías compararla entre los grupos de «genotipos» mediante pruebas paramétricas (si cumple con los supuestos), no paramétricas (si no cumple los supuestos) o robustas (si tienes valores atípicos). Saludos
Excelente información, gracias!
Gracias a ti Sandra por el comentario. Nos alegra que sea de utilidad para vosotros. Saludos
Tu información fue muy útil, en verdad muchas gracias.
Hola Joel,
gracias a ti por tu comentario. Un abrazo y felices fiestas
Hola, comentas que es una mala práctica el usar barras para representar las medias en el resultado del anova, cual sería entonces la mejor alternativa?? gracias
Hola Benito,
es una buena pregunta. Utilizar diagramas de barras para representar medias es una práctica habitual pero no recomendable. Las medias no son valores acumulados sino valores puntuales, y por tanto la mejor alternativa es representarla mediante puntos. En particular, para representar los resultados del ANOVA y su comparación múltiple post hoc, lo mejor sería un gráfico con las diferencias de medias como punto y sus IC al 95%.
Lo puedes obtener en R con plot(TukeyHSD(model)).
Saludos y gracias por participar
Muchísimas gracias por tu respuesta, me estoy encantando con la estadística y tu blog es maravilloso por explicar de forma tan sencilla, tendrás alguna referencia bibliográfica al respecto de lo que me comentabas de la correcta representación de las medias (vaya que no es que no te crea sino que me gustaría profundizar jaja)
Hola Benito,
¡claro!
Algunos artículos:
https://journals.plos.org/plosbiology/article?id=10.1371/journal.pbio.1002128
https://www.nature.com/articles/nmeth.2837
https://www.nature.com/articles/nmeth.2807
http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0037-86822015000400494
Varias discusiones sobre estos temas:
https://www.researchgate.net/post/Is_it_better_to_plot_graphs_with_SD_or_SE_error_bars
https://blogs.sas.com/content/iml/2017/10/18/diffogram-multiple-comparisons-sas.html
Libro recomendado:
Multiple Comparisons Using R
Author(s): Frank Bretz, Torsten Hothorn, Peter Westfall
Publisher: Chapman and Hall/CRC, Year: 2010
ISBN: 1584885742,978-1-58488-574-0
¡Saludos y gracias por tu comentario!
Gracias muy util
¡Gracias Martha! Me alegro de que sea de ayuda 😉
Muy bueno. Gracias.
¡Gracias por tu comentario Wilfredo!
Un saludo