Rosana Ferrero
Data Scientist
Juan L. López
Data Scientist
El uso de la estadística es común en la mayoría de campos de investigación; en ciencias sociales o naturales, deportes, empresa, educación, ciencias de la información, biblioteconomía, incluso en la música y el arte.
Su popularidad se puede atribuir a que es aplicable a cualquier tipo de datos.
Si puedes medirlo puedes analizarlo mediante la estadística.
Y hasta si eres los suficientemente creativo, podrás incluso analizar cosas que no puedes medir del todo bien.
El otro día encontré un blog que me encantó, donde discutía por qué deberías aprender Estadística. Así que hoy he querido compartirlo contigo, a ver tú qué opinas. Espero que lo disfrutes.
Máster de Estadística Aplicada con R Software 8ª edición 2019 (Reserva de plaza)
Si te dedicas a las ciencias naturales probablemente conozcas algunos principios, leyes o teorías para comenzar a analizar datos. Incluso algunas de estas fueron descubiertas o verificadas por el uso de la estadística. Si te dedicas a las ciencias sociales, empresariales, economía o cualquier otro campo relacionado poco más puedes hacer que estadística. La estadística nos da un lugar por el que comenzar, al enfocarnos en la población, nos ayuda a decidir qué muestrear, y al enfocarnos en el fenómeno, nos ayuda a decidir qué medir y cómo. Establecida esta base, la estadística nos permite definir la hipótesis alternativas a evaluar y nos proporciona diferentes medios para analizar los datos.
La estadística es un gigantesco taller con tantas herramientas que jamás podrás utilizar en toda tu carrera. La estadística te permitirá describir, correlacionar, detectar diferencias, agrupar, separar, reorganizar, predecir, hacer más sencillos y modelar tus datos. Y no sólo hay una amplia variedad de herramientas para hacer diferentes cosas, tambien las hay para hacer las mismas cosas de diferente manera. ¿Queremos encontrar el centro de una distribución? Podemos usar la media aritmética, la media geométrica, la media armónica, la media recortada y winsorizada, la media ponderada, la mediana, la trimedia o la moda. Cada una tiene su uso especial como lo pueden tener los diferentes destornilladores usados por un mecánico. Con una caja de herramientas estadística, podrás tener una mayor comprensión de tus datos de la que podrás tener con otros tipos de análisis.
Cualquier tirador te dirá que no es suficiente con acertar a la diana, sino acertar en el centro exacto de la diana. Esto es con exactidud y precisión. Muchas técnicas analíticas se enfocan en la exactitud y olvidan la precisión. Pero la variabilidad, la incertidumbre y el riesgo no desaparecen por el hecho de ignorarlos. La estadística trata sobre todo de comprender la variabilidad.
La mayoría de las formas de análisis tratan de encontrar similaridades y patrones en los datos. La estadística, en particular, puede usarse para encontrar tendencias lineales, no lineales, ciclos, intervalos, anomalías, conglomerados y otras formas de agrupación. Es más, la estadística nos permite identificar y explorar casos anómalos que no se ajustan a los patrones. A veces, son esos outliers los que revelan la información más importante en un análisis.
En el análisis de datos más no es siempre mejor, no es inusual tener demasiados datos como para que tenga sentido usar solo tablas y gráficos. La estadística nos ayuda a decidir cuántas muestras necesitamos para conseguir un determinado objetivo. Nos permite juzgar las calidad de los datos y compensar la confusión creada por la variabilidad. Además nos ayuda a conocer si nuestros datos son redundantes, y dado el caso, provee diferentes formas de reorganizar los datos de forma más eficiente.
Habitualmente, te permitirá convencer a las personas que revisan tu trabajo de que tu análisis de datos es legítimo debido a que usarás procedimientos estadísticos bien reconocidos y profesionalmente aceptados. Igualmente, es más fácil usar la estadística como base de un procedimiento estandarizado especificiado para el uso de otras personas, debido a que la mayoría de gente tiene una cierta base de conocimientos estadísticos. Por ejemplo, las reglamentaciones gubernamentales, con frecuencia, requieren el uso de estadística para informar y analizar conjuntos de datos, tales como índices de criminalidad, impacto ambiental, salud pública…
Como has podido ver, la estadística tiene mucho que ofrecerte, tanto si hay una importante base de ella en tu campo, como si no.
Cada pregunta de investigación se refiere a un determinado objetivo sobre una población.
Imagina la siguiente pregunta de investigación: ¿Cuánto mercurio contiene de media un pez espada en el Oceano Atlántico?
Aquí la población la componen todos los peces espada del Océano Atlántico y cada pez representa un caso. Muy a menudo, tiene un coste muy alto recoger los datos de todos los casos que componen una población. En vez de esto, el investigador suele tomar una muestra.
Una muestra representa un pequeño subconjunto de los casos y es a menudo una pequeña parte de la población.
Por ejemplo, podemos seleccionar 60 peces espada (u otro número de ellos) y a partir de esta muestra podemos calcular la media de mercurio que contienen, respondiendo así a nuestra pregunta de investigación.
Comencemos de nuevo con una pregunta de investigación: ¿Cuántas manzanas han madurado lo suficiente como para ser recolectadas en una determinada huerta y así elegir mejor el momento de su recolección?
Si la huerta es muy grande puede ser muy costoso observar la madurez manzana a manzana para obtener los datos que deseamos.
Para solucionar este problema, podemos tomar una muestra.
El porcentaje de manzanas maduras variará con respecto al que obtendríamos si puedíesemos observar toda la población, en este caso, todas las manzanas.
Esta diferencia entre la muestra seleccionada y las verdaderas características de la población (rasgos, comportamientos, cualidades , etc.) se conoce como error de muestreo.
Como hemos visto anteriormente, en estadística, todo es incierto.
Los datos contienen variabibilidad. Frente a la creencia de que la variabilidad es un problema, en estadística ésta es la que hace interesantes a los datos.
Como consecuencia de esta variabilidad, los resultados siempre se expresan en términos de probabilidad.
Toda medida es variable, consistiendo en:
La meta de la mayoría de procedimientos estadísticos es estimar las características de la población, caracterizar la variabilidad natural y minimizar y controlar la varibilidad debida al muestreo, medida y ambiente.
Minimizar esta variabilidad puede ser muy difícil debido a que puede haber muchas causas y porque las causas son a menudo imposibles de anticipar o controlar, pero sin variabilidad no podríamos responder a nuestras preguntas de investigación.
Saludos
– Stats with cats: Five Things You Should Know Before Taking Statistics 101
– Stats with cats: Why do I have to take statistics?