Rosana Ferrero
Data Scientist
Juan L. López
Data Scientist
La Estadística Aplicada es el área de la Estadística que se aplica en cualquier otra rama externa a ella, como la Medicina, la Economía, la Sociología, la Historia, la Biología, el Marketing, la Psicología, etc.
Todas estas ramas de conocimiento dependen del análisis de datos para impulsar su evolución como disciplina, construir nuevo conocimiento, obtener ventajas competitivas y tomar decisiones óptimas.
La Estadística Aplicada tiene un rol primordial en los cambios que estamos viviendo.
Gracias al gran progreso informático que hemos experimentado y a la enorme cantidad de información que disponemos, hoy podemos responder a preguntas que antes no éramos capaces de resolver. Estamos justo al comienzo de este proceso de transformación impulsada por datos (véase por ejemplo el libro “Homo deus: a brief History of tomorrow” de Yuval Noah Harari). Nunca se han tomado tantas decisiones basadas en estadísticas como hoy en día.
Los beneficios de conocer la Estadística Aplicada son incontables.
Algunos ejemplos:
Para todo ello hace falta una buena formación en Estadística.
Máster de Estadística Aplicada con R Software IX edición Noviembre 2019 -Matrícula abierta-
Un Científico de Datos es un profesional o académico que aprende de los datos, que:
Me gusta esta definición porque reconoce el rol del científico.
Los científicos/as tenemos una gran ventaja en esta nueva profesión, conocemos la pregunta y el contexto de la investigación, así podemos crear diseños experimentales adecuados y distinguir luego mediante su análisis si un patrón detectado es relevante para contestar nuestra pregunta de investigación o si se debe a otro tipo de fenómenos (errores de medición u observación, o un error en el procesamiento de datos, por ejemplo).
El Científico de Datos requiere combinar habilidades multidisciplinares que le permitan:
Para convertirse en datascience además es imprescindible tener un buen dominio de software estadístico especializado, como R Software.
R es el lenguaje estadístico de referencia mundial, la herramienta más potente del mercado para el análisis estadístico y gráfico.
R es inigualable en su campo, es un lenguaje estadístico potente, versátil, colaborativo, abierto y gratuito. Una de sus grandes ventajas es que mejora día a día con las últimas novedades en técnicas estadísticas gracias a la implicación de una extensa comunidad internacional de desarrolladores centrados en su evolución.
Con el lenguaje R tomas el control total de tus datos y eres más eficiente:
R transformó para siempre la práctica del análisis de datos al crear un lenguaje estándar que los diferentes analistas pueden usar para comunicarse, compartir algoritmos y flujos de trabajo.
El lenguaje R no es la típica caja negra que sí son otros software estadísticos comerciales.
En el mercado hay disponibles otros lenguajes excelentes para la programación y la gestión de datos (como Python). Pero R es un lenguaje estadístico, creado por estadísticos que discreparon con la forma en la que trabajaban otros programas. Otras herramientas estadísticas comerciales, como SPSS o SAS, suelen ser cajas negras donde es difícil conocer los pormenores de los cálculos y por tanto, su interpretación y reproducción (véase por ejemplo una comparación con SAS).
R no es solo una herramienta estadística ética, sino también rentable, eficiente y productiva.
R tiene una comunidad de usuarios muy activa que comparte opiniones, ideas y ayuda de manera altruista. Esto permite estar actualizado en las últimas técnicas estadísticas y resolver problemas reales de datos complejos.
Los software comerciales ofrecen la falsa sensación de trabajo intuitivo y casi automático, gracias a su barra de herramientas interactiva.
Sin embargo, cuando queremos ir un poco más allá y conocer con exactitud las tareas que está ejecutando el software para controlar e interpretar los resultados, los software comerciales como SPSS son opacos, y no permiten acceder a esta información.
El lenguaje R promueve el “empoderamiento” del usuario, que puede controlar todo el proceso del análisis de sus datos. Esto en muchas ocasiones, marca la diferencia entre un buen y un mal análisis.
R permite crecer y adaptarte a las necesidades crecientes de tu puesto de trabajo o empresa. Cuando necesitas aplicar las técnicas más actuales para promover tu desarrollo, como las técnicas de Big Data, Machine Learning yData Mining, los softwares comerciales se vuelven obsoletos, no permiten la aplicación de estas técnicas.
Los fundamentos científicos del Big Data residen en la Estadística Aplicada.
El Big Data trata del almacenamiento y tratamiento de datos que poseen unas características muy concretas, las 7 Vs:
Implica código, técnicas o algoritmos que permite a las máquinas realizar tareas o comportamientos que son característicos de la inteligencia humana. Incluye herramientas para la planificación, la comprensión del lenguaje, el reconocimiento de objetos y sonidos, el aprendizaje y la resolución de problemas.
Es una forma de lograr el AI, las técnicas y procesos que ayudan a las máquinas en este esfuerzo.
Es un enfoque del ML, utilizan redes neuronales (ANN) que imitan las respuestas de las redes neuronales biológicas en los humanos. Como podemos ver en el gráfico, el DL es un subconjunto de técnicas del ML, que a su vez es un subconjunto de técnicas de la AI.
Hace referencia a la interconexión digital de los objetos cotidianos con internet, brinda datos sin procesar de lo que está sucediendo en el mundo, de manera similar a los sensores de nuestro cuerpo. En este símil, el AI actúa como nuestro cerebro, da sentido a los datos y decide qué acciones realizar.
¡Buenos días Al! Muchas gracias por tu comentario. Efectivamente, R es más que una de las herramientas estadísticas más potentes. Es el fruto de años de desarrollo altruista por parte de una extensa comunidad de desarrolladores. Como software libre supone una alternativa ética y gratuita, una herramienta al alcance de todos que permite el análisis de datos eficiente. ¡Gracias por leerme! Un abrazo
Ética, empoderamiento, vanguardia, altruismo… Me gusta que se comente, no siempre se habla de estos temas al hablar de R, y son motivos suficientes, para al menos, planteárselo…