Estadística Aplicada, salidas, qué es y para qué sirve

Estadística Aplicada, salidas, qué es y para qué sirve

jul´18 Rosana Ferrero 0 comentarios

¿Qué es la Estadística Aplicada y por qué es crucial en el siglo XXI?

La Estadística Aplicada es el área de la Estadística que se aplica en cualquier otra rama externa a ella, como la Medicina, la Economía, la Sociología, la Historia, la Biología, el Marketing, la Psicología, etc. 

Todas estas ramas de conocimiento dependen del análisis de datos para impulsar su evolución como disciplina, construir nuevo conocimiento, obtener ventajas competitivas y tomar decisiones óptimas. 

La Era de los datos

La Estadística Aplicada tiene un rol primordial en los cambios que estamos viviendo.

Gracias al gran progreso informático que hemos experimentado y a la enorme cantidad de información que disponemos, hoy podemos responder a preguntas que antes no éramos capaces de resolver. Estamos justo al comienzo de este proceso de transformación impulsada por datos (véase por ejemplo el libro Homo deus: a brief History of tomorrow de Yuval Noah Harari). Nunca se han tomado tantas decisiones basadas en estadísticas como hoy en día.

ÚLTIMAS PLAZAS EN MASTERS

Máster Data Science

CONVOCATORIA ABIERTA I Logra la máxima precisión y rigor en tus proyectos de Ciencia de Datos.

Ver convocatorias 2022

MAster en MAchine learning

CONVOCATORIA ABIERTA | Automatiza procesos y crea tus propios algoritmos de Machine Learning.

Ver convocatorias 2022

¿Cómo puede ayudarme la Estadística Aplicada?

Los beneficios de conocer la Estadística Aplicada son incontables.

Algunos ejemplos:

  • Obtener una guía estadística durante tu doctorado.
  • Dar respuestas solventes a los revisores que están juzgando tu trabajo.
  • Analizar las muestras de datos que tanto esfuerzo te ha costado conseguir.
  • Mejorar la metodología estadística de tus nuevas investigaciones y ganar una propuesta de proyecto.
  • Tomar mejores decisiones en tu empresa
  • Ser un ciudadano/a competente con capacidad crítica para valorar la información de su entorno y hacerse las preguntas oportunas…

Para todo ello hace falta una buena formación en Estadística.

¿Qué es un Científico de Datos (Data Scientist)?

Un Científico de Datos es un profesional o académico que aprende de los datos, que:

  • Evalúa y compara las técnicas estadísticas de análisis de datos
  • Analiza e interpreta datos reales y complejos.
  • Extrae conocimiento de estos datos para responder a preguntas concretas y obtiene una mejor comprensión de los problemas.

Me gusta esta definición porque reconoce el rol del científico.

Los científicos/as tenemos una gran ventaja en esta nueva profesión, conocemos la pregunta y el contexto de la investigación, así podemos crear diseños experimentales adecuados y distinguir luego mediante su análisis si un patrón detectado es relevante para contestar nuestra pregunta de investigación o si se debe a otro tipo de fenómenos (errores de medición u observación, o un error en el procesamiento de datos, por ejemplo).

¿Cómo convertirse en Científico de Datos?

El Científico de Datos requiere combinar habilidades multidisciplinares que le permitan:

  • Establecer y redefinir las preguntas de investigación.
  • Seleccionar las herramientas estadísticas para manipular, gestionar y explorar los datos.
  • Construir modelos estadísticos.
  • Interpretar, comunicar los resultados y tomar de decisiones a partir de ellos.

Para convertirse en datascience además es imprescindible tener un buen dominio de software estadístico especializado, como R Software. 

¿Qué es R? ¿Por qué es la herramienta estadística líder a nivel mundial?

R es el lenguaje estadístico de referencia mundial, la herramienta más potente del mercado para el análisis estadístico y gráfico.

R es inigualable en su campo, es un lenguaje estadístico potente, versátil, colaborativo, abierto y gratuito. Una de sus grandes ventajas es que mejora día a día con las últimas novedades en técnicas estadísticas gracias a la implicación de una extensa comunidad internacional de desarrolladores centrados en su evolución.

Con el lenguaje R tomas el control total de tus datos y eres más eficiente:

  • Para realizar análisis de manera reproducible y así evitar errores en tus proyectos (e.g. utilizando RMarkdown).
  • Para simplificar tus tareas con un único entorno de trabajo que conecte con otros programas (Excel, SPSS, SAS, Spark, Hadoop, etc.),
  • Para publicar tus resultados en forma de aplicaciones con Shiny.

R transformó para siempre la práctica del análisis de datos al crear un lenguaje estándar que los diferentes analistas pueden usar para comunicarse, compartir algoritmos y flujos de trabajo.

¿Por qué aprender R Software y no otras herramientas?

El lenguaje R no es la típica caja negra que sí son otros software estadísticos comerciales.

En el mercado hay disponibles otros lenguajes excelentes para la programación y la gestión de datos (como Python). Pero R es un lenguaje estadístico, creado por estadísticos que discreparon con la forma en la que trabajaban otros programas. Otras herramientas estadísticas comerciales, como SPSS o SAS, suelen ser cajas negras donde es difícil conocer los pormenores de los cálculos y por tanto, su interpretación y reproducción (véase por ejemplo una comparación con SAS).

R no es solo una herramienta estadística ética, sino también rentable, eficiente y productiva.

R tiene una comunidad de usuarios muy activa que comparte opiniones, ideas y  ayuda de manera altruista. Esto permite estar actualizado en las últimas técnicas estadísticas y resolver problemas reales de datos complejos.

Si aprendo a utilizar el lenguaje R, ¿qué problemas puedo solucionar en mi actividad?

R Software es control total

Los software comerciales ofrecen la falsa sensación de trabajo intuitivo y casi automático, gracias a su barra de herramientas interactiva.

Sin embargo, cuando queremos ir un poco más allá y conocer con exactitud las tareas que está ejecutando el software para controlar e interpretar los resultados, los software comerciales como SPSS son opacos, y no permiten acceder a esta información.

El lenguaje R promueve el “empoderamiento” del usuario, que puede controlar todo el proceso del análisis de sus datos. Esto en muchas ocasiones, marca la diferencia entre un buen y un mal análisis.

R Software como herramienta escalable

R permite crecer y adaptarte a las necesidades crecientes de tu puesto de trabajo o empresa. Cuando necesitas aplicar las técnicas más actuales para promover tu desarrollo, como las técnicas de Big Data, Machine Learning yData Mining, los softwares comerciales se vuelven obsoletos, no permiten la aplicación de estas técnicas.

Big Data y Estadística Aplicada

Los fundamentos científicos del Big Data residen en la Estadística Aplicada.

El Big Data trata del almacenamiento y tratamiento de datos que poseen unas características muy concretas, las 7 Vs:

  1. Volumen: la cantidad de datos (implican de 30-50 terabytes a petabytes de datos)
  2. Velocidad: se caracterizan por la velocidad con la que se generan y fluye la información en la empresa.
  3. Variedad: el tipo de datos disponible es muy variado, puede incluir datos estructurados (como las bases de datos que solemos trabajar con datos numéricos) o no estructurado (como los documentos, emails, vídeos, audios, tickets, transacciones financieras).
  4. Veracidad: qué tan confiable es la información define la importancia del big data.
  5. Viabilidad: la capacidad de utilizar los datos de manera eficaz.
  6. Visualización: la representación gráfica de los datos para detectar patrones ocultos.
  7. Valor: qué representa para la empresa

La moda del Artificial Intelligence (AI), Machine Learning (ML), Deep Learning (DL) y el Internet of Things (IoT). ¿En qué consisten en realidad?

Artificial Intelligence (AI)

Implica código, técnicas o algoritmos que permite a las máquinas realizar tareas o comportamientos que son característicos de la inteligencia humana. Incluye herramientas para la planificación, la comprensión del lenguaje, el reconocimiento de objetos y sonidos, el aprendizaje y la resolución de problemas.

Machine Learning (ML)

Es una forma de lograr el AI, las técnicas y procesos que ayudan a las máquinas en este esfuerzo.

Deep Learning (DL)

Es un enfoque del ML, utilizan redes neuronales (ANN) que imitan las respuestas de las redes neuronales biológicas en los humanos. Como podemos ver en el gráfico, el DL es un subconjunto de técnicas del ML, que a su vez es un subconjunto de técnicas de la AI.

Internet of Things (IoT)

Hace referencia a la interconexión digital de los objetos cotidianos con internet, brinda datos sin procesar de lo que está sucediendo en el mundo, de manera similar a los sensores de nuestro cuerpo. En este símil, el AI actúa como nuestro cerebro, da sentido a los datos y decide qué acciones realizar.

0 comentarios

¹ Todos los campos son obligatorios.
² Tu correo electrónico no será publicado.

Nadie ha publicado ningún comentario aún. ¡Se tu la primera persona!

Te llamamos

Introduce los siguientes datos y nos pondremos en contacto contigo para atender tus dudas sin compromiso.

Te llamamos

Muchas gracias por solicitar información.
Te contactaremos lo antes posible.

Diseño web: Albin Soft.