Qué es la Ciencia de Datos

Qué es la Ciencia de Datos

sep´20 Patricia Merayo 0 comentarios

Existe una gran discusión sobre qué es la Ciencia de Datos, pero podemos resumirla en la siguiente frase: “La Ciencia de Datos (o Data Science) es la disciplina que convierte los datos en conocimiento útil”.

 Contenidos

  1. Qué es la Ciencia de Datos
  2. Cómo nace la Ciencia de Datos
  3. Cuáles son las aplicaciones de la Ciencia de Datos

Qué es la Ciencia de Datos

Como comentábamos al inicio:

La Ciencia de Datos (o Data Sciencees la disciplina que convierte los datos en conocimiento útil.

Es decir, la Ciencia de Datos domina el espectro completo del ciclo de vida de los datos:

Fuente: R para Ciencia de Datos
Fuente: R para Ciencia de Datos
  • La captura de los datos (recepción de señales y adquisición de datos),
  • su gestión y procesamiento (ordenación, limpieza, transformación e ingeniería de datos),
  • su exploración (minería de datos, agrupación / clasificación, modelado de datos, resumen de datos),
  • su análisis (exploratorio / confirmatorio, análisis predictivo, regresión, minería de texto, análisis cualitativo),
  • y su comunicación (informes reproducibles, visualización interactiva y apoyo a la toma de decisiones).

Si quieres saber más sobre las funciones que realiza un Data Scientist, lee nuestro post: Qué es y qué hace un Data Scientist

¿Y cómo lo hacen? Existen varias aproximaciones, el Científico de Datos suele utilizar una caja de herramientas amplia. Cassie Kozyrkov la resume en Tres formas principales de hacer que tus datos sean útiles.

La minería de datos (o Data Mining), la analítica descriptiva o análisis de datos exploratorio (EDA), permite encontrar patrones y resumir grandes volúmenes de información.

La inferencia estadística es un conjunto de técnicas explicativas que utilizan muestras representativas de una población para comprobar la certeza de nuestras afirmaciones (llamadas hipótesis).

Y el aprendizaje automático (o Machine Learning), basado en la experiencia, estudia y diseña algoritmos para la toma de decisiones.

En los tres casos, los Científicos de Datos necesitan trabajar con una variedad de lenguajes de programación, como SAS, R y Python. Hemos hablado de las ventajas del lenguaje R en varias ocasiones, puedes leer nuestros post:

Cómo nace la Ciencia de Datos

Los orígenes de esta disciplina se remontan a 1962 cuando John W. Tukey discutía el futuro de la estadística matemática como ciencia empírica, y a 1974 cuando Peter Naur puso énfasis en los datos y acuñó el término “Ciencia de Datos”. A partir de 1977 el término fue integrado en varias asociaciones y conferencias de ámbito estadístico y computacional.

Seguramente William S. Cleveland fue el primero en tratar la Ciencia de Datos como una disciplina independiente en 2001.

Y más recientemente, el ganador del premio Turing, Jim Gray, imaginó la Ciencia de Datos como un «cuarto paradigma» de la ciencia (empírico, teórico, computacional, y ahora basado en datos), y afirmó que «todo lo relacionado con la ciencia está cambiando debido al impacto de la tecnología de la información y el diluvio de datos.

Puedes leer más detalles acerca de los orígenes de la Ciencia de Datos en el famoso artículo de Forbes A Very Short History Of Data Science .

La Ciencia de Datos surge como un campo interdisciplinario que incluye: 1) la programación; 2) las matemáticas y la estadística; y 3) la experiencia en el campo de estudio; como se indica en el diagrama de Venn de Drew Conway (2010).

La práctica de la Ciencia de Datos, requiere:

  • Conocimientos en Programación

La habilidad de reducir una tarea compleja a una serie de pasos que pueden resolverse con código interpretado por una computadora.

  • Conocimientos en Estadística/Matemáticas

La habilidad de trabajar en situaciones de incertidumbre, habilidades analíticas.

  • Conocimiento Especializado (o de dominio).

La habilidad de aplicar la información obtenida a partir de los datos,discernir si tienen sentido, y comunicar con dominio del área para facilitar la toma de decisiones.

Podemos decir entonces que la Ciencia de Datos surge de la necesidad de comprender los datos, comprender el problema a resolver y comprender la tecnología disponible para resolver los problemas con datos.

Cuáles son las aplicaciones de la Ciencia de Datos

La Ciencia de Datos es una de las profesiones que actualmente tiene más demanda de profesionales cualificados de todo el mundo. Puede aplicarse prácticamente a cualquier campo:

  • Los sistemas de recomendación de productos utilizan habitualmente la Ciencia de Datos para extraen información de los buscadores y las redes sociales (e.g. historial de navegación, de compras e información sociodemográfica asociada) para entrenar modelos de aprendizaje automático que realicen recomendaciones más precisas basada en el perfil del usuario.
  • En sectores de innovación tecnológica, como los coches autónomos, la Ciencia de Datos utiliza datos en tiempo real (de varios tipos de sensores) para crear un mapa visual de su entorno y tomar decisiones de conducción cruciales como girar, detenerse, acelerar, etc.
  • En el mundo científico, tanto en previsión meteorológica como en agricultura, los Científicos de Datos recopilan información de satélites, radares, barcos y aviones para construir modelos que puedan pronosticar el tiempo y también predecir calamidades naturales inminentes con gran precisión. Esto ayuda a tomar las medidas adecuadas en el momento adecuado y evitar el máximo daño posible.

En este sentido, es interesante la discusión que plantea Kirk Borne, PhD, científico de datos principal de Booz Allen Hamilton, sobre cómo los científicos de datos pueden ayudar en la nueva era de datos más grandes y complejos.

Kirk Borne explica qué es un Científico de Datos

Una gran cantidad de datos es un activo para cualquier empresa o institución, pero solo si se procesan de manera eficiente.

La cuestión es ser capaces de obtener las respuestas necesarias para entender qué sucede, por qué sucede, qué ocurrirá en el futuro y cómo podemos hacer que ocurra en el futuro un resultado en particular.

☑️ Con la Ciencia de Datos podemos resumir qué sucede en un negocio con información en tiempo real, como responder a cuántos visitantes obtuvo una web este mes, o cuántas ventas han aumentado en esta semana, cuál es la proporción de clientes frecuentes, etc.(Análisis descriptivo).

☑️ También indaga en por qué ocurren ciertos fenómenos en un negocio, conocer cuáles son los factores que impulsan o merman la venta de un producto permitirá decidir dónde invertir con inteligencia para mejorar tus resultados (Análisis diagnóstico).

☑️ Permite utilizar datos históricos para predecir resultados específicos, como determinar qué harán nuestros clientes la semana que viene, qué ventas se alcanzarán el próximo mes (Análisis predictivo).

☑️ Y evalúa distintas estrategias para lograr unos objetivos específicos, por ejemplo, ¿cómo podemos alcanzar el objetivo de 1000 visitas diarias? ¿Cómo podemos mejorar nuestro pronóstico y vender 5000 productos más? (Análisis prescriptivo)

«La capacidad de tomar datos, para poder comprenderlos, procesarlos, extraer valor de ellos, visualizarlos, comunicarlos, será una habilidad muy importante en las próximas décadas».- Hal Varian, economista jefe de Google y profesor de ciencias de la información, negocios y economía de UC Berkeley.

Comenzar una carrera en ciencia de datos es prometedor.

Podrás acceder a muchas oportunidades laborales con futuro, además de ser una excelente oportunidad para trabajar en el campo de la tecnología con espacio para la experimentación y la creatividad.

Si deseas conocer las principales estrategias para emprender este camino, lee nuestro post Cómo convertirse en un Data Scientist.

También puedes conocer de primera mano la experiencia de Máxima Consultoría al colaborar como Científicos de Datos con empresas diversas en Cómo convertir los datos en conocimiento útil.

En definitiva, si estás pensando formarte como Científico de Datos, este es el mejor momento.

0 comentarios

Acepto la política de privacidad

¹ Todos los campos son obligatorios.
² Tu correo electrónico no será publicado.

Nadie ha publicado ningún comentario aún. ¡Se tu la primera persona!

En Máxima Formación utilizamos cookies propias y de terceros con finalidad analítica y publicitaria. En nuestra política de cookies te contamos cuáles usamos y cómo desactivarlas si quieres. Aceptar todas Configurar/Rechazar

Diseño web: Albin Soft.