Machine Learning: la tecnología que aprende de los datos

La Estadística y el Machine Learning están cada vez más presentes en nuestras vidas, pero ¿somos realmente conscientes de ello?

Ambas disciplinas comparten un mismo propósito: entender cómo aprendemos a partir de los datos. Este post te ofrece una visión clara y accesible sobre qué es el Machine Learning, su historia, relación con la estadística y su impacto en nuestra vida diaria.

¿Qué es el Machine Learning?

El Machine Learning (aprendizaje automático) es una rama de la inteligencia artificial que permite a las máquinas aprender de los datos sin estar programadas explícitamente para cada tarea.

Los ordenadores identifican patrones, hacen predicciones y mejoran su desempeño a medida que reciben nuevos datos. Los algoritmos, como las redes neuronales, incluso imitan el comportamiento del cerebro humano.

¿Dónde encontramos Machine Learning en la vida cotidiana?

Interactuamos con esta tecnología constantemente, aunque no siempre lo notemos:

Google afina nuestras búsquedas.
Facebook reconoce rostros en fotos.
Los filtros antispam de nuestro correo electrónico.
Asistentes virtuales como Siri o Alexa.
Navegadores GPS que predicen el tráfico.
Recomendaciones en Netflix, YouTube o Amazon.
Detección de fraude en pagos digitales.

El Machine Learning es uno de los secretos del éxito de muchas compañías basadas en software.

Breve historia del Machine Learning

El término fue acuñado en 1959 por Arthur Samuel, pionero de la inteligencia artificial en IBM.

Aunque su desarrollo se remonta a mediados del siglo XX, el campo comenzó a florecer en los años 90.

Según Andrew Ng, referente global en este ámbito:

“La escala —la disponibilidad de datos y el poder computacional— impulsa el progreso del aprendizaje automático”.

Hoy, sus aplicaciones se multiplican gracias al crecimiento de los datos y a la capacidad de procesamiento de los sistemas.

Si este punto te interesa especialmente puedes leer reseñas excelentes en:

REVISTA FORBES: Breve historia del aprendizaje automático que todo gerente debería leer.
GOOGLE: Una historia del aprendizaje automático.

También te recomendamos los siguientes post de nuestro blog:

3 razones prácticas para aprender Machine Learning

Peter Norvig (científico informático estadounidense y el director de investigación de Google Inc) afirma que dominando el Machine Learning aprenderás a hacer 3 cosas con mayor capacidad y eficiencia:

1. Reducción de tiempo en programación

Imagina que quieres escribir un programa para corregir errores ortográficos. Podrías incluir muchos ejemplos y reglas generales, y tras semanas de arduo trabajo, lograr un programa razonable. Pero también podrías usar una herramienta de Machine Learning ya existente, introducirle algunos ejemplos y obtener un programa más confiable en una menor fracción de tiempo.

2. Personalización eficiente

Imagina que he creado el corrector ortográfico escribiendo el código a mano y que , debido a su éxito, quisiera tener versiones en los 100 idiomas más populares. Tendría que empezar desde cero para cada idioma, lo que conllevaría años de esfuerzo. Pero si lo creara con Machine Learning, recrearlo para otro idioma significaría recopilar datos en ese idioma y alimentar el mismo modelo de aprendizaje automático.

El Machine Learning te permite resolver problemas que no sabrías cómo solucionar «manualmente».

Las personas tenemos la capacidad de entender el habla pero lo hacemos de manera subconsciente. Si tuviéramos que escribir un programa para hacerlo sería una tarea desconcertante. Estas son funciones que los algoritmos de Machine Learning ejecutan muy bien. No es preciso decirle al algoritmo qué debe hacer, solo es necesario mostrarle muchos ejemplos y a partir de ellos la tarea se completa de forma automática.

3. Resolución de problemas complejos

El Machine Learning es una tecnología transformadora que conducirá a los desarrolladores de software y a los empresarios a reconsiderar sus negocios desde los cimientos. Les llevará a «reconsiderarlo todo» (quieran o no).

El inversionista multimillonario Vinod Khosla (uno de los pesos pesados del mundo del capital de riesgo) dijo:

«Creo que el impacto del aprendizaje automático en la sociedad será mayor que el impacto del móvil … Casi en cualquier área que analice, el aprendizaje automático tendrá un gran impacto». Vinod Khosla

Estadística aplicada y Machine Learning

Algunos como Robert Tibshirani (estadístico y experto en aprendizaje automático de Stanford) incluso llama al aprendizaje automático «estadísticas glorificadas“. Ambos métodos se centran en extraer conocimiento o ideas de los datos, pero sus métodos se ven afectados por sus diferencias culturales inherentes.

La razón principal de que estos temas sean efectivamente los mismos es que cubren casi exactamente el mismo material y usan casi exactamente las mismas técnicas.

Aunque evolucionaron como culturas diferentes (y por lo que tienen diferentes historias, nomenclaturas, notación y perspectivas filosóficas), esas divergencias son, en palabras de David Smith de Revolution Analytics, más superficiales que sustantivas .

Diferente nomenclatura

El profesor Rob Tibshirani, uno de los autores del excelente libro Una introducción al aprendizaje estadístico, creó un glosario que compara varios términos importantes en aprendizaje automático versus estadísticas:

Aunque algunas de estas comparaciones son un poco irónicas, la lista es instructiva, los mismos conceptos tienen nombres diferentes en los dos campos.

Diferente énfasis

Wasserman mencionó diferentes énfasis, señalando que:

«Las estadísticas enfatizan la inferencia estadística formal (intervalos de confianza, pruebas de hipótesis, estimadores óptimos) en problemas de baja dimensión (conjuntos de datos más pequeños) y el aprendizaje automático se centra más en hacer predicciones precisas de alta dimensión (grandes conjuntos de datos).» Wasserman

En resumen, aunque el Machine Learning y la Estadística utilizan los mismos métodos, sus filosofías son diferentes sobre cómo, cuándo y por qué aplicar esos métodos.

Si quieres profundizar en este punto te recomiendo consultar: «10 ejemplos de dónde se utilizan los métodos estadísticos en un proyecto de aprendizaje automático aplicado.»

Espero que hayas disfrutado de este post. ¿Te gustaría añadir algo?

Si es así, ¡déjanos tu comentario!

¡Ah! y no te olvides de echar un vistazo a nuestros cursos de Machine Learning: