EXPERIENCIAS REALES EN DATA SCIENCE: cómo detectar estilos de juego en el fútbol

EXPERIENCIAS REALES EN DATA SCIENCE: cómo detectar estilos de juego en el fútbol

oct´24 Rosana Ferrero 0 comentarios

Indicadores de rendimiento deportivo: Patrones de comportamiento para detectar modelos y estilos de juego en el fútbol

El Máster en Estadística y Ciencia de Datos con R ha permitido a muchos profesionales aplicar sus conocimientos en contextos tan diversos como el deporte de alto rendimiento. En esta ocasión, compartimos la experiencia de Carlos Comas, ex-alumno del máster y actual responsable de análisis en la UD Las Palmas, equipo de la Primera División española. Su Trabajo Final de Máster (TFM) se enfocó en el análisis de patrones de comportamiento en el fútbol, aplicando técnicas avanzadas de estadística y machine learning para optimizar el estudio del rendimiento de los equipos rivales. A continuación, Carlos nos cuenta cómo logró combinar su pasión por el fútbol con el análisis de datos, simplificando procesos y tomando decisiones más informadas en su carrera.

 
 

Motivación Personal

El ex-alumno, Carlos Comas, trabaja en el análisis de rendimiento de equipos de fútbol, dedicando gran parte de su tiempo a estudiar al adversario. Su objetivo principal era simplificar los procesos de análisis seleccionando equipos cuyos perfiles se asemejan al de su propio equipo. Esto le permitiría reducir el tiempo necesario para realizar estudios detallados de los rivales, usando tanto análisis estadísticos como el visionado de videos.

Objetivos del Trabajo

El TFM se centró en evaluar si los equipos con mayor iniciativa de juego, es decir, aquellos que controlan el balón y mantienen una alta posesión, tienden a tener mayor eficacia ofensiva (más remates y goles). Además, buscaba agrupar a los equipos de la Segunda División Española (Liga SmartBank 2022-23) en "familias" con características similares al estilo de juego de su equipo, la UD Las Palmas.

Metodología

Carlos utilizó datos de 165 partidos de la liga Smartbak de fútbol, correspondiente a las primeras 15 jornadas de dicha competición en 2022-23, obtenidos a través de la Plataforma deportiva de pago INSTAT SCOUT. A partir de varios indicadores de rendimiento, utilizó el Análisis de Componentes Principales (PCA) y el análisis de clúster para identificar equipos con estilos de juego similares a la UD Las Palmas. Posteriormente, creó un modelo de Regresión Lineal Múltiple (RLM) y analizó la eficacia en la finalización, seleccionando el modelo final mediante comparación de modelos completo y reducido.

Resultados y Hallazgos

Mediante técnicas de Análisis de Componentes Principales (PCA) y Análisis Cluster, Carlos pudo identificar grupos de equipos con características homogéneas y perfiles de juego similares (Figura 1 y 2). En particular, se logró identificar a la SD Andorra como el equipo con un perfil más similar a la UD Las Palmas, destacando su alto volumen de pases y posesión de balón, aunque con menor eficacia en la finalización. Los resultados mostraron que los equipos del grupo 1 (SD Androrra y ID Las Palmas) tienen un estilo más defensivo y directo, mientras que los otros grupos presentan más variabilidad en sus estilos de juego.

A partir del modelo de Regresión Lineal, Carlos identificó los equipos con gran iniciativa y control del juego, como FC Cartagena, Éibar y UD Las Palmas, que mostraron altos valores de eficacia en la finalización (Figura 3). Otros, como Sporting Gijón y Albacete, destacaron en algunos índices como la construcción de juego. Sin embargo, equipos como Lugo e Ibiza no sobresalieron en ninguna de estas variables y se encontraban en la zona de descenso. El caso más llamativo fue el CF Burgos, que, con un juego directo y menos posesión, ocupaba el tercer puesto a pesar de tener baja eficacia en la finalización.

El análisis permitió, de manera objetiva, agrupar equipos de la liga Smartbank según su estilo de juego, validando patrones que antes se observaban de manera subjetiva a través de la experiencia.

 

Figura 1. Análisis de componentes principales (PCA) seguido de agrupamiento jerárquico (HCPC) para los indicadores de rendimiento deportivo. Se identificaron 4 grupos diferenciados según las dos primeras dimensiones obtenidas. Se indican los nombres de los equipos de liga Smartbak de fútbol para las primeras 15 jugadas de la competición en 2022-23. La primera dimensión está asociada con el control del juego y la capacidad ofensiva. La segunda dimensión refleja la eficacia ofensiva y la finalización de jugadas.

 

Figura 2. Gráfico de mapa de calor para los indicadores de rendimiento escalados, donde se observa entre otros índice de iniciativa de juego o índice de volumen de juego (IIJ), índice de volumen de juego ofensivo (IVJO), índice de progresión en el juego ofensivo o eficacia en la construcción de juego (EC), índice de eficacia en la finalización (EF),índice de eficacia recuperadora (IER). La escala de colores indica la magnitud de los valores representados en las celdas.

 

Figura 3. Gráfico de dispersión para la eficacia en la construcción y la iniciativa de juego, según los valores de eficacia en la finalización de la jugada (EF).

 

Desafíos Encontrados

El principal reto fue la programación y creación del código R, ya que la formación previa de Carlos no incluía programación ni estadística avanzada. A pesar de la dificultad inicial, la constancia le permitió superar los obstáculos y disfrutar del proceso de aprendizaje, con el apoyo del equipo del máster.

Lecciones Aprendidas

Carlos destaca la importancia de la estadística y la programación en su campo laboral, donde todo está basado en datos. Su consejo para futuros estudiantes es disfrutar del camino y avanzar día a día, ya que la constancia les permitirá adquirir autonomía y destreza.

Impacto del TFM en su Carrera Profesional

Este TFM le ha proporcionado una visión más profunda del análisis de datos y una mayor capacidad para comunicarse con desarrolladores, explicando de manera clara lo que necesita desde el conocimiento técnico.

Recomendaciones para Futuras Promociones

Carlos recomienda tener una base sólida en estadística y programación en R para quienes deseen especializarse en big data, análisis deportivo o business intelligence.

 
 

Contacto

Carlos Comas es Licenciado en Ciencias de la Actividad Física y del Deporte, entrenador de fútbol nivel III, máster en alto rendimiento deportivo y experto en análisis deportivo y big data. Actualmente es responsable del análisis del equipo profesional de la UD Las Palmas, en la Primera División de fútbol español.

Aprende más con nuestros cursos sobre Machine Learning:

0 comentarios

Información Básica sobre Protección de datos. Responsable: Máxima Formación, S.L. Finalidad: Enviar la información solicitada. Legitimación: Consentimiento del interesado. Destinatarios: No se comunicarán datos a terceros. Derechos: Acceso, rectificación o supresión, oposición, así como otros derechos. Más información: política de privacidad.

¹ Todos los campos son obligatorios.
² Tu correo electrónico no será publicado.

Nadie ha publicado ningún comentario aún. ¡Se tu la primera persona!

Te llamamos

Introduce los siguientes datos y nos pondremos en contacto contigo para atender tus dudas sin compromiso.

Responsable: Máxima Formación, S.L.U., finalidad: Dar respuesta a las solicitudes de información legitimación: consentimiento del interesado, destinatarios: no se comunicarán datos a terceros, derechos: Acceder, rectificar y suprimir los datos, así como otros derechos, como se explica en la información adicional. Política de privacidad

Te llamamos

Muchas gracias por solicitar información.
Te contactaremos lo antes posible.

Diseño web: Albin Soft.