
EXPERIENCIAS REALES EN DATA SCIENCE: cómo detectar estilos de juego en el fútbol
Indicadores de rendimiento deportivo: Patrones de comportamiento para detectar modelos y estilos de juego en el fútbol
El Máster en Estadística y Ciencia de Datos con R ha permitido a muchos profesionales aplicar sus conocimientos en contextos tan diversos como el deporte de alto rendimiento. En esta ocasión, compartimos la experiencia de Carlos Comas, ex-alumno del máster y actual responsable de análisis en la UD Las Palmas, equipo de la Primera División española. Su Trabajo Final de Máster (TFM) se enfocó en el análisis de patrones de comportamiento en el fútbol, aplicando técnicas avanzadas de estadística y machine learning para optimizar el estudio del rendimiento de los equipos rivales. A continuación, Carlos nos cuenta cómo logró combinar su pasión por el fútbol con el análisis de datos, simplificando procesos y tomando decisiones más informadas en su carrera.

Motivación Personal
El ex-alumno, Carlos Comas, trabaja en el análisis de rendimiento de equipos de fútbol, dedicando gran parte de su tiempo a estudiar al adversario. Su objetivo principal era simplificar los procesos de análisis seleccionando equipos cuyos perfiles se asemejan al de su propio equipo. Esto le permitiría reducir el tiempo necesario para realizar estudios detallados de los rivales, usando tanto análisis estadísticos como el visionado de videos.
Objetivos del Trabajo
El TFM se centró en evaluar si los equipos con mayor iniciativa de juego, es decir, aquellos que controlan el balón y mantienen una alta posesión, tienden a tener mayor eficacia ofensiva (más remates y goles). Además, buscaba agrupar a los equipos de la Segunda División Española (Liga SmartBank 2022-23) en "familias" con características similares al estilo de juego de su equipo, la UD Las Palmas.
Metodología
Carlos utilizó datos de 165 partidos de la liga Smartbak de fútbol, correspondiente a las primeras 15 jornadas de dicha competición en 2022-23, obtenidos a través de la Plataforma deportiva de pago INSTAT SCOUT. A partir de varios indicadores de rendimiento, utilizó el Análisis de Componentes Principales (PCA) y el análisis de clúster para identificar equipos con estilos de juego similares a la UD Las Palmas. Posteriormente, creó un modelo de Regresión Lineal Múltiple (RLM) y analizó la eficacia en la finalización, seleccionando el modelo final mediante comparación de modelos completo y reducido.
Resultados y Hallazgos
Mediante técnicas de Análisis de Componentes Principales (PCA) y Análisis Cluster, Carlos pudo identificar grupos de equipos con características homogéneas y perfiles de juego similares (Figura 1 y 2). En particular, se logró identificar a la SD Andorra como el equipo con un perfil más similar a la UD Las Palmas, destacando su alto volumen de pases y posesión de balón, aunque con menor eficacia en la finalización. Los resultados mostraron que los equipos del grupo 1 (SD Androrra y ID Las Palmas) tienen un estilo más defensivo y directo, mientras que los otros grupos presentan más variabilidad en sus estilos de juego.
A partir del modelo de Regresión Lineal, Carlos identificó los equipos con gran iniciativa y control del juego, como FC Cartagena, Éibar y UD Las Palmas, que mostraron altos valores de eficacia en la finalización (Figura 3). Otros, como Sporting Gijón y Albacete, destacaron en algunos índices como la construcción de juego. Sin embargo, equipos como Lugo e Ibiza no sobresalieron en ninguna de estas variables y se encontraban en la zona de descenso. El caso más llamativo fue el CF Burgos, que, con un juego directo y menos posesión, ocupaba el tercer puesto a pesar de tener baja eficacia en la finalización.
El análisis permitió, de manera objetiva, agrupar equipos de la liga Smartbank según su estilo de juego, validando patrones que antes se observaban de manera subjetiva a través de la experiencia.

Figura 1. Análisis de componentes principales (PCA) seguido de agrupamiento jerárquico (HCPC) para los indicadores de rendimiento deportivo. Se identificaron 4 grupos diferenciados según las dos primeras dimensiones obtenidas. Se indican los nombres de los equipos de liga Smartbak de fútbol para las primeras 15 jugadas de la competición en 2022-23. La primera dimensión está asociada con el control del juego y la capacidad ofensiva. La segunda dimensión refleja la eficacia ofensiva y la finalización de jugadas.

Figura 2. Gráfico de mapa de calor para los indicadores de rendimiento escalados, donde se observa entre otros índice de iniciativa de juego o índice de volumen de juego (IIJ), índice de volumen de juego ofensivo (IVJO), índice de progresión en el juego ofensivo o eficacia en la construcción de juego (EC), índice de eficacia en la finalización (EF),índice de eficacia recuperadora (IER). La escala de colores indica la magnitud de los valores representados en las celdas.

Figura 3. Gráfico de dispersión para la eficacia en la construcción y la iniciativa de juego, según los valores de eficacia en la finalización de la jugada (EF).
Desafíos Encontrados
El principal reto fue la programación y creación del código R, ya que la formación previa de Carlos no incluía programación ni estadística avanzada. A pesar de la dificultad inicial, la constancia le permitió superar los obstáculos y disfrutar del proceso de aprendizaje, con el apoyo del equipo del máster.
Lecciones Aprendidas
Carlos destaca la importancia de la estadística y la programación en su campo laboral, donde todo está basado en datos. Su consejo para futuros estudiantes es disfrutar del camino y avanzar día a día, ya que la constancia les permitirá adquirir autonomía y destreza.
Impacto del TFM en su Carrera Profesional
Este TFM le ha proporcionado una visión más profunda del análisis de datos y una mayor capacidad para comunicarse con desarrolladores, explicando de manera clara lo que necesita desde el conocimiento técnico.
Recomendaciones para Futuras Promociones
Carlos recomienda tener una base sólida en estadística y programación en R para quienes deseen especializarse en big data, análisis deportivo o business intelligence.
Contacto
Carlos Comas es Licenciado en Ciencias de la Actividad Física y del Deporte, entrenador de fútbol nivel III, máster en alto rendimiento deportivo y experto en análisis deportivo y big data. Actualmente es responsable del análisis del equipo profesional de la UD Las Palmas, en la Primera División de fútbol español.
Aprende más con nuestros cursos sobre Machine Learning:
0 comentarios
Nadie ha publicado ningún comentario aún. ¡Se tu la primera persona!