Ir al contenido principal

Utilizar la ciencia de redes para cuantificar la identificabilidad de los equipos de fútbol

 

En un blog invitado para Stats Perform, Javier Buldú y David Garrido presentan sus conclusiones de un proyecto de investigación que aplicó datos de eventos, de la temporada 2017/18 de LaLiga, con el objetivo de establecer en qué medida un equipo mantiene su estilo de juego a lo largo de una temporada.

 

Por: Stats Perform

Javier Buldú y David Garrido expusieron un póster en el Forum OptaPro 2020, en el que introdujeron un enfoque de Ciencia de Redes para cuantificar cómo se mantiene el estilo de juego de un equipo a lo largo de una temporada, basándose en la persistencia de los patrones de pase, utilizando datos Opta .

En este blog invitado exponen la metodología de su presentación, junto con un resumen de las principales conclusiones.

Haga clic en aquí para ver su cartel.

Los equipos de fútbol como sistemas complejos

"Un sistema complejo es un sistema compuesto por muchos componentes que pueden interactuar entre sí. Los sistemas complejos son sistemas cuyo comportamiento es intrínsecamente difícil de modelar debido a las dependencias, competencias, relaciones u otros tipos de interacciones entre sus partes o entre un sistema dado y su entorno"

El cerebro, el clima terrestre y los ecosistemas son ejemplos evidentes de sistemas complejos. El fútbol también puede clasificarse en esta categoría.

¿Por qué?

Pues bien, durante un partido de fútbol veintidós componentes, llamados jugadores, interactúan entre sí de forma compleja, creando dependencias, compitiendo y, lo que es más importante, generando propiedades emergentes como los "patrones de juego". Por estas razones, las ciencias de la complejidad son una alternativa viable para analizar conjuntos de datos futbolísticos, introduciendo nuevas perspectivas en el análisis del deporte rey.

Las razones residen en la naturaleza compleja del fútbol, que, parafraseando el paradigma fundacional de las ciencias de la complejidad, "no puede analizarse observando sus componentes individualmente (es decir, los jugadores) sino, por el contrario, considerando el sistema en su conjunto". Incluso el jugador más acertado en un partido reconoce que "no soy sólo yo, es el equipo".

Traducir la actividad de un equipo en una red compleja es uno de los muchos enfoques basados en las ciencias de la complejidad. La organización de un equipo puede analizarse teniendo en cuenta la interacción entre sus jugadores a través de los pases. Podemos construir redes de pases, que contienen información sobre cómo se ha movido el balón, de jugador a jugador, durante todo el partido.

Las redes de paso son "redes complejas" por dos razones principales:

1. Se componen de nodos (jugadores) y enlaces (pases) entre ellos;

2. La interacción entre nodos sigue ciertas reglas "complejas".

Además, estas redes no son fáciles de analizar, ya que son dirigidas (es decir, los enlaces entre jugadores tienen una dirección determinada), ponderadas (el peso de los enlaces es el número de pases entre jugadores), incrustadas espacialmente (es decir, la posición euclidiana del balón y los jugadores es muy relevante) y evolucionan en el tiempo (es decir, la red cambia continuamente su estructura).

La Figura 1 muestra un ejemplo de la red de pases del Real Madrid durante un partido contra el Barcelona de la temporada 2017/18. En el gráfico, el tamaño de los jugadores es proporcional a su importancia en la red de pases. Los jugadores se colocan en la posición media desde la que se realizaron sus pases. La anchura de los enlaces es proporcional al número de pases entre dos jugadores. Por último, las sustituciones se resaltan en verde.

A partir de este gráfico, podemos hacernos rápidamente una idea de cómo jugaba el Real Madrid, cómo ocupaba el campo, cómo interactuaban sus jugadores entre sí y cómo cambiaba la organización tras las sustituciones.

Figura 1: Ilustración esquemática de una Red de Pases, Real Madrid vs Barcelona, temporada 2017/2018.

Esto es solo una muestra de cómo traducir la actividad de un equipo en una red puede ayudarnos a comprender su organización. De la estructura de la red pueden extraerse diversas métricas a diferentes escalas espaciales y temporales, lo que permite comprender mejor cómo se organiza un equipo y cómo contribuyen los jugadores al rendimiento del equipo (Buldú et al., 2018).

Se trata de una tarea para la Ciencia de Redes, la rama de las ciencias de la complejidad que analiza las estructuras y dinámicas de las redes. La Ciencia de Redes aún no se ha adaptado plenamente al análisis de datos en el fútbol, pero tiene el potencial de ofrecer nuevas perspectivas sobre el rendimiento en los próximos años.

Redes de paso

Hay otras formas de crear redes de pases. Si nos preocupa más la organización espacial de un equipo que el papel de los jugadores, podemos construir y analizar redes de pases en el terreno de juego. En este caso, los nodos de la red no son específicos de cada jugador, sino regiones concretas del campo, que se conectan a través de los pases realizados por los jugadores que las ocupan.

La Figura 2 muestra ejemplos de las redes de pases del Barcelona contra el Real Madrid.

Figura 2: Los gráficos, de izquierda a derecha, son las redes de pases de 3×3, 5×6 y 10×10 para Barcelona, en las que los nodos son regiones del campo y los enlaces representan el número de pases entre ellas.

¿Por qué trazamos tres redes en lugar de una? La razón es que el terreno de juego puede dividirse en zonas de diferentes tamaños, lo que da lugar a redes de diferentes escalas. De este modo, las tres redes de la Figura 2 corresponden al mismo equipo durante el mismo partido y la única diferencia es el tamaño de las particiones. Sin embargo, nótese que la estructura de la red es diferente en función del número de divisiones, lo que indica que es necesario analizar las propiedades de la red a diferentes escalas.

La identificabilidad de los equipos de fútbol

Ahora que hemos definido el marco, es el momento de las preguntas:

  • ¿Es posible cuantificar hasta qué punto un equipo tiene un estilo de juego definido?
  • ¿Qué equipos se adaptan a su rival y qué equipos se mantienen fieles a su estilo?
  • ¿Podemos cuantificar qué equipos imponen su estilo al rival durante un partido?
  • ¿Qué equipos se comportan de manera diferente cuando juegan fuera de casa?

Para responder a todas estas preguntas, aplicamos la Ciencia de Redes para analizar la organización de las redes de paso de campos.

A partir de los datos de eventos de un partido, construimos las redes de pases multiescala asociadas a cada equipo y analizamos sus estructuras utilizando distintas metodologías procedentes de la Ciencia de Redes.

De este modo, pudimos identificar:

  • Qué equipos impusieron su estilo de juego a sus rivales;
  • Qué esperar de sus adversarios antes de un partido;
  • Cómo evaluar si un equipo ha jugado conforme a lo esperado.

Nuestra única fuente de información era la forma en que cada equipo se pasaba el balón, sin tener en cuenta el número de disparos, goles, entradas, regates o cualquier otra acción. Sin embargo, como veremos, los patrones de pase siguen siendo capaces de captar la esencia de la organización de un equipo.

Dividimos el terreno de juego en n x m regiones (con n =1,2,3,...10 y m =1,2,3,...10) y construimos las redes de paso del terreno de juego, donde los nodos correspondían a las N=(nxm) regiones del terreno de juego y aij representaba el número de pases de la región i a la región j.

Analizamos, a lo largo de toda la temporada, las propiedades de las matrices de conectividad resultantes A{aij} a diferentes escalas espaciales. Los elementos de las matrices de conectividad son el número de pases entre las regiones del campo, es decir, la abstracción matemática de los patrones de pase de cada equipo. Calculamos el parámetro de consistencia (C) de cada equipo cuantificando la similitud de las matrices de conectividad de un equipo determinado durante la temporada.

En resumen, los equipos con una consistencia alta mantuvieron la estructura de sus redes de pase durante toda la temporada, mientras que los equipos con una consistencia baja cambiaron su organización de un partido a otro.

A continuación, cuantificamos la singularidad de las redes de pases de cada equipo. Para ello, comparamos la estructura de las redes de pase de un equipo determinado con las del resto de equipos de la competición. A este parámetro lo denominamos similitud rival R. Por último, definimos el parámetro de identificabilidad (I) de un equipo como el parámetro de consistencia C menos la similitud rival R, es decir, I=C-R.

Los equipos con un parámetro de identificabilidad alto son los que son coherentes y, al mismo tiempo, diferentes del resto.

Nuestra metodología tiene aplicaciones tanto descriptivas como prospectivas. Por un lado, pudimos identificar qué equipos mantuvieron su estilo de juego ("alta identificabilidad") a lo largo de la temporada y cuáles, por el contrario, no tuvieron un estilo consistente ("baja identificabilidad").

En colaboración con LaLiga, calculamos el parámetro de identificabilidad de los equipos españoles de primera división de 2017/18.

La figura 3 muestra los valores de la identificabilidad del Barcelona y el Málaga, los equipos que acabaron primero y último de la tabla, respectivamente. En el eje horizontal hemos representado el número de nodos en los que se divide la médula ya que, como hemos explicado, hay que analizar todas las escalas. Curiosamente, observamos cómo las divisiones de la médula en torno a 50 áreas (nodos) eran las que conducían a una mejor identificación del estilo de juego del Barcelona. En cuanto al Málaga, podemos observar como su identificabilidad era bastante baja en todas las escalas.

Figura 3: El gráfico de la izquierda muestra el parámetro de identificabilidad de Barcelona, basado en el número de divisiones (nodos) del campo. A la derecha, se muestra el mismo análisis para Málaga.

Aplicación

Y lo que es más importante, esta información puede ayudar a los equipos de entrenadores a prepararse para un partido identificando el planteamiento esperado de sus adversarios.

Por ejemplo, es posible que un equipo evalúe la identificabilidad de su próximo adversario y decida si adapta o no su propio planteamiento en función del estilo de juego del rival (cuando el equipo contrario tiene una identificabilidad alta) o intenta imponerle su propio estilo (en caso de enfrentarse a un equipo con una identificabilidad baja).

También podemos utilizar la identificabilidad para cuantificar, en cada partido, qué equipo jugó de forma más parecida a su propio estilo.

La Tabla 1 muestra la diferencia de identificabilidad partido a partido entre los equipos locales y visitantes durante la temporada 2017/2018 de LaLiga.

Los partidos en los que el equipo local, que aparece en el eje vertical, impuso su propio estilo de juego (es decir, tuvo una mayor identificabilidad) aparecen resaltados en amarillo, mientras que las celdas verdes corresponden a los equipos visitantes que impusieron sus estilos. Los equipos se han ordenado en función de la clasificación final de la liga, con el objetivo de mostrar la conexión entre la identificabilidad y el rendimiento de un equipo. Las celdas amarillas aparecen principalmente por encima de la línea diagonal de la matriz, lo que indica que cuando juegan dos equipos, el que ocupa una posición más alta tiene más probabilidades de imponer su propio estilo de juego.

Si destacamos los equipos individuales, podemos ver que el Barcelona ganó el "concurso de identificabilidad" en más partidos, tanto en casa como fuera, seguido de cerca por el Real Madrid. Sin embargo, cabe destacar que las diferencias en la identificabilidad no siempre son un indicador del resultado del partido, ya que hay algunos encuentros en los que la identificabilidad fue mayor para el equipo que perdió el partido. Esta es la naturaleza del fútbol, donde jugar a tu manera no siempre garantiza el éxito.

Tabla 1: Los equipos locales figuran en el eje vertical, ordenados según su posición final en la liga. Los equipos visitantes aparecen en el eje horizontal, ordenados del mismo modo. El resultado del partido aparece dentro de cada celda. En amarillo, el equipo local impuso su estilo; en verde, el equipo visitante. Las celdas en azul corresponden a partidos en los que no hubo una diferencia clara entre la identificabilidad de ambos equipos.

Para concluir, también cabe destacar que es posible obtener una estimación en tiempo real del parámetro de identificabilidad mientras se desarrolla un partido, lo que pone de relieve cuándo un equipo, o su adversario, está jugando como se esperaba. Se trata de una información valiosa, que podría servir para tomar decisiones clave durante el partido desde el banquillo.

Otras aplicaciones de esta metodología también permitirían a los analistas evaluar qué equipos se comportan de forma diferente cuando juegan en casa o fuera, o identificar aquellas regiones del campo en las que se producen desviaciones de los patrones de pase esperados de un equipo durante un partido.


Referencias

Buldú, J. M., Busquets, J., Martínez, J. H., Herrera-Diestra, J. L., Echegoyen, I., Galeano, J., & Luque, J. (2018). Usando la ciencia de redes para analizar las redes de pases en el fútbol: dinámica, espacio, tiempo y la naturaleza multicapa del juego. Fronteras de la psicología, 9, 1900.

Buldú, J. M., Busquets, J., & Echegoyen, I., & F. Seirul.lo (2019). Definiendo un equipo de fútbol histórico: Usando la Ciencia de Redes para analizar el FC Barcelona de Guardiola. Nature Scientific Reports, 9(1), 1-14.


Doctor en Física Aplicada, Javier Buldú es coordinador del Grupo de Sistemas Complejos de la Universidad Rey Juan Carlos de Madrid, así como Investigador Principal del Laboratorio de Redes Biológicas del Centro de Tecnología Biomédica.

Puede ponerse en contacto con él por correo electrónico en: javier.buldu@urjc.es

David Garrido es estudiante de doctorado en el Centro de Tecnología Biomédica de la Universidad Rey Juan Carlos de Madrid.