Ir al contenido principal

Agrupación de estilos de juego en el lateral moderno

Por: Stats Perform

Mark Carey y Mladen Sormaz presentaron un póster en el OptaPro Analytics Forum 2018. En este artículo se ofrece un resumen en profundidad de su análisis. Sus pósteres también pueden leerse aquí:

Leer cartel 1

Leer cartel 2 

 

El papel del lateral ha cambiado radicalmente en los últimos años, y muchos equipos europeos se centran ahora sobre todo en cómo hacer que sus laterales participen en el ataque, incluso más que en proteger su defensa. De hecho, parece que se ha vuelto a poner de moda el uso de los laterales, sobre todo con la formación 3-5-2 de Antonio Conte, que funcionó a las mil maravillas en el paseo del Chelsea hacia el título de la Premier League la temporada pasada. Pero más que observar subjetivamente los diferentes estilos de juego de los laterales en Europa, ¿es posible cuantificarlos?

Nos hemos centrado en los laterales porque su estilo de juego ha variado mucho en las últimas temporadas, pero este método puede aplicarse a cualquier posición. Lo que queríamos era proporcionar una medida más detallada y objetiva de los diferentes perfiles de los laterales, que tuviera en cuenta las dimensiones más amplias del estilo de un jugador en lugar de sus estadísticas individuales. Para ello, utilizamos los datos Opta F9 (totales agregados de los partidos) para realizar primero un análisis de componentes principales (ACP) con rotación varimax a fin de reducir la dimensionalidad de los datos y determinar los perfiles más amplios de los laterales que introdujimos en el análisis (los detalles de nuestro análisis ACP pueden consultarse aquí). El siguiente paso consistió en utilizar esta información para cuantificar qué laterales eran más similares entre sí en cuanto a estilo de juego.

Las cifras

Analizamos 417 laterales de las temporadas 2015/16 y 2016/17 en las cinco grandes competiciones europeas. Después de que el ACP mostrara perfiles estables en las dos temporadas, introdujimos nuestros datos de la 2016/17 en un análisis de conglomerados. Los individuos con perfiles similares o relacionados se colocan juntos, y se separan de los que son disímiles en su perfil. Debemos tener en cuenta que la comparación de jugadores entre ligas es difícil, e hicimos todo lo posible para corregirlo dentro de nuestro análisis.

Los resultados de nuestro análisis fueron muy interesantes, con 11 grupos de jugadores creados a partir de sus estadísticas de rendimiento (véase la Figura 1). Es importante destacar que los jugadores de alto nivel que cabría esperar que se agrupasen por su estilo de juego caen en el mismo grupo (por ejemplo, Marcelo, Alex Sandro, Davide Zappacosta), lo que subraya la fiabilidad del análisis y supera la "prueba del ojo". En la Figura 1, a continuación, se crean grupos más amplios y subgrupos más específicos, en los que cada línea representa a un jugador individual.

Utilizamos un método aglomerativo, que busca emparejar a todos los jugadores con una "pareja de estilo", y luego amplía el grupo comparando esa pareja con otras parejas y grupos de forma iterativa, hasta llegar a la parte superior del árbol. La distancia entre las líneas (que representan a un jugador) es indicativa de la similitud de su estilo de juego.

 

 

Figura 1: Análisis de grupos de espalda completa

Tradicionalmente hay formas de determinar cuántos clusters hay en un Dendrograma cortando las ramas del árbol a una altura consistente. Aquí no lo hemos hecho, porque el principio de la pérdida de similitud de los jugadores a medida que se asciende en el árbol se mantiene tanto si se corta el árbol como si no. Las ramas coloreadas están ahí para facilitar la legibilidad de la figura, pero si quiere saber cómo se hace hay un buen artículo titulado 'Defining clusters from a hierarchical cluster tree: The Dynamic Tree Cut package for R'.

A continuación se muestran algunos ejemplos de cada grupo. Como ya se ha dicho, los jugadores agrupados tienen sentido desde el punto de vista futbolístico, pero dado que el algoritmo de agrupación presupone que no se tienen conocimientos de fútbol, estos resultados aumentan la fiabilidad del análisis.

 

 

¿Cómo se puede utilizar?

La mayor utilidad del análisis de conglomerados es que el modelo puede cuantificar y agrupar objetivamente a los jugadores que más se parecen entre sí en su estilo de juego, sin ningún sesgo ni conocimiento futbolístico previo. Esto puede ayudar enormemente a los clubes de fútbol en el mercado de fichajes, sobre todo a los que tienen presupuestos financieros estrictos. Por ejemplo, los clubes pueden crear una preselección de fichajes para un perfil de jugador que encajaría con su propio estilo de juego. El personal de contratación también podría identificar su fichaje ideal (por ejemplo, Marcelo) y utilizar el modelo para explorar una serie de jugadores alternativos que serían muy similares por un precio más asequible (por ejemplo, Cristian Ansaldi). Esto se puede ver simplemente en el Dendrograma de arriba, buscando un jugador y "subiendo por el árbol" para explorar quién es más parecido a ese jugador. Cuanto más se asciende en el árbol, menos similar es el perfil del jugador, pero los clubes pueden tener que llegar a un compromiso entre su presupuesto y el perfil exacto que necesitan.

Como método más realista de visualizar los perfiles de los jugadores en el entorno de un club, hemos proporcionado un gráfico de radar de ejemplo de cómo se pueden evaluar los puntos fuertes y débiles de un jugador en función de determinados atributos (véase la Figura 2). Puede utilizarse para comparar dos objetivos de traspaso, o para comparar un posible fichaje con el jugador que ya tiene en el club.

Como muestra el ejemplo siguiente, los atributos de Ryan Bertrand se basan en una buena defensa, en la que es eficaz para sumarse al ataque siempre que sea posible. Por otra parte, Danny Rose puede no ser tan fuerte defensivamente, pero ve más el balón y es probable que proporcione más oportunidades para el equipo. Este es un ejemplo de las decisiones que pueden tomar los clubes en sus planes de fichajes, y el uso de esta herramienta basada en el algoritmo de clustering podría ser un método objetivo para hacerlo.

 

Figura 2: La escala del gráfico de radar representa la clasificación percentil de los jugadores en cada dimensión. Tomado de todos los jugadores incluidos en el análisis

Resumen

Con el acceso a más datos de ligas de todo el mundo, este modelo puede ser aún más potente para dar a los clubes una ventaja competitiva en su política de fichajes. Proporciona un método rápido y rentable que puede aplicarse y actualizarse fácilmente en un club, tanto dentro de una misma temporada como entre temporadas. Por supuesto, (como siempre ocurre con la analítica) hacemos hincapié en que este modelo puede implementarse como una herramienta útil para acompañar a los métodos típicos de scouting que existen actualmente, y no sustituirlos por completo. Lo que sí proporciona es una buena base para identificar objetivamente posibles objetivos de traspaso, sin prejuicios, para que los ojeadores informen sobre ellos. De hecho, este método puede utilizarse como una buena calibración entre los ojeadores tradicionales y los analistas, para determinar si el perfil subjetivo de un jugador objetivo coincide con su perfil estadístico. Dada la escalada de los precios de los jugadores en Europa, la utilización de este modelo podría ahorrar mucho dinero a los clubes en el mercado de fichajes y ayudar a proporcionar un mecanismo de filtrado para evitar las "compras de pánico" que han asolado a tantos equipos a lo largo de los años.

 

Recibimos comentarios muy positivos al presentar este trabajo en el OptaPro Forum de este año. Si desea más información, puede ponerse en contacto con Mark y Mladen en Twitter en @MarkCarey93 y @Mladen_Sormaz.