En el último año de trabajo analítico en el fútbol, se ha producido un amplio cambio de la aplicación de métricas que giran en torno a eventos individuales en el balón a la adopción de un enfoque más holístico mediante el análisis de secuencias de eventos que constituyen un período de posesión.
A menudo, este enfoque puede proporcionar el contexto adicional que a veces falta en las métricas de un solo evento. Consideremos los goles esperados (xG). Tiene en cuenta los tiros anteriores y características como la ubicación del lanzamiento y el ángulo hacia la portería, y calcula la probabilidad de que el tiro acabe en gol. También es habitual incorporar el tipo de asistencia en el modelo xG.
Incluir las asistencias es una extensión lógica de la reflexión sobre lo que constituye una buena ocasión, y se podría ampliar aún más considerando las segundas asistencias u otros tipos de eventos (regates) que preceden a un tiro. Este tipo de métricas a menudo requieren un marco contextual, que es donde encaja un modelo de posesiones.
Vea nuestro vídeo explicativo a continuación:
Encadenar acontecimientos
En el pasado ya hemos escrito sobre cómo encadenar eventos para redefinir las posesiones, pero desde entonces hemos formalizado ese marco en un modelo del que pueden derivarse una serie de estadísticas útiles y novedosas a nivel de jugador, equipo y evento. Muchos profesionales del análisis futbolístico también han mostrado ideas y algoritmos similares.
Los detalles del modelo de posesiones de Opta son similares a los que describe el artículo anterior de 2012, pero los eventos se organizan en secuencias y posesiones.
Las secuencias se definen como pasajes de juego que pertenecen a un equipo y finalizan con acciones defensivas, interrupciones del juego o un disparo.
Las posesiones se definen como una o más secuencias seguidas pertenecientes al mismo equipo. Una serie de pases que conducen a un tiro que se salva y da lugar a un saque de esquina comprendería una posesión, ya que el mismo equipo conserva el control, pero más de una secuencia, ya que el balón ha salido del juego. Una posesión finaliza cuando el adversario se hace con el control del balón.
Merece la pena destacar algunas características importantes de este modelo:
- No todos los eventos pertenecen a una secuencia o posesión
- Del mismo modo, no todos los segundos de un partido en los que el balón está en juego se marcan como pertenecientes a un equipo determinado.
- Una secuencia comienza cuando un jugador realiza una acción controlada sobre el balón. Esto incluye pases, pero no acciones defensivas como entradas e intercepciones, a menos que estas acciones vayan seguidas de una acción controlada como un pase o un regate.
- El número de posesiones pertenecientes a cada equipo sólo puede diferir en una en un partido determinado. Esto puede parecer contraintuitivo en relación con la noción tradicional de porcentaje de posesión, pero es lógicamente coherente al contar las posesiones individuales que si un equipo termina la posesión, el otro comienza una posesión
- Sin embargo, tanto el tiempo de posesión de cada equipo como el número de secuencias dentro de las posesiones de un equipo determinado no tienen por qué ser iguales
Consideremos este ejemplo de secuencia (en este caso también una posesión), en la que el Liverpool comienza con un pase de cabeza (en verde) de Joel Matip y termina con un disparo a la madera (flecha verde).
La secuencia anterior nos indica dónde y qué tipo de acción recuperó el balón el Liverpool antes de su disparo. También sabemos que transcurrieron unos 14,5 segundos entre la recuperación del balón y el disparo, y que la secuencia trazada entre todos los acontecimientos abarcó 126,44 metros, 55,96 metros si consideramos únicamente la distancia recorrida directamente hacia arriba.
Dentro de esta secuencia, también podemos identificar el número de pases en la preparación de esta toma.
Tendencias de las posesiones
El siguiente histograma muestra la distribución básica del número de posesiones por partido, y con qué frecuencia se producen diferentes números de posesiones. Los partidos suelen tener algo menos de 200 posesiones por partido, o 90-100 por equipo.
El siguiente gráfico muestra la distribución de la longitud de todas las secuencias de la temporada 2016-17 de la Premier League. Como puedes ver, muchas secuencias son cortas y se interrumpen antes de cubrir mucho terreno, y la tendencia general es que la frecuencia disminuye para longitudes totales cada vez más largas.
Velocidad directa
Un ejemplo de estadística que puede calcularse a partir de una secuencia es la velocidad directa. Se define como el número de metros que recorre el balón (cuando se mide directamente hacia arriba), dividido por el tiempo total de la secuencia.
Si nos referimos a la secuencia anterior de Liverpool, la velocidad directa sería de 3,85 metros por segundo (55,96 metros divididos por 14,5 segundos). Si se compara con otras, resulta que se trata de una secuencia relativamente rápida. De nuevo, esto es más relevante a nivel de secuencia que a nivel de posesiones, ya que las interrupciones en las posesiones hacen que las métricas de velocidad sean menos significativas.
A continuación puedes ver la mediana de velocidad directa desde secuencias de juego abierto para los equipos de la Premier League en 2016/17. Es interesante observar que esto capta algunos elementos de estilo no necesariamente correlacionados con resultados exitosos, como demuestra que el Arsenal aparezca entre el Stoke City y el Leicester, mientras que el Manchester United está más cerca del Hull y el Bournemouth.
Introducción de aplicaciones tácticas
El marco de las posesiones puede responder a muchas preguntas que un analista o un entrenador podrían plantearse y que las métricas de un solo evento a menudo tienen dificultades para encapsular. En concreto, puede responder a preguntas sobre cómo se suceden los patrones y las acciones.
Para un ejemplo más detallado, veamos cómo cambia la dirección de juego de un equipo en función de dos factores: dónde recupera el balón y si juega a lo ancho o en el centro.
Para responder a esta pregunta, es necesario disponer de un lugar de inicio y de una noción de anchura como características de las secuencias. Agrupar las secuencias en función de su lugar de inicio (mitad propia frente a mitad contraria) sirve para el primer propósito. Para categorizar la anchura, definí las secuencias como anchas o centrales, teniendo en cuenta si la mayor parte del avance hacia arriba tenía lugar en el canal central o en uno de los canales anchos que se muestran a continuación.
En principio, el Chelsea no destaca por su velocidad directa. Sin embargo, si tenemos en cuenta las divisiones específicas basadas en la ubicación de inicio y la amplitud de la posesión, podemos destacar que se encuentran entre los tres mejores de la Premier League 2016-17 según esta métrica cuando recuperan el balón en su propio campo y progresan por el centro (2,47 m/s, en comparación con 1,93 m/s cuando progresan por el centro desde su propio campo).
Se trata, por supuesto, de un ejemplo un tanto particular, pero es un buen escaparate de cómo el contexto proporcionado por múltiples eventos puede permitir que los enfoques estadísticos respondan a preguntas que a veces son difíciles de responder con métricas de un solo evento. Will Gürpinar-Morgan también adoptó un ejemplo similar en su presentación en el OptaPro Analytics Forum de 2017.
Al aplicar los datos de eventos para analizar el juego, este marco de estilo de posesiones -que ahora se está convirtiendo en algo habitual- puede ayudar significativamente a este estilo de trabajo, ofreciendo una plataforma para obtener una comprensión más informada del enfoque estilístico general de un jugador, equipo o liga.
En nombre de OptaPro, me gustaría aprovechar esta oportunidad para dar las gracias a Michael Caley, Garry Gelade, Sam Green e Ian Graham por sus reflexiones y comentarios sobre este modelo.




