Skip to Main Content

Introduction d'un cadre de possession

Par : Stats Perform

Au cours de l'année écoulée, les travaux d'analyse du football ont largement évolué, passant de l'application de mesures centrées sur des événements uniques sur le ballon à une approche plus globale par l'analyse des séquences d'événements qui constituent une période de possession.

Cette approche permet souvent de fournir le contexte supplémentaire qui fait parfois défaut aux mesures portant sur un seul événement. Prenons l'exemple des buts escomptés (xG). Ce modèle tient compte des tirs antérieurs et de caractéristiques telles que l'emplacement du terrain et l'angle par rapport au but, et estime la probabilité que le tir aboutisse à un but. L'intégration du type d'assistance dans le modèle xG est également courante.

Inclure les passes décisives est une extension logique de la réflexion sur ce qui fait une bonne occasion et on pourrait même aller plus loin en considérant les secondes passes décisives ou d'autres types d'événements (dribbles) qui précèdent un tir. Les mesures à événement unique de ce type nécessitent souvent un cadre de contextualisation, et c'est là que le modèle des possessions trouve sa place.

Regardez notre vidéo d'explication ci-dessous :

Enchaîner les événements

Nous avons déjà écrit sur l'enchaînement d'événements pour redéfinir les possessions, mais nous avons depuis formalisé ce cadre en un modèle à partir duquel un certain nombre de statistiques utiles et nouvelles peuvent être dérivées au niveau du joueur, de l'équipe et de l'événement. De nombreux praticiens de l'analyse du football ont également démontré des idées et des algorithmes similaires.

Les détails du modèle de possessions Opta sont similaires à ceux décrits dans l'article de 2012 ci-dessus, mais les événements sont organisés en séquences et en possessions.

Les séquences sont définies comme des passages de jeu appartenant à une équipe et se terminant par des actions défensives, des arrêts de jeu ou un tir.

Les possessions sont définies comme une ou plusieurs séquences consécutives appartenant à la même équipe. Une série de passes menant à un tir qui est arrêté et qui aboutit à un coup de pied de coin constitue une possession puisque la même équipe conserve le contrôle du ballon, mais plus d'une séquence puisque le ballon n'est plus en jeu. Une possession prend fin lorsque l'équipe adverse prend le contrôle du ballon.

Il convient de noter quelques caractéristiques importantes de ce modèle :

- Chaque événement n'appartient pas à une séquence ou à une possession
- De même, chaque seconde d'un match où le ballon est en jeu n'est pas marquée comme appartenant à une équipe particulière.
- Une séquence commence lorsqu'un joueur effectue une action contrôlée sur le ballon. Cela inclut les passes mais pas les événements défensifs tels que les tacles et les interceptions, à moins que ces événements ne soient suivis d'une action contrôlée telle qu'une passe ou un dribble.
- Le nombre de possessions appartenant à chaque équipe ne peut différer que d'une seule dans un match donné. Cela peut sembler contre-intuitif par rapport à la notion traditionnelle de pourcentage de possession, mais il est logique, lorsqu'on compte les possessions individuelles, que si une équipe met fin à la possession, l'autre équipe commence une possession.
- Cependant, le temps de possession de chaque équipe et le nombre de séquences au sein des possessions d'une équipe donnée ne doivent pas nécessairement être égaux.

Prenons l'exemple de cette séquence (dans ce cas, il s'agit également d'une possession), où Liverpool commence par une passe de la tête (en vert) de Joel Matip et termine par un tir sur le poteau (flèche verte).

 

La séquence ci-dessus nous indique où et quel type d'événement a permis à Liverpool de récupérer le ballon avant son tir. Nous savons également qu'il s'est écoulé environ 14,5 secondes entre la récupération du ballon et le tir, et que la séquence tracée entre tous les événements a couvert 126,44 mètres, 55,96 mètres si l'on ne considère que la distance parcourue directement vers le haut du terrain.

Dans cette séquence, nous pouvons également identifier le nombre de passes dans la préparation de ce tir.

Tendances aux possessions

L'histogramme ci-dessous montre la distribution de base du nombre de possessions par match et la fréquence des différents nombres de possessions. Les matchs comptent généralement un peu moins de 200 possessions par match, soit 90 à 100 par équipe.

 

 

Le graphique ci-dessous montre la distribution des longueurs de séquences sur l'ensemble des séquences de la saison 2016-17 de la Premier League. Comme vous pouvez le voir, de nombreuses séquences sont courtes et sont interrompues avant d'avoir couvert beaucoup de terrain, et la tendance générale est que la fréquence diminue pour des longueurs totales de plus en plus importantes.

 

 

Vitesse directe

La vitesse directe est un exemple de statistique qui peut être calculée à partir d'une séquence. Nous la définissons comme le nombre de mètres parcourus par le ballon (en mesurant directement le terrain), divisé par le temps total de la séquence.

Si l'on se réfère à la séquence précédente de Liverpool, la vitesse directe serait de 3,85 mètres par seconde (55,96 mètres divisés par 14,5 secondes). Si l'on compare avec d'autres, il s'avère que cette séquence est relativement rapide. Encore une fois, cela est plus pertinent au niveau de la séquence qu'au niveau des possessions, puisque les interruptions dans les possessions rendent les mesures de vitesse moins significatives.

Vous pouvez voir ci-dessous la vitesse directe médiane des séquences de jeu ouvert pour les équipes de Premier League en 2016/17. Il est intéressant de noter que cela permet de saisir certains éléments de style qui ne sont pas nécessairement corrélés à des résultats positifs, comme le montre le fait qu'Arsenal se situe entre Stoke City et Leicester, tandis que Manchester United est plus proche de Hull et de Bournemouth.

 

 

Présentation des applications tactiques

Le cadre des possessions peut répondre à de nombreuses questions qu'un analyste ou un entraîneur peut se poser et que les mesures d'un seul événement ont souvent du mal à résumer. Plus précisément, il permet de répondre aux questions relatives à la manière dont les schémas et les actions se succèdent.

Pour un exemple plus détaillé, examinons comment le caractère direct d'une équipe change en fonction de deux facteurs : l'endroit où elle récupère le ballon et le fait qu'elle joue en largeur ou au centre.

Pour répondre à cette question, il est nécessaire de disposer d'un emplacement de départ et d'une notion de largeur comme caractéristiques des séquences. Le regroupement des séquences sur la base de leur emplacement de départ (moitié propre contre moitié adverse) répond au premier objectif. Pour catégoriser la largeur, j'ai défini les séquences comme étant soit larges, soit centrales, en déterminant si la majeure partie de la progression vers le haut du terrain se déroulait dans le canal central ou dans l'un des canaux larges illustrés ci-dessous.

Au départ, Chelsea ne se distingue pas par sa vitesse directe. Cependant, si l'on considère les divisions spécifiques basées sur le lieu de départ et la largeur de la possession, nous pouvons souligner qu'ils se classent parmi les trois premiers de la Premier League 2016-17 selon cette métrique lorsqu'ils récupèrent le ballon dans leur propre moitié de terrain et progressent de manière centrale (2,47 m/s, contre 1,93 m/s lorsqu'ils progressent de manière centrale à partir de leur propre moitié de terrain).

Il s'agit bien sûr d'un exemple un peu particulier mais qui montre bien comment le contexte fourni par des événements multiples peut permettre à des approches statistiques de répondre à des questions auxquelles il est parfois difficile de répondre avec des métriques portant sur un seul événement. Un exemple similaire a également été adopté par Will Gürpinar-Morgan dans sa présentation au 2017 OptaPro Analytics Forum.

Lors de l'application des données d'événements à l'analyse du jeu, ce cadre de style possessions - qui devient maintenant courant - peut considérablement faciliter ce type de travail, en offrant une plate-forme permettant de mieux comprendre l'approche stylistique globale d'un joueur, d'une équipe ou d'une ligue.

 

Au nom d'OptaPro, j'aimerais profiter de cette occasion pour remercier Michael Caley, Garry Gelade, Sam Green et Ian Graham pour leurs réflexions et leurs commentaires concernant ce modèle.