Skip to Main Content

Utiliser la science des réseaux pour quantifier l'identifiabilité des équipes de football

 

Dans un blog invité pour Stats Perform, Javier Buldú et David Garrido présentent les résultats d'un projet de recherche qui a appliqué des données événementielles, issues de la saison 2017/18 de LaLiga, dans le but d'établir dans quelle mesure une équipe maintient son style de jeu au cours d'une saison.

 

Par : Stats Perform

Javier Buldú et David Garrido ont présenté un poster lors du Forum OptaPro 2020, qui a introduit une approche de la science des réseaux pour quantifier la façon dont le style de jeu d'une équipe est maintenu au cours d'une saison, sur la base de la persistance des schémas de passes, en utilisant les données Opta .

Dans ce blog, ils décrivent la méthodologie qui sous-tend leur présentation, ainsi qu'un résumé des principales conclusions.

Cliquez ici pour voir leur affiche.

Présenter les équipes de football comme des systèmes complexes

"Un système complexe est un système composé de nombreux éléments susceptibles d'interagir entre eux. Les systèmes complexes sont des systèmes dont le comportement est intrinsèquement difficile à modéliser en raison des dépendances, des compétitions, des relations ou d'autres types d'interactions entre leurs parties ou entre un système donné et son environnement"

Le cerveau, le climat terrestre et les écosystèmes sont des exemples évidents de systèmes complexes. Nous pensons également que le football a de bonnes raisons d'être classé dans cette catégorie.

Pourquoi ?

Pendant un match de football, vingt-deux éléments, appelés joueurs, interagissent les uns avec les autres de manière complexe, en créant des dépendances, en se faisant concurrence et, plus important encore, en générant des propriétés émergentes telles que des "schémas de jeu". Pour ces raisons, les sciences de la complexité constituent une alternative viable pour analyser les ensembles de données relatives au football, en introduisant de nouvelles perspectives dans l'analyse du beau jeu.

Cela s'explique par la nature complexe du football qui, pour paraphraser le paradigme fondateur des sciences de la complexité, "ne peut être analysé en examinant ses composants individuellement (c'est-à-dire les joueurs) mais, au contraire, en considérant le système dans son ensemble". Même le joueur le plus performant d'un match reconnaît que "ce n'est pas seulement moi, c'est l'équipe".

Traduire l'activité d'une équipe en un réseau complexe est l'une des nombreuses approches basées sur les sciences de la complexité. L'organisation d'une équipe peut être analysée en tenant compte de l'interaction entre ses joueurs par le biais de passes. Nous pouvons construire des réseaux de passes, qui contiennent des informations sur la manière dont le ballon a été déplacé, d'un joueur à l'autre, pendant toute la durée du match.

Les réseaux de passage sont des "réseaux complexes" pour deux raisons principales :

1. Ils sont composés de nœuds (joueurs) et de liens (passes) entre eux ;

2. L'interaction entre les nœuds suit certaines règles "complexes".

En outre, ces réseaux ne sont pas faciles à analyser car ils sont dirigés (c'est-à-dire que les liens entre les joueurs ont une certaine direction), pondérés (le poids des liens correspond au nombre de passes entre les joueurs), intégrés dans l'espace (la position euclidienne du ballon et des joueurs est très importante) et évoluent dans le temps (le réseau change continuellement de structure).

La figure 1 ci-dessous montre un exemple du réseau de passes du Real Madrid lors d'un match contre Barcelone de la saison 2017/18. Dans le graphique, la taille des joueurs est proportionnelle à leur importance dans le réseau de passes. Les joueurs sont placés dans la position moyenne à partir de laquelle leurs passes ont été effectuées. La largeur des liens est proportionnelle au nombre de passes entre deux joueurs. Enfin, les remplacements sont surlignés en vert.

Ce graphique permet de se faire rapidement une idée de la manière dont le Real Madrid a joué, de la façon dont il a occupé le terrain, de l'interaction entre ses joueurs et de l'évolution de l'organisation à la suite des remplacements.

Figure 1 : Illustration schématique d'un réseau de passes, Real Madrid vs Barcelone, saison 2017/2018.

Ce n'est qu'un aperçu de la manière dont la traduction de l'activité de l'équipe en un réseau peut nous aider à comprendre l'organisation de l'équipe. Une diversité de métriques peut être extraite de la structure du réseau à différentes échelles spatiales et temporelles, ce qui permet de mieux comprendre comment une équipe est organisée et comment les joueurs contribuent à la performance de l'équipe (Buldú et al., 2018).

Cette tâche relève de la science des réseaux, la branche des sciences de la complexité qui analyse les structures et les dynamiques des réseaux. La science des réseaux n'est pas encore totalement adaptée à l'analyse des données dans le domaine du football, mais elle a le potentiel de fournir de nouvelles perspectives sur les performances dans les années à venir.

Réseaux de passeurs de balle

Il existe d'autres façons de créer des réseaux de passes. Si nous nous intéressons davantage à l'organisation spatiale d'une équipe qu'au rôle des joueurs, nous pouvons construire et analyser des réseaux de passes sur le terrain. Dans ce cas, les nœuds du réseau ne sont pas des joueurs spécifiques, mais des régions spécifiques du terrain, qui sont reliées par des passes effectuées par les joueurs qui les occupent.

La figure 2 montre des exemples de réseaux de passes sur le terrain du FC Barcelone contre le Real Madrid.

Figure 2 : Les graphiques, de gauche à droite, représentent les réseaux de passes 3×3, 5×6 et 10×10 pour Barcelone, où les nœuds sont des régions du terrain et les liens représentent le nombre de passes entre ces régions.

Pourquoi tracer trois réseaux au lieu d'un seul ? La raison en est que le terrain peut être divisé en zones de tailles différentes, ce qui conduit à des réseaux de terrain d'échelles différentes. Ainsi, les trois réseaux de la figure 2 correspondent à la même équipe au cours du même match, la seule différence étant la taille des partitions. Toutefois, il convient de noter que la structure du réseau est différente en fonction du nombre de divisions, ce qui indique qu'une analyse des propriétés du réseau à différentes échelles est nécessaire.

L'identifiabilité des équipes de football

Maintenant que nous avons défini le cadre, il est temps de poser les questions :

  • Est-il possible de quantifier dans quelle mesure une équipe a un style de jeu défini ?
  • Quelles sont les équipes qui s'adaptent à leur adversaire et celles qui restent fidèles à leur style ?
  • Peut-on quantifier les équipes qui imposent leur style à l'adversaire au cours d'un match ?
  • Quelles sont les équipes qui se comportent différemment lorsqu'elles jouent à l'extérieur ?

Pour répondre à toutes ces questions, nous avons appliqué la science des réseaux à l'analyse de l'organisation des réseaux de passeurs de balle.

En utilisant les données d'un match, nous avons construit les réseaux de passage multi-échelles associés à chaque équipe et analysé leurs structures en utilisant différentes méthodologies issues de la science des réseaux.

De cette manière, nous avons pu identifier :

  • Quelles équipes ont imposé leur style de jeu à leurs adversaires ;
  • Ce à quoi ils doivent s'attendre de la part de leurs adversaires avant un match ;
  • Comment évaluer si une équipe a joué conformément à ce qui était attendu.

Notre seule source d'information était la façon dont chaque équipe passait le ballon, sans tenir compte du nombre de tirs, de buts, de tacles, de dribbles ou de toute autre action. Cependant, comme nous le verrons, les schémas de passes sont toujours capables de capturer l'essence de l'organisation d'une équipe.

Nous avons divisé le terrain en n x m régions (avec n =1,2,3,...10 et m =1,2,3,...10) et construit les réseaux de passage du terrain, où les nœuds correspondent aux N=(nxm ) régions du terrain etaij représente le nombre de passages de la région i à la région j.

Nous avons analysé, sur l'ensemble de la saison, les propriétés des matrices de connectivité résultantes A{aij} à différentes échelles spatiales. Les éléments des matrices de connectivité sont le nombre de passes entre les régions du terrain, c'est-à-dire l'abstraction mathématique des schémas de passes de chaque équipe. Nous avons calculé le paramètre de cohérence (C) de chaque équipe en quantifiant la similitude des matrices de connectivité d'une équipe donnée au cours de la saison.

En résumé, les équipes à forte cohérence ont maintenu la structure de leurs réseaux de passes tout au long de la saison, tandis que les équipes à faible cohérence ont modifié leur organisation d'un match à l'autre.

Ensuite, nous avons quantifié le caractère unique des réseaux de passes de chaque équipe. Pour ce faire, nous avons comparé la structure des réseaux de passes d'une équipe donnée avec celle des autres équipes de la compétition. Nous appelons ce paramètre la similarité rivale R. Enfin, nous avons défini le paramètre d'identifiabilité (I) d'une équipe comme le paramètre de cohérence C moins la similarité rivale R, c'est-à-dire I=C-R.

Les équipes ayant un paramètre d'identifiabilité élevé sont celles qui sont cohérentes et, en même temps, différentes des autres.

Notre méthodologie a des applications à la fois descriptives et prospectives. D'une part, nous avons pu identifier les équipes qui ont maintenu leur style de jeu ("forte identifiabilité") tout au long de la saison et celles qui, au contraire, n'ont pas eu un style cohérent ("faible identifiabilité").

En collaboration avec LaLiga, nous avons calculé le paramètre d'identifiabilité des équipes de première division espagnole de 2017/18.

La figure 3 montre les valeurs de l'identifiabilité de Barcelone et de Malaga, les équipes qui ont terminé respectivement en haut et en bas du tableau. Sur l'axe horizontal, nous avons représenté le nombre de nœuds en lesquels la moelle est divisée puisque, comme nous l'avons expliqué, toutes les échelles doivent être analysées. Il est intéressant de noter que nous avons observé que les divisions de la moelle d'environ 50 zones (nœuds) étaient celles qui permettaient de mieux identifier le style de jeu du FC Barcelone. En ce qui concerne Málaga, nous pouvons constater que la capacité d'identification est plutôt faible à toutes les échelles.

Figure 3 : Le graphique de gauche représente le paramètre d'identifiabilité de Barcelone, en fonction du nombre de divisions (nœuds) du terrain. À droite, la même analyse est présentée pour Malaga.

Application

Ces informations peuvent aider les équipes d'entraîneurs à se préparer à un match en identifiant l'approche attendue de leurs adversaires.

Par exemple, il est possible pour une équipe d'évaluer l'identifiabilité de son prochain adversaire et de décider d'adapter ou non sa propre approche en fonction du style de jeu de l'adversaire (lorsque l'équipe adverse a une identifiabilité élevée) ou d'essayer de lui imposer son propre style (dans le cas où elle est confrontée à une équipe ayant une faible identifiabilité).

Nous pouvons également utiliser l'identifiabilité pour quantifier, pour chaque match, l'équipe qui a joué de la manière la plus similaire à son propre style.

Le tableau 1 montre la différence d'identifiabilité match par match entre les équipes qui jouent à domicile et celles qui jouent à l'extérieur pendant la saison 2017/2018 de LaLiga.

Les matches où l'équipe locale, indiquée sur l'axe vertical, a imposé son propre style de jeu (c'est-à-dire qu'elle avait une plus grande identifiabilité) sont surlignés en jaune, tandis que les cellules vertes correspondent aux équipes à l'extérieur qui ont imposé leur style. Les équipes ont été classées en fonction du classement final de la ligue, dans le but de montrer le lien entre l'identifiabilité et la performance d'une équipe. Les cellules jaunes apparaissent principalement au-dessus de la ligne diagonale de la matrice, ce qui indique que lorsque deux équipes s'affrontent, celle qui est la mieux classée a une probabilité plus élevée d'imposer son propre style de jeu.

Si l'on s'intéresse aux équipes individuelles, on constate que Barcelone a remporté le "concours d'identifiabilité" dans un plus grand nombre de matches, tant à domicile qu'à l'extérieur, suivi de près par le Real Madrid. Il convient toutefois de souligner que les différences d'identifiabilité ne sont pas toujours un indicateur du résultat du match, car dans certains cas, l'identifiabilité était plus élevée pour l'équipe qui a perdu le match. C'est la nature même du football, où le fait de jouer à sa façon ne garantit pas toujours le succès.

Tableau 1 : Les équipes locales sont classées sur l'axe vertical, en fonction de leur position finale dans le championnat. Les équipes en déplacement figurent sur l'axe horizontal et sont classées de la même manière. Le résultat du match est affiché dans chaque cellule. En jaune, l'équipe locale a imposé son style ; en vert, l'équipe visiteuse. Les cellules en bleu correspondent aux matches pour lesquels il n'y avait pas de différence claire entre l'identifiabilité des deux équipes.

Pour conclure, il convient également de souligner qu'il est possible d'obtenir une estimation en temps réel du paramètre d'identifiabilité pendant le déroulement d'un match, ce qui permet de savoir si une équipe, ou son adversaire, joue comme prévu. Il s'agit là d'une information précieuse, qui pourrait potentiellement éclairer la prise de décision du banc de touche pendant le match.

D'autres applications de cette méthodologie permettraient également aux analystes d'évaluer quelles équipes se comportent différemment lorsqu'elles jouent à domicile ou à l'extérieur, ou d'identifier les zones du terrain où se produisent des écarts par rapport aux schémas de passes attendus d'une équipe au cours d'un match.


Références

Buldú, J. M., Busquets, J., Martínez, J. H., Herrera-Diestra, J. L., Echegoyen, I., Galeano, J., & Luque, J. (2018). Utiliser la science des réseaux pour analyser les réseaux de passes du football : dynamique, espace, temps et nature multicouche du jeu. Frontiers in Psychology, 9, 1900.

Buldú, J. M., Busquets, J., & Echegoyen, I., & F. Seirul.lo (2019). Définir une équipe de football historique : L'utilisation de la science des réseaux pour analyser le FC Barcelone de Guardiola. Nature Scientific Reports, 9(1), 1-14.


Titulaire d'un doctorat en physique appliquée, Javier Buldú est le coordinateur du groupe des systèmes complexes à l'université King Juan Carlos de Madrid, ainsi que le chercheur principal du laboratoire des réseaux biologiques au centre de technologie biomédicale.

Il peut être contacté par courrier électronique à l'adresse suivante : javier.buldu@urjc.es

David Garrido est étudiant en doctorat au Centre de technologie biomédicale et à l'université King Juan Carlos, à Madrid, en Espagne.