
Mark Carey et Mladen Sormaz ont présenté un poster lors de l'édition 2018 du Forum OptaPro Analytics. Cet article fournit un compte rendu approfondi de leur analyse. Leurs posters peuvent également être lus ici :
Le rôle de l'arrière latéral a radicalement changé ces dernières années. De nombreuses équipes européennes se concentrent désormais sur la manière d'impliquer leurs latéraux dans l'attaque, plus encore que dans la protection de leur défense. En effet, l'utilisation des latéraux semble être revenue à la mode, notamment avec la formation 3-5-2 d'Antonio Conte qui a fait ses preuves lors de la conquête du titre de Premier League par Chelsea la saison dernière. Mais plutôt que d'observer subjectivement les différents styles de jeu des latéraux à travers l'Europe, peut-on quantifier ces styles ?
Nous nous sommes concentrés sur les latéraux car leur style de jeu est devenu très varié au cours des dernières saisons, mais cette méthode peut s'appliquer à n'importe quel poste. Nous voulions fournir une mesure plus détaillée et objective des différents profils des latéraux, qui tienne compte des dimensions plus larges du style d'un joueur plutôt que de ses statistiques individuelles. Pour ce faire, nous avons utilisé les données Opta F9 (totaux agrégés des matches) pour effectuer une analyse des composantes principales (ACP) avec rotation varimax afin de réduire la dimensionnalité des données et de déterminer les profils plus larges des latéraux que nous avons introduits dans l'analyse (les détails de notre analyse ACP sont disponibles ici). L'étape suivante a consisté à utiliser ces informations pour quantifier les latéraux qui se ressemblent le plus en termes de style de jeu.
Les chiffres
Nous avons analysé 417 défenseurs latéraux des saisons 2015/16 et 2016/17 dans les cinq grandes compétitions européennes. Après que l'ACP a montré des profils stables sur les deux saisons, nous avons entré nos données de la saison 2016/17 dans une analyse de cluster. Les individus présentant des profils similaires ou apparentés sont placés ensemble et sont séparés de ceux dont le profil est différent. Il convient de noter qu'il est difficile de comparer les joueurs d'une ligue à l'autre, et nous avons fait de notre mieux pour corriger cet aspect dans notre analyse.
Les résultats de notre analyse sont très intéressants, avec 11 groupes de joueurs créés sur la base de leurs statistiques de performance (voir figure 1). Il est important de noter que les joueurs de haut niveau que l'on s'attendrait à voir regroupés sur la base de leur style de jeu tombent effectivement dans le même groupe (par exemple Marcelo, Alex Sandro, Davide Zappacosta), ce qui souligne la fiabilité de l'analyse et permet de passer le "test de l'œil". La figure 1, ci-dessous, crée des groupes plus larges et des sous-groupes plus spécifiques, chaque ligne représentant un joueur individuel.
Nous avons utilisé une méthode agglomérative, qui cherche à associer tous les joueurs à un "partenaire de style", puis à élargir le groupe en comparant cette paire à d'autres paires et groupes de manière itérative, jusqu'à ce qu'il atteigne le sommet de l'arbre. Pour rappel, la distance entre les lignes (représentant un joueur) ci-dessous indique la similitude de leur style de jeu.
Traditionnellement, il existe des moyens de déterminer le nombre de groupes dans un dendrogramme en coupant les branches de l'arbre à une hauteur constante. Nous ne l'avons pas fait ici, car le principe de la perte de similarité des lecteurs au fur et à mesure que l'on monte dans l'arbre reste valable, que l'on coupe l'arbre ou non. Les branches colorées sont là pour faciliter la lisibilité de la figure, mais si vous voulez savoir comment procéder, il existe un bon article intitulé "Defining clusters from a hierarchical cluster tree : The Dynamic Tree Cut package for R".
Quelques exemples de chaque groupe sont présentés ci-dessous. Comme nous l'avons vu, les joueurs regroupés ont un sens footballistique, mais étant donné que l'algorithme de regroupement ne suppose aucune connaissance du football, ces résultats renforcent la fiabilité de l'analyse.
Comment l'utiliser ?
La plus grande utilité de l'analyse en grappes est que le modèle peut objectivement quantifier et regrouper les joueurs qui sont les plus similaires les uns aux autres dans leur style de jeu, sans aucun préjugé ou connaissance préalable du football. Cela peut aider considérablement les clubs de football sur le marché des transferts, en particulier ceux dont les budgets sont stricts. Par exemple, les clubs peuvent créer une liste de présélection pour un profil de joueur qui correspondrait à leur propre style de jeu. Le personnel chargé du recrutement peut également identifier la recrue idéale (par exemple Marcelo) et utiliser le modèle pour explorer un certain nombre de joueurs alternatifs qui seraient très similaires à un prix plus abordable (par exemple Cristian Ansaldi). Cela peut être visualisé simplement dans le dendrogramme ci-dessus, en recherchant un joueur et en "remontant l'arbre" pour explorer les joueurs les plus similaires à ce joueur. Plus vous montez dans l'arbre, moins le profil du joueur est similaire, mais les clubs peuvent être amenés à faire des compromis entre leur budget et le profil exact dont ils ont besoin.
Pour une méthode plus réaliste de visualisation des profils des joueurs dans l'environnement d'un club, nous avons fourni un exemple de diagramme en radar qui permet d'évaluer les forces et les faiblesses d'un joueur en fonction de certains attributs (voir figure 2). Ce diagramme peut être utilisé pour comparer deux cibles de transfert ou pour comparer une recrue potentielle avec un joueur déjà présent dans le club.
Comme le montre l'exemple ci-dessous, les qualités de Ryan Bertrand reposent sur une bonne défense, qui lui permet de participer efficacement à l'attaque chaque fois que cela est possible. En revanche, Danny Rose n'est peut-être pas aussi performant sur le plan défensif, mais il voit plus souvent le ballon et est susceptible d'offrir plus d'occasions à l'équipe. Il s'agit là d'un exemple des décisions que les clubs peuvent prendre dans le cadre de leurs plans de transfert, et l'utilisation de cet outil basé sur l'algorithme de regroupement pourrait constituer une méthode objective pour y parvenir.
Résumé
Avec l'accès à davantage de données provenant de ligues du monde entier, ce modèle peut être encore plus efficace pour donner aux clubs un avantage concurrentiel dans leur politique de transfert. Il s'agit d'une méthode rapide et rentable qui peut être facilement mise en œuvre et actualisée dans un club, à la fois au cours d'une saison et d'une saison à l'autre. Bien entendu, (comme c'est toujours le cas avec les analyses), nous insistons sur le fait que ce modèle peut être mis en œuvre en tant qu'outil utile pour accompagner les méthodes de scouting typiques qui existent actuellement, et non pour les remplacer complètement. Ce qu'il fournit, c'est une bonne base pour identifier objectivement les cibles potentielles de transfert, sans parti pris, pour que les recruteurs puissent ensuite en rendre compte. En effet, cette méthode peut être utilisée comme un bon étalonnage entre les recruteurs traditionnels et les analystes, afin de déterminer si le profil subjectif d'un joueur cible correspond à son profil statistique. Compte tenu de la flambée des prix des joueurs en Europe, l'utilisation de ce modèle pourrait permettre aux clubs d'économiser beaucoup d'argent sur le marché des transferts et contribuer à fournir un mécanisme de filtrage pour éviter les "achats de panique" qui ont frappé tant d'équipes au fil des ans.
Nous avons reçu des réactions très positives lors de la présentation de ce travail au Forum OptaPro de cette année. Pour plus d'informations, vous pouvez joindre Mark et Mladen sur Twitter à @MarkCarey93 et @Mladen_Sormaz.