Skip to Main Content

Introduction de la découverte des rôles : Générer des rôles basés sur des données dans le football professionnel d'élite

 

En définissant des rôles dans le modèle de jeu d'un club, les analystes en recrutement peuvent comparer directement et plus objectivement les joueurs qui correspondent aux paramètres de chaque rôle. Dans cet article, Stats Perform explique comment les modèles AI, alimentés par des données d'événements, peuvent détecter automatiquement les rôles sur le terrain des joueurs participant à des compétitions de premier plan dans le monde entier.

 

Par : Andy Cooper

Une approche différente du scoutisme technique

Au cours de la dernière décennie, le processus d'identification, de suivi et d'évaluation des candidats au recrutement mis en place par les services de recrutement a constamment évolué grâce aux nouvelles technologies, alimentées par la vidéo et les données, qui sont devenues disponibles.

Toutefois, cela a-t-il entraîné un changement notable dans la manière dont un club définit ses critères d'évaluation des joueurs ? Au sein des départements, des indicateurs de performance clés ont été définis sur la base du modèle de jeu, qui sont mesurés par rapport aux performances d'un joueur. Les ICP peuvent également être appliqués à des modèles spécifiques à un poste pour permettre aux recruteurs d'évaluer subjectivement les joueurs, ce qui ajoute une couche supplémentaire de contexte.

Mais si ces processus sont incontestablement plus ciblés et plus rigoureux que ceux mis en place il y a dix ans, il reste une question majeure qui n'a pas été correctement abordée : quelle est la fiabilité de l'évaluation des joueurs sur la base des indicateurs clés de performance d'un poste spécifique ?

Aujourd'hui, les joueurs et leurs postes continuent d'être étiquetés de la même manière qu'il y a 25 ans : défenseur latéral, défenseur central, attaquant central, etc. Cependant, si l'on compare les perspectives de recrutement dans différents clubs au même "poste", beaucoup possèdent des qualités fondamentalement différentes, ce qui rend difficile leur évaluation objective par rapport aux mêmes indicateurs de performance.

C'est là qu'intervient le nouveau concept Role Discovery de Stats Perform. Role Discovery est une nouvelle méthode d'évaluation des joueurs, mise au point par notre équipe d'AI , qui s'attaque aux limites de l'évaluation des joueurs sur la base de leur position. Au lieu de cela, elle se concentre sur le profil des joueurs en fonction de leur rôle dans l'équipe.

En appliquant des processus d'apprentissage non supervisés, Role Discovery permet aux analystes en recrutement d'évaluer les joueurs dans le cadre d'un style d'équipe plus large : ils regroupent les candidats en fonction des tendances et des caractéristiques clés requises pour remplir chaque rôle dans un modèle de jeu.

Dans cet article, nous allons passer en revue quelques-uns des éléments clés de la découverte des rôles, qui permettra aux clubs d'envisager une nouvelle approche du recrutement technique pour l'année prochaine.

Étape 1 : Identifier les tendances spatiales de chaque joueur, dans le contexte de son style de jeu

Au total, Role Discovery détecte 18 types de rôles différents sur l'ensemble du terrain, à partir de 29 groupes de joueurs différents. Le point de départ de la détection des rôles est l'identification des points de départ et d'arrivée les plus courants des passes d'un joueur, afin de générer des cartes thermiques spatiales.

Le graphique ci-dessous montre les trois zones les plus courantes sur le terrain d'où deux attaquants centraux, Robert Lewandowski et Roberto Firmino, ont effectué leurs passes au cours de la saison 2018/19.

Bien que les deux joueurs soient étiquetés comme attaquants centraux, ces cartes thermiques montrent clairement que les deux joueurs ont joué des rôles différents dans leurs clubs respectifs. Lewandowski passait le plus souvent dans les zones centrales autour du bord et à l'intérieur de la surface. À l'inverse, Firmino a joué beaucoup de ballons depuis le demi-espace à l'intérieur du couloir droit.

Cependant, cette information seule ne donne qu'un aperçu limité - et elle ne s'inscrit pas dans le contexte des situations de match. Par conséquent, en appliquant le cadreStats Perform Playing Styles aux touches d'un joueur, nous pouvons commencer à comprendre comment chaque joueur influence une phase de jeu spécifique.

Cela met en évidence d'autres différences stylistiques entre Lewandowski et Firmino. Les graphiques ci-dessous montrent le nombre de touches de balle de chaque joueur lorsque son équipe est engagée dans un style spécifique, par rapport aux autres joueurs des cinq meilleurs championnats.

Par rapport à la moyenne, le groupe de Firmino est plus fortement impliqué dans la phase de contre-attaque et est également très présent dans la phase de menace soutenue. Le groupe de Lewandowski est inférieur à la moyenne dans la phase de menace soutenue, ce qui indique que son rôle n'est pas aussi impliqué dans les séquences de possession de balle de son équipe dans le tiers offensif que les autres rôles.

Étape 2 : Quantifier la qualité des contributions d'un joueur en possession du ballon

Après avoir établi les zones du terrain où un joueur touche le plus souvent le ballon et leur contribution à des styles de jeu spécifiques, Role Discovery applique ensuite le cadre de la valeur de possession (PV) de Stats Performpour déterminer comment l'implication d'un joueur pendant les séquences de possession augmente la probabilité de marquer pour son équipe au cours des dix secondes de jeu suivantes.

La valeur de possession attribue des crédits aux joueurs sur la base de leurs contributions positives et négatives, couvrant des événements clés sur le terrain tels que les passes, les dribbles et les traversées, ainsi que des actions défensives telles que les tacles et les interceptions.

Le tableau ci-dessous répertorie les joueurs qui ont enregistré le rendement PV+ le plus élevé par 90 pour Liverpool lors de la saison 2018/19 de Premier League, mettant en évidence les contributions progressives de Mo Salah, Andrew Robertson et Firmino à l'augmentation de la probabilité de but.

Une autre nouvelle mesure appliquée pour analyser l'utilisation du ballon par un joueur est la probabilité de réussite de la passe (xP). Ce modèle prend en compte différents facteurs, notamment la distance et l'angle d'une passe et d'autres éléments contextuels d'un mouvement de possession, afin d'établir la probabilité qu'une passe soit achevée.

En appliquant cette métrique, nous pouvons obtenir une meilleure compréhension des tendances d'un joueur en possession du ballon - pour identifier les joueurs qui tentent et réalisent une forte proportion de passes pénétrantes qui, du point de vue de la probabilité, sont plus difficiles à réaliser.

Pour intégrer ces données dans le modèle de découverte des rôles, nous avons divisé le terrain en différentes zones, afin de mettre en évidence l'emplacement et le taux d'achèvement xP d'un joueur dans chaque zone, pour déterminer où il apporte une contribution essentielle à son équipe.

En combinant PV et xP, nous pouvons évaluer la récompense potentielle d'un joueur qui fait une passe, par rapport au risque potentiel, et comparer ses performances à celles d'autres joueurs.

Pour en revenir à notre comparaison entre Lewandowski et Firmino, le graphique ci-dessous montre les performances de chaque joueur lorsqu'il effectue des passes dans une zone de milieu offensif central au cours de l'année 2018/19.

Le taux d'exécution xP de Firmino, supérieur à 0,75, indique qu'il effectue des passes sûres et à forte probabilité dans cette zone. Dans le même temps, il augmente également la probabilité que son équipe marque, en se situant dans le top 10 % du percentile pour le PV progressif.

Lewandowski, qui est un type d'attaquant différent, est plus proche de la moyenne pour le taux d'exécution xP, et se situe dans les 10% inférieurs du percentile pour le PV, ce qui renforce le fait qu'il est impliqué dans moins de chaînes de possession et qu'il est plus susceptible de prendre beaucoup de tirs au but, ce qui fait de lui le dernier joueur d'une chaîne. Cependant, cela ne dit pas tout, et nous y reviendrons plus loin dans cet article.

Étape 3 : Établir comment un joueur est impliqué dans les séquences de possession

Pour mieux identifier la manière dont un joueur interagit avec ses coéquipiers, Role Discovery intègre un autre nouveau modèle, les chaînes de mouvement, qui identifie les schémas de passes les plus courants d'une équipe qui génèrent les PV les plus élevés sur le terrain.

Les chaînes de mouvement sont étiquetées sur la base de motifs de passes qui comprennent quatre passes, ce qui permet d'identifier la manière dont une équipe fait progresser le ballon et les joueurs impliqués.

Comme pour le xP, pour analyser les chaînes de mouvement, nous divisons le terrain en zones, afin d'identifier les schémas les plus fréquents, en utilisant le regroupement, de la manière dont une équipe déplace le ballon d'une zone à l'autre. Comme illustré ci-dessous, la zone de départ pourrait être la zone centrale du tiers défensif, la zone d'arrivée étant le bord de la surface de l'adversaire.

Les chaînes de mouvement peuvent également être appliquées dans le contexte des styles de jeu, afin d'identifier comment les équipes déplacent le ballon lorsqu'elles sont engagées dans un style spécifique. L'exemple ci-dessous montre les chaînes les plus dangereuses de Liverpool en 2018/19 qui se sont terminées dans la surface de réparation adverse lorsque l'équipe était en phase de construction, soulignant la façon dont elle joue par les canaux intérieur droit et intérieur gauche pour pénétrer dans la surface.

Étape 4 : Application de chaque modèle pour créer des rôles

Pour identifier l'implication d'un joueur individuel dans les chaînes de possession de son équipe, nous appliquons un modèle Chain2Vec, inspiré de Word2Vec, pour identifier les groupes de chaînes dans lesquels un joueur apparaît fréquemment, leur contexte et la façon dont le joueur interagit dans un seul motif de passe. Cette modélisation avancée par des techniques de Deep Learning fournit une représentation compacte de l'implication du joueur et de l'équipe.

Parallèlement, les cartes tactiles des joueurs sont appliquées pour fournir des informations sur le contexte spatial de chaque joueur, ainsi que les modèles de style de jeu, xP et PV. En outre, une ventilation du type de tirs en jeu libre effectués par un joueur et de leur emplacement est incluse.

Tous ces résultats sont ensuite appliqués au modèle final de découverte des rôles, à l'aide d'un algorithme de regroupement, le modèle de mélange gaussien, afin d'apprendre les regroupements et de séparer les joueurs en groupes distincts. À partir de ces groupes, nous sommes alors en mesure d'utiliser des descriptions fondées sur des données pour condenser plus de 400 descripteurs de joueurs individuels en 18 rôles distincts sur le terrain.

Ces rôles sont désignés comme suit (cliquez pour agrandir) :

Pour en revenir à Lewandowski et Firmino, après avoir établi que chaque joueur s'inscrit dans un rôle différent, nous pouvons maintenant les comparer à des joueurs dans leurs rôles respectifs plutôt que de faire des comparaisons directes.

Le graphique ci-dessous présente la même comparaison de passes que nous avons utilisée précédemment, mais cette fois-ci nous avons isolé les joueurs dans leurs rôles respectifs, qui sont surlignés en orange.

Dans le cas de Firmino, lorsqu'on le compare à tous les joueurs des cinq meilleurs championnats, il se classe dans le dixième centile supérieur pour le taux d'achèvement xP, mais lorsqu'on le compare uniquement à d'autres joueurs de la catégorie "Menace créative offensive", il est beaucoup plus proche de la moyenne.

En ce qui concerne Lewandowski, si on le compare uniquement à d'autres "attaquants avancés", on constate que ses passes sont beaucoup plus sûres que la moyenne et que si sa contribution en PV progressif est toujours inférieure à la moyenne, les chiffres ne sont pas aussi extrêmes que lorsqu'on les compare à l'ensemble des joueurs.

Conclusion : Rendre les comparaisons entre joueurs plus objectives

En définissant les rôles, les analystes en recrutement peuvent appliquer la découverte des rôles pour comparer directement et plus objectivement les joueurs qui correspondent aux paramètres de chaque rôle. Cela permet de rationaliser le processus de recrutement et de s'assurer que les joueurs qui occupent le même poste sur le terrain ne sont pas évalués de la même manière, mais sont analysés dans le contexte du rôle qu'ils remplissent.

Les éléments qui composent le modèle englobent quatre considérations clés en matière de recrutement :

  • Où un joueur joue-t-il sur le terrain ? - Empreinte spatiale
  • Quand apportent-ils leurs contributions essentielles ? - Jouer L'engagement des styles
  • Quel est le profil risque-récompense et la qualité de leurs principales contributions, par rapport à d'autres personnes occupant la même fonction ? - xP et résultats progressifs du PV
  • Quels sont les types de mouvements de passe dans lesquels un joueur est impliqué ? - Implication dans la chaîne de mouvement

En outre, la découverte des rôles peut également être utilisée pour identifier les joueurs qui possèdent les attributs clés pour un rôle ou un poste différent de celui qu'ils occupent actuellement dans leur club. Cela aiderait les analystes à identifier les jeunes Gareth Bale ou Philipp Lahm, des exemples de joueurs qui ont évolué d'un poste d'arrière latéral au début de leur carrière à des rôles plus élevés sur le terrain.

Des études de cas illustrant la manière dont la découverte des rôles peut être appliquée pour identifier des remplaçants pour un rôle spécifique seront publiées sur le site web de Stats Perform dans le courant de l'année, ainsi que des exemples d'analyses dérivées des modèles qui sous-tendent le concept, notamment xP et Movement Chains.

Si vous souhaitez en savoir plus sur Role Discovery ou si vous avez des questions sur ce que nous avons développé jusqu'à présent, n'hésitez pas à nous contacter ici.