Ce n'est un secret pour personne que la forme de Thibaut Courtois a été remise en question publiquement par Zinedine Zidane, l'ancien et actuel entraîneur du Real Madrid. Avant même cela, il a été remis en question dans les médias. Zidane a favorisé Keylor Navas, étant resté fidèle à son gardien lors de la saison 2017/18 malgré les critiques croissantes sur les performances du gardien.
En fait, Zidane a rappelé Navas lors de son premier match contre le Celta Vigo. Il l'a fait parce qu'il est l'homme de la situation et que c'est son opinion qui compte. Mais comment mesurer avec précision l'impact que ce changement aurait pu avoir sur la saison du Real Madrid jusqu'à présent ? Pour ce faire, nous devons être en mesure de simuler avec précision la manière dont un gardien se comporterait face aux tirs d'un autre gardien ou, mieux encore, la manière dont chaque gardien se comporterait face à tous les tirs d'un échantillon uniforme.
Nous reviendrons sur le débat concernant le Real Madrid dans un instant. Tout d'abord, examinons le problème plus général de l'évaluation correcte des performances des gardiens.
Le problème de l'évaluation des gardiens de but
Les gardiens de but sont évalués à l'aide d'indicateurs tels que les feuilles blanches, les buts encaissés et le pourcentage d'arrêts. Plus récemment, des mesures "attendues" telles que les arrêts attendus (xS) ont été introduites pour comparer les performances à la moyenne de la ligue. Cependant, les gardiens de but peuvent avoir des types d'arrêts complètement différents à réaliser en fonction du style défensif de leur équipe et des adversaires qu'ils affrontent.
Plutôt que d'utiliser des mesures qui peuvent ne pas refléter toutes les situations et tous les contextes, pourquoi ne pas aller au-delà des mesures et simuler simplement chaque gardien pour chaque tir, puis comparer qui encaissera le moins de buts ?
Nous expliquons ici comment nous procédons et comment notre nouvelle méthode peut être utilisée par les entraîneurs et les services de recrutement pour mieux analyser les gardiens et comprendre leurs forces et leurs faiblesses. Si vous souhaitez en savoir plus sur cette méthode, cliquez sur le lien suivant Trading Places - Simulation de la performance des gardiens de but à l'aide de données spatiales et de données relatives à la pose du corps.
Saisir l'identité unique du gardien de but
Pour saisir l'effet d'un gardien de but sur la décision des attaquants, il faudrait disposer de caractéristiques très fines telles que la position du corps du gardien de but. Par exemple, comment positionne-t-il ses bras ? Et ont-ils les pieds à plat ? Ces données sont difficiles à obtenir à grande échelle. Une autre solution consisterait à prendre des centaines de milliers de tirs pour chaque gardien et à apprendre un modèle personnel pour chacun d'entre eux, mais la réalité est qu'un gardien est confronté en moyenne à cinq tirs cadrés par match. Cette option n'est donc pas envisageable. Pouvons-nous capturer ces données d'une autre manière ?
Nous résolvons ce problème en créant un ensemble de caractéristiques qui mesurent les forces et les faiblesses des gardiens lorsqu'ils font face à des tirs dans différentes situations. Par exemple, sont-ils plus forts sur leur côté gauche ou droit ? Comment se débrouillent-ils dans les situations de 1 contre 1 ? Sont-ils facilement battus par leurs pieds ? Une fois ces caractéristiques générées, nous les combinons pour obtenir ce que nous appelons un Player Embedding, qui crée une identité unique de gardien de but basée sur des données. Lorsque nous traçons ces embeddings, nous pouvons voir que nous sommes maintenant capables de séparer les gardiens de but en différents groupes, ce qui signifie que nous sommes capables de saisir les nuances uniques de chacun d'entre eux (voir l'article publié dont le lien figure ci-dessus pour plus de détails sur la façon dont cela est calculé).
Si nous combinons ces encastrements avec un modèle xS normal, nous améliorons considérablement notre précision dans la prédiction de l'arrêt d'un tir cadré par un gardien de but. Cela nous permet surtout d'entrer dans le domaine de la prédiction personnalisée des joueurs. Par conséquent, si nous voulons savoir comment le gardien A fera face aux tirs du gardien B ou, dans notre cas, comment Navas fera face aux tirs de Courtois, il nous suffit de prendre l'identité unique de chaque joueur et de l'intervertir pour simuler ce que nous attendons de lui.
Le Real a 99 problèmes, mais Navas n'en fait pas partie
Pour en revenir à notre exemple du Real Madrid, nous sommes désormais en mesure de simuler avec précision le nombre de buts que Navas aurait évité face aux tirs de Courtois et vice-versa. Grâce à notre tableau des arrêts de jeu simulés, si nous exécutons le modèle sur 99 tirs auxquels les deux gardiens ont fait face cette saison, nous constatons que Navas aurait dû arrêter quatre buts supplémentaires par rapport à Courtois. En visualisant les points forts et les points faibles de chaque gardien, nous pouvons voir que Navas (en rouge) est nettement meilleur pour arrêter les tirs vers le centre du but, tandis que Courtois (en vert) n'est nettement meilleur que pour arrêter les tirs en bas à gauche.
Ces informations sont essentielles pour permettre à l'entraîneur de choisir en toute connaissance de cause le joueur qu'il va faire débuter. Elles sont également précieuses dans d'autres domaines tels que l'entraînement et le recrutement, dont les enjeux sont considérables.
Shopping en Liga - Classement des buts ajoutés
La Liga a accueilli certains des meilleurs gardiens de but modernes, comme Iker Casillas et Jan Oblak, et a exporté un grand nombre de gardiens de but de haut niveau, comme David De Gea et Pepe Reina. La Liga est donc un championnat de choix pour le recrutement de gardiens de but. Cependant, tout le monde ne peut pas se permettre d'acheter un gardien de haut niveau bien connu. Nous pouvons utiliser notre modèle pour évaluer facilement n'importe quel gardien de notre base de données et trouver des perles cachées.
La beauté du modèle réside dans le fait que nous sommes en mesure de simuler chaque gardien de but contre chaque tir effectué dans n'importe quel match pour lequel nous disposons de données. Par conséquent, nous pouvons maintenant fournir des classements précis des gardiens de but en fonction du nombre de buts supplémentaires qu'un joueur empêche ou autorise par rapport à une moyenne par 90 minutes. Notre modèle de buts ajoutés génère des informations intéressantes qui ont de vastes applications.
Comme on pouvait s'y attendre, des noms comme Jan Oblak et Marc-André Ter Stegen figurent dans le top 10. Mais le joueur en tête du classement - Roberto Santamaria - n'est pas aussi connu. Santamaria joue pour le SD Huesca, club de bas de tableau, et a été un peu un compagnon de route, jouant pour cinq clubs au cours des cinq dernières saisons. Il a eu sa chance lorsque Aleksandar Jovanovic, le gardien le moins bien classé de la ligue, a été écarté. Santamaria est devenu le numéro 1 de Huesca le 23 décembre. Auparavant, l'équipe comptait en moyenne 0,5 point par match, avec 32 buts encaissés en 16 rencontres de Liga. Avec lui dans les buts depuis : 1,08 point par match avec 18 buts encaissés en 13 rencontres. Si l'on considère qu'il joue pour une équipe menacée de relégation, c'est un bilan prometteur. Et lorsqu'il est comparé au même échantillon de tirs que les autres gardiens de la Liga, il est le meilleur de la division.
STATS AI Goalkeeper Index est un nouveau modèle qui nous permet de simuler et d'évaluer avec précision les forces et les faiblesses d'un gardien de but et de comparer directement une recrue cible à d'autres. En outre, il est possible de simuler comment un nouveau gardien de but augmenterait ou diminuerait le nombre de buts encaissés par rapport aux joueurs déjà présents dans l'équipe.
Et si le Real avait besoin d'une confirmation supplémentaire que le retour de Zidane était la bonne décision, il semble que son évaluation de Courtois ait été pertinente.

