Un problème courant dans le recrutement et l'évaluation des joueurs consiste à comparer des joueurs à différents stades de leur carrière ou qui ont eu des parcours différents.
Bien qu'il s'agisse évidemment d'un exemple extrême, considérons Marcus Rashford et Wayne Rooney au début de cette saison. L'un était un attaquant de 18 ans n'ayant disputé que 11 matches de championnat et l'autre un attaquant de 30 ans ayant disputé plus de 400 matches de championnat.
Dans ce blog, j'utilise une statistique relativement simple - le pourcentage de conversion - comme modèle pour comprendre comment nous pouvons modifier nos hypothèses afin de mieux comprendre l'évaluation des joueurs.
Notre approche doit prendre en compte non seulement les performances passées d'un joueur, mais aussi les différents niveaux d'incertitude qui entourent nos projections sur les performances futures.
Nous sommes maintenant dans une phase de l'analyse du football où des mesures plus avancées telles que les buts attendus devraient être prises en compte lors de l'évaluation des attaquants, mais le taux de conversion peut servir de bon point de départ, sachant qu'il y a certains joueurs qui affichent constamment un taux de conversion supérieur à la moyenne.
Alors, comment distinguer ces joueurs du reste du peloton ?
Repartir à zéro : revenir à l'essentiel
J'ai décidé de suivre l'approche utilisée par David Robinson pour estimer les moyennes de frappe au baseball. Je décrirai cette approche du début à la fin, et les processus sous-jacents à ce mode de pensée modifié deviendront clairs au fur et à mesure de l'avancement de cet article.
Tout d'abord, j'ai examiné tous les pourcentages de conversion pour chaque joueur de Premier League, La Liga, Bundesliga, Serie A et Ligue 1 de 2005-06 à 2015-16. Un tableau simple révèle les meilleurs pourcentages de conversion au cours de cette période.
Malgré des taux de conversion apparemment excellents, on peut dire que Marcel Ziemer, avec 37 minutes de Bundesliga dans sa carrière, et le gardien Tim Howard ne font probablement pas partie des meilleurs finisseurs de ces compétitions.
Le problème est évident : aucun de ces joueurs n'a pris suffisamment de tirs, de sorte que leurs pourcentages de conversion sont faussés par le petit échantillon. Que se passe-t-il donc si nous appliquons un filtre sur les tirs à notre tableau et que nous ne prenons en compte que les joueurs ayant effectué plus de 30 tirs ?
La liste s'est améliorée, mais le pourcentage de conversion le plus élevé parmi tous les joueurs est toujours celui de l'arrière droit Paul Verhaegh, et même si certains noms commencent à avoir un peu plus de sens avec les attaquants Bas Dost et Dario Cvitanich, la liste reste tout à fait insatisfaisante.
Un nouveau diagnostic...
En prenant un peu de recul, nous pouvons commencer à diagnostiquer le problème et utiliser une approche plus éclairée. En général, environ un tir sur 11 est marqué, nous pouvons donc commencer par supposer que tous les joueurs convertissent à ce taux moyen. Le pourcentage de conversion moyen pour les joueurs ayant effectué 30 tirs ou plus dans cet échantillon est de 9,12 %.

Pourcentage de conversion et tirs en carrière
Il est clair qu'en moyenne, plus un joueur prend de tirs, plus son pourcentage de conversion se rapproche de la moyenne (représentée par la ligne rouge), alors que la variance est beaucoup plus grande parmi les joueurs qui ont pris moins de tirs. Ce phénomène statistique appelé "régression vers la moyenne" suggère que même si un joueur a un pourcentage de conversion très élevé dans un petit échantillon - comme Paul Verhaegh - on peut s'attendre à ce qu'il se rapproche de la moyenne au fil du temps.
Toutefois, cette approche peut sembler simplifier à l'excès les événements et les résultats, car nous savons que d'autres facteurs peuvent jouer un rôle. Pour tenir compte de ce phénomène, nous pouvons utiliser ce que l'on appelle une approche bayésienne empirique. Constantinos Chappas a utilisé une approche similaire lors de l'OptaPro Analytics Forum pour examiner l'incertitude d'une année sur l'autre avec des mesures agrégées similaires.
Réglage de la position de départ
Nous partons d'une croyance préalable - dans ce cas, chaque joueur commence avec un pourcentage de conversion de 9,12 % - et chaque nouveau point de données (dans ce cas, un tir et son résultat) éloigne notre estimation du point de départ.
Par conséquent, si un joueur effectue un tir et marque, son pourcentage de conversion estimé ne sera pas immédiatement de 100 % comme dans les cas précédents. Désormais, son pourcentage de conversion estimé ne variera que légèrement en fonction de l'ampleur de la modification de notre opinion antérieure selon laquelle son pourcentage de conversion était de 9,12 % (ce point est expliqué plus en détail dans l'annexe mathématique).
Cette approche permet d'obtenir un nouveau classement.
Les joueurs présentés commencent maintenant à être plus raisonnables. Parmi les cinq premiers, nous retrouvons Javier Hernandez, qui a affiché un taux de réussite impressionnant à Manchester United et au Bayer Leverkusen, ainsi que Carlos Bacca, qui s'est montré tout aussi efficace au FC Séville et à l'AC Milan. Il y a toutefois lieu d'être sceptique : l'arrière droit Paul Verhaegh reste dans le top 5 bien qu'il n'ait tiré que 51 fois.
Cela nous amène à la deuxième tendance du graphique. Il ne s'agit pas tant d'une tendance statistique classique que d'une tendance basée sur la compréhension du jeu lui-même : les joueurs qui tirent plus ont tendance à avoir un pourcentage de conversion supérieur à la moyenne.

Pourcentage de conversion et nombre de tirs en carrière : une tendance à la hausse
La ligne de tendance bleue le montre clairement, mais même si l'on se contente de regarder les joueurs ayant effectué plus de 500 tirs dans leur carrière, presque tous sont au-dessus de la moyenne de l'échantillon du pourcentage de conversion, qui est de 9,12 %.
Pourquoi cette tendance se dessine-t-elle ? Essentiellement, les bons tireurs tirent davantage. Cela peut s'expliquer par le fait que les bons tireurs ont plus de minutes, qu'ils se font confiance pour tirer plus souvent, qu'ils essaient de se créer des opportunités de tir plus fréquemment, que leurs coéquipiers cherchent à passer la balle aux bons tireurs plus souvent, ou par toute une série d'autres facteurs.
Modifier nos croyances
Du point de vue de l'estimation, cela signifie que supposer que tous les joueurs ont un taux de conversion de 9,12 % avant d'avoir pris un seul tir est erroné car les bons tireurs qui ont pris plus de tirs et ont un pourcentage de conversion plus élevé gonflent cette moyenne.
En tenant compte du nombre de tirs déjà effectués par un joueur au cours de sa carrière, nous pouvons tenter de résoudre ce problème (régression bêta-binomiale). Dans le cadre de cette nouvelle approche, nous considérons que les bons tireurs tireront plus souvent.
Enfin, le classement commence à passer le test de l'œil, les cinq premiers étant composés de quelques-uns des attaquants les plus cliniques de la dernière décennie.
Ce n'est qu'une des nombreuses façons de considérer la capacité de finition. Elle peut également s'appliquer à d'autres statistiques et métriques, et peut être utilisée pour mieux informer sur la manière dont nous évaluons les joueurs.
Cependant, cet exemple particulier montre comment nous pouvons utiliser des données agrégées relativement simples - dans ce cas, essentiellement les chiffres des buts et des tirs - pour obtenir des informations significatives et identifier les compétences clés des joueurs parmi un échantillon large et varié de joueurs.
Revenons enfin sur notre exemple Rashford - Rooney. En utilisant cette méthode, Rashford a un taux de conversion estimé de 11,31 % et Rooney un taux de conversion attendu de 13,24 % (le même que son pourcentage de conversion réel dans ce laps de temps). Ainsi, bien qu'il ait marqué cinq buts sur 16 tirs lors de sa première saison en Premier League - soit un taux de conversion de 31,25 % - ce pourcentage de conversion estimé tient compte du fait qu'il a effectué beaucoup moins de tirs que Rooney et ne nous permet pas de tirer la conclusion, peut-être mal informée, selon laquelle Rashford est déjà un meilleur finisseur que Rooney.



