Cet article est une version écrite de la présentation de Garry Gelade à l'OptaPro Analytics Forum 2017 sur le croisement. Le travail de Garry a été présenté dans le Guardian et Garry a également réalisé des interviews à la fois sur le Keys and Gray Show et sur TalkSport.

Figure 1. 1000 croix aléatoires
Ce que les gens pensent et ce que les chiffres prouvent
Un grand centre est l'une des images les plus mémorables du football, mais le centre est-il une forme d'attaque efficace ? Certains affirment qu'il est désormais dépassé dans le jeu moderne et qu'il reste une obsession anglaise fossilisée. Il est vrai qu'au cours des six dernières années, le nombre de centres dans le football européen de haut niveau a diminué, passant d'environ 17,5 par match en 2010-2011 à 15 en 2016-2017 ; mais les chiffres ne montrent aucune différence entre la Premier League et les autres championnats européens de haut niveau.
Certains prétendent que les centres sont inefficaces, arguant qu'il faut 92 centres pour marquer un but. Mais ce chiffre ne tient compte que de l'effet immédiat d'un centre. Si l'on tient compte des effets indirects d'un centre (buts marqués sur le deuxième ballon, corners et penalties concédés), on constate qu'il ne faut qu'environ 45 centres pour marquer un but, ce qui est beaucoup plus rentable.
La critique la plus extrême de la traversée a été formulée par l'économiste tchèque Jan Vecer. Selon lui, les croisements sont non seulement inefficaces, mais aussi contre-productifs. Dans une analyse statistique détaillée, il a montré que les équipes qui traversent moins marquent plus de buts, et il a conclu que si les équipes de Premier League arrêtaient complètement de traverser, elles marqueraient 15 buts de plus par saison.
Malheureusement, cet argument repose sur une conception erronée de la causalité, comme nous pouvons le constater en examinant l'évolution du score au cours des 90 minutes. J'ai analysé l'évolution des taux de franchissement à l'aide du cadre présenté à la figure 2. J'ai divisé les matches en segments aux endroits où les buts ont été marqués et j'ai examiné comment la fréquence des croisements changeait selon qu'une équipe marquait ou encaissait un but.

Figure 2. Analyse de l'évolution du taux de franchissement
Les résultats sont clairs : la traversée diminue après qu'une équipe a marqué un but et augmente après qu'une équipe a encaissé un but.
Les équipes ne marquent pas plus de buts parce qu'elles traversent moins, elles traversent moins parce qu'elles marquent plus. C'est tout à fait différent. C'est une question de logique footballistique : une équipe qui mène joue généralement plus défensivement que lorsqu'elle est menée au score. Rien ne prouve que la réduction du nombre de centres augmente le nombre de buts marqués.
Trouver le type de croix le plus efficace
Quel est le type de croisement le plus efficace ? D'où une équipe doit-elle centrer et où doit-elle diriger ses centres ? J'ai analysé 33 954 centres sur trois saisons de Premier League, dont 666 ont été réussis (un centre était considéré comme réussi s'il était suivi d'un but dans les six secondes suivantes).
Pour classer les croisements, j'ai utilisé une technique statistique appelée arbre d'inférence conditionnelle. Pour montrer comment cela fonctionne, je l'ai appliqué à un exemple légèrement éloigné des croisements dans le football professionnel. Je l'ai appliqué à la recherche de catégories de survivants de la catastrophe du Titanic, où le grand navire "insubmersible" avec 2120 âmes à bord a sombré dans les eaux glacées de l'Atlantique en février 1912. L'algorithme de l'arbre a permis de découvrir neuf catégories de survivants, comme le montre le diagramme ci-dessous.
On constate par exemple que les taux de survie des femmes tendent à être plus élevés que ceux des hommes. Le taux de survie des femmes voyageant en première classe (.97) était environ deux fois plus élevé que celui des femmes voyageant entroisième classe. Seuls 16 % des hommes voyageant entroisième classe et 34 % des hommes voyageant en première classe ont survécu. Les femmes et les enfants d'abord.
L'arbre d'inférence conditionnelle est particulièrement utile lorsque le nombre de succès dans l'échantillon de données est faible par rapport au nombre d'échecs (en fait, le type d'arbre de régression plus traditionnel que j'ai essayé en premier n'a détecté aucun signal).
Appliqué à nos données sur les centres, l'arbre d'inférence conditionnelle a permis de découvrir des catégories distinctes de centres qui variaient en fonction de leur emplacement de départ et d'arrivée, du fait qu'ils étaient ou non cadrés, et dont les taux de réussite variaient de 0,2 % à 11,8 %. Les centres ayant les taux de réussite les plus faibles étaient ceux qui étaient soit trop courts, soit trop longs, en d'autres termes les passes atterrissant au-delà du poteau le plus éloigné ou en deçà du poteau le plus proche. La catégorie de centre la plus réussie était une passe en profondeur qui franchissait la ligne médiane de cinq mètres au maximum.
Les images ci-dessous illustrent certaines des autres catégories croisées et mettent en évidence la différence de taux de réussite qu'un petit changement peut entraîner.

Figure 3. Comparaison des catégories 6 et 7.
Les catégories 6 et 7 correspondent à des centres dans la surface de réparation atterrissant dans une zone d'environ 4 mètres de part et d'autre du premier poteau et entre les lignes des 18 et des 6 mètres. Ce qui les différencie, c'est l'origine du centre. Les centres de la catégorie 7 proviennent de la profondeur - derrière la surface de réparation - et leur taux de conversion n'est que de 0,5 %. Les centres de la catégorie 6 sont délivrés plus haut sur le terrain, ce qui fait plus que tripler le taux de réussite, qui atteint 1,7 %.

Figure 4. Comparaison des catégories 17 et 18
Les catégories 17 et 18 consistent en des centres expédiés au second poteau à partir d'une distance d'au moins cinq mètres de la ligne de touche et se terminant à cinq mètres au maximum de la ligne médiane. La différence entre les deux catégories est la distance par rapport à la ligne de but de l'emplacement de l'extrémité. Les centres de la catégorie 17 atterrissent derrière le point de penalty, tandis que les centres de la catégorie 18 aboutissent entre le point de penalty et le but. Cette différence apparemment minime a une grande influence sur le taux de réussite. Le taux de conversion des centres délivrés derrière le point de penalty n'est que de 2 %, alors que les centres délivrés devant le point de penalty ont un taux de réussite de 5,8 %.
Application
En collaboration avec un représentant d'un club de Premier League, j'ai divisé la zone à partir de laquelle les centres sont le plus souvent délivrés en quatre zones (voir figure 5). J'ai ensuite consulté les données pour formuler des recommandations visant à maximiser les taux de réussite dans chaque zone.

Figure 5. Quatre zones de passage

Figure 6a. Recommandations pour la traversée de la zone 1

Figure 6b. Recommandations pour le passage de la zone 2

Figure 6c. Recommandations pour le franchissement de la zone 3

Figure 6d. Recommandations pour le franchissement de la zone 4
Conclusions
Les centres ont mauvaise presse auprès des observateurs du football anglais après l'échec de la tentative de Damien Comolli de construire une équipe basée sur les centres à Liverpool. Avec d'excellents centreurs comme Henderson, Enrique et Downing, ainsi qu'Andy Carroll qui attendait dans la surface, Liverpool a produit 787 centres au cours de la saison 2011-12 - bien plus que n'importe quelle autre équipe - pour un maigre total de quatre buts assistés.
Comme je l'ai écrit ici, le problème est probablement dû au fait que l'importance excessive accordée aux centres a conduit à ce que les centres soient délivrés trop tôt ; les centres de Liverpool partaient environ trois mètres plus haut sur le terrain que ceux des autres équipes de Premier League.
D'un autre côté, le style de Liverpool était peut-être trop prévisible. Il est beaucoup plus facile de défendre si l'on sait comment l'adversaire va jouer, et le bon sens suggère qu'il est bon d'avoir une variété d'options offensives. Si vous ne croisez jamais le ballon, ou si vous ne jouez jamais dans l'axe, vos adversaires auront plus de chances de vous réduire à néant. Ainsi, même si le fait de centrer isolément n'est peut-être pas le moyen le plus efficace de marquer des buts, je pense qu'il est important de le garder dans le mélange.
La plupart des personnes à qui j'ai parlé - pendant et après le Forum OptaPro - étaient soulagées de constater que le franchissement avait encore un rôle à jouer dans le jeu moderne. Les réactions des entraîneurs et des clubs ont également été très positives, et ils ont apprécié le lien démontrable entre les résultats analytiques et les actions sur le terrain.






