
Pour la première partie, veuillez consulter notre article ici.
Que peuvent faire les modèles linguistiques et les transformateurs de ChatGPT dans le domaine du sport ?
Au-delà des chatbots, les modèles de langage et l'intelligence artificielle générative ont-ils leur place dans le sport ?
La réponse est un oui retentissant et, à notre avis, il s'agit de la prochaine révolution dans le domaine de l'analyse sportive, qui permettra aux équipes et aux supporters de mieux comprendre le jeu, en particulier dans le domaine du football.
Pour commencer, nous devons spécifier la langue du sport. Pour le texte, qui est l'entrée requise pour ChatGPT, la langue existe déjà. Comme nous l'avons vu, le modèle linguistique de ChatGPT utilise des données textuelles brutes, qui ont leur propre structure inhérente (lettres, mots, phrases, paragraphes). L'architecture du transformateur apprend les statistiques et les corrélations en prédisant les mots manquants grâce au contexte de la phrase, du paragraphe et de l'histoire globale.
Les données sportives ont une structure linguistique inhérente différente. En football, par exemple, c'est 11 contre 11 (ou 10 joueurs sur le terrain contre 10 joueurs sur le terrain la plupart du temps). Chacun de ces joueurs a un rôle, qui peut évoluer ou changer au cours d'un match.
La représentation des informations relatives aux joueurs pendant le match au sein d'une équipe est extrêmement importante. Nous pourrions dire que chaque joueur est une lettre (au lieu d'utiliser le nom ou le numéro de maillot, nous utilisons sa position dans le match et ses statistiques, ainsi que ses statistiques de jeu récentes et à long terme), et chaque événement sur le terrain pourrait être décrit comme un mot, et ces lettres doivent être correctement ordonnées pour que nous puissions comprendre ce mot.
Chaque jeu pourrait être une phrase, et chaque possession pourrait être considérée comme un paragraphe. Le chapitre pourrait être le match et la saison pourrait être considérée comme un livre. Outre la création de la bonne structure (ou grammaire), les données sportives sont à la fois spatio-temporelles (c'est-à-dire les positions des joueurs) et événementielles (c'est-à-dire le type d'événement et le résultat des possessions), ce qui nécessite un prétraitement important. Nous pourrions donc considérer les données sportives comme un film plutôt que comme un livre - l'entrée est multimodale plutôt qu'une source d'entrée unique.
Maintenant que le langage d'entrée du football a été défini, nous pouvons commencer à apprendre un "modèle de langage du football" qui peut nous permettre de générer des sorties que nous ne pouvions pas faire auparavant. Compte tenu des problèmes inhérents aux chatbots AI pour "halluciner" des faits, au lieu de chercher à générer des sorties à toute question posée, nous pouvons utiliser "l'ingénierie de l'invite intelligente" pour répondre à des questions auxquelles il n'était pas possible de répondre auparavant. Pour en savoir plus sur l'ingénierie des messages intelligents, veuillez consulter le premier article de cette série.
Nous donnons ci-dessous une série d'exemples pratiques.
Opta Vision
Opta Vision est un flux de données AI qui utilise à la fois des données de vision ordinateur et nos données d'événements humains. Ces données sont ensuite traitées par notre réseau neuronal graphique pour fournir des prédictions sur chaque événement qui décrivent la capacité de prise de décision et d'exécution de l'équipe et du joueur individuel.
Par exemple, grâce à notre représentation (ou langage) sous-jacente de la formation, nous pouvons détecter la formation jouée par une équipe (par exemple, 4-4-2, 3-4-3, 4-3-3, etc.) et la façon dont elle évolue avec et sans possession de balle.
Nous sommes également en mesure d'attribuer le rôle d'un joueur dans chaque image, ce qui nous permet de voir quand les joueurs se chevauchent ou s'il y a un changement tactique au cours du match.
En utilisant la même représentation sous-jacente, nous pouvons également prédire la probabilité qu'un joueur fasse une passe, la probabilité que la passe crée une occasion de marquer dans les 10 secondes suivantes, ou évaluer si c'était la bonne option.
Grâce à notre modèle de langage footballistique, nous prédisons toutes les options possibles en même temps ; en d'autres termes, nous prédisons la phrase, au lieu de prédire chaque lettre séparément. Pour ce faire, nous utilisons les emplacements, les dynamiques et les événements de tous les joueurs comme séquence d'entrée, puis nous les mettons en correspondance avec la séquence de sortie qui correspond à la difficulté de la passe, à la disponibilité, etc.
Auparavant, nous analysions chaque option de joueur indépendamment, mais grâce à notre approche de modélisation du langage du football à grande échelle, nous pouvons maintenant analyser tous les joueurs en même temps. Cette approche est évidemment précieuse pour comprendre la capacité de décision de chaque joueur pour chaque événement, mais nous pouvons utiliser une approche similaire pour prédire les statistiques de chaque joueur à la fin du match.
Prédiction de la performance des joueurs basée sur les transformateurs
Imaginez que vous soyez un entraîneur de football et que vous souhaitiez savoir quel joueur aura le plus grand impact sur le résultat du match. Jusqu'à présent, les prédictions des performances d'un joueur étaient effectuées indépendamment des autres joueurs et des adversaires. En utilisant notre approche de transformateur avec notre énorme base de données de football, nous avons créé un modèle qui peut prédire tous les résultats des joueurs et de l'équipe en même temps.
En reprenant l'analogie de la traduction automatique, l'idée est de mapper une séquence d'entrée d'informations sur les joueurs et les équipes au début du match (ou pendant le match) en tant que séquence d'entrée. Nous utilisons ensuite notre réseau de transformateurs pour l'associer à la séquence de sortie la plus probable, à savoir, dans ce cas, les statistiques finales du match. L'avantage du réseau de transformateurs est qu'il peut rapidement s'adapter à des situations inédites. En football, cela est courant, car les équipes jouent à domicile et à l'extérieur au cours d'une saison régulière, et les compositions sont souvent différentes (ainsi que les managers), tout comme la forme récente.
Il s'agit d'une nouvelle innovation, et en 2023, nous présenterons la puissance de cette technologie. Pour entraîner ce modèle, nous avons utilisé notre base de données Opta , d'une profondeur unique, qui contient uniquement des données d'événements et dont la taille dépasse 1,5 To (sans compter nos importantes archives de données de suivi).
Fantôme
Nous pouvons également utiliser des techniques similaires pour améliorer notre capacité à faire du ghosting (c'est-à-dire simuler l'endroit où les joueurs auraient dû se trouver dans un jeu, un travail que nous avons co-écrit précédemment dans le domaine du football et du basket).
Les approches précédentes utilisaient un réseau de politiques supervisé pour prédire les comportements des équipes de manière déterministe, mais avec les progrès de la modélisation du langage, des résultats plus créatifs (dont certains n'ont peut-être jamais été vus auparavant) ont pu être générés. Il convient toutefois de noter que les entraîneurs/analystes préfèrent parfois disposer d'une prédiction déterministe (c'est-à-dire ce qui s'est passé) plutôt que de connaître les différentes façons dont le jeu aurait pu être exécuté.
Collecte de données
Un autre avantage de la modélisation linguistique est qu'elle peut être utilisée comme une aide dans notre processus de collecte de données sportives (similaire à l'assistant de codage mentionné précédemment), où elle est utilisée dans nos systèmes de suivi des joueurs et des balles vision ordinateur, ou pour mettre en évidence un point de données potentiellement erroné pour que nos équipes humaines d'exploitation ou d'intégrité puissent l'évaluer.
Conclusion
ChatGPT est un outil fantastiquement ambitieux et incroyablement bien exécuté. Bien qu'il n'ait peut-être pas autant d'applications directes dans le domaine du sport ou de l'information que dans d'autres domaines, les approches d'AI générative sous-jacentes sont déjà utilisées à Stats Perform, en utilisant notre propre langage sportif comme intrant. Elles alimentent déjà de nombreuses applications dans le domaine de la performance des équipes et ne manqueront pas d'enrichir à l'avenir de nombreux aspects du contenu et de l'analyse des sports.
Patrick Lucey est le scientifique en chef du géant des données sportives Stats Perform. Il dirige l'équipe d'AI dans le but de maximiser la valeur des profonds trésors de données sportives de l'entreprise. Patrick a étudié et travaillé dans le domaine de l'AI au cours des 20 dernières années, occupant des postes de recherche chez Disney Research et à l'Institut de robotique de l'Université Carnegie Mellon. Il a également passé du temps au Centre de recherche T.J. Watson d'IBM pendant qu'il poursuivait son doctorat. Patrick est originaire d'Australie, où il a obtenu son BEng(EE) à l'Université de Southern Queensland et son doctorat à l'Université de technologie de Queensland. Il est l'auteur de plus de 100 articles évalués par des pairs et a été coauteur d'articles dans le cadre du MIT Sloan Best Research Paper Track, remportant le prix du meilleur article en 2016 et le deuxième prix en 2017 et 2018.