Skip to Main Content
Fédérations et ayants droit

GPT-4 : Cela change-t-il quelque chose pour le sport ?

Patrick Lucey, Chief Scientist de Stats Perform, parle des avancées du ChatGPT, des LLM et de ce qu'il faut attendre de l'avenir.

Par : Patrick Lucey

En novembre 2022, le laboratoire de recherche en intelligence artificielle Open AI a lancé son application d'AI ChatGPT, qui a pris le monde d'assaut. La technologie qui sous-tend la technologie ChatGPT est le grand modèle de langage (LLM) appelé GPT-3 (ou plus précisément GPT-3.5 - pour une description de ce qu'est un LLM et notre point de vue initial sur cette technologie et son lien avec le sport, consultez notre série en deux parties ici (en anglais).Partie 1 & Partie 2). Il y a quelques semaines, OpenAI a publié son nouveau grand modèle de langage (LLM), GPT-4. Selon OpenAI, le nouveau modèle peut faire plus de choses et est plus précis que le LLM précédent. Mais ce qui a vraiment fait dresser les cheveux sur la tête des gens, c'est l'introduction de la capacité de compréhension d'images, en particulier lorsque le cofondateur d'OpenAI a téléchargé un dessin d'une conception pour un site web de plaisanterie[LIEN]. Quelques jours plus tard, Google a lancé son chatbot "Bard" en mode recherche. Il y a beaucoup de bons articles de synthèse qui vous donnent une idée de ce que ces deux nouveautés peuvent faire, mais dans cet article, nous discutons des implications du modèle GPT-4 sur le sport. Les idées partagées ici sont un résumé de ce que j'ai présenté le mois dernier au MIT Sloan (résumé ici) et à notreForum Opta .

Le GPT-4 a-t-il résolu le problème de l'"hallucination des Facts" dans le sport ?

Dans nos articles précédents, nous avons mis en évidence les principaux problèmes liés à l'utilisation de ChatGPT dans le domaine du sport : 1) il hallucine des faits, et 2) la date limite de l'ensemble de données sur lequel il a été entraîné était septembre 2021. Examinons le premier problème. Comme nous l'avons déjà mentionné, GPT-4 est censé être plus précis - reprenons donc l'exemple que nous avons utilisé dans l'article précédent (pour rappel, nous avons demandé combien d'essais Cheslin Kolbe a marqué lors de la Coupe du monde de rugby 2019 ? La réponse donnée était 2 essais (un contre la Nouvelle-Zélande et l'autre contre le Japon), ce qui était faux, il a marqué 3 essais - 2 contre l'Italie en phase de groupes et 1 contre l'Angleterre en finale).

Comme vous pouvez le voir ci-dessus, lorsque le chatbot reçoit la même question, il est beaucoup plus limité dans sa réponse. La réponse est correcte, puisqu'il a marqué 3 essais lors de la Coupe du monde de rugby, mais elle n'est pas aussi détaillée que la réponse précédente. Lorsque nous avons demandé plus de détails, voici ce que nous avons obtenu :

D'après les résultats, il a répondu correctement à certaines questions (2 essais contre l'Italie), mais il s'est trompé sur d'autres (il n'a pas marqué contre le Canada, il a marqué un essai lors de la finale contre l'Angleterre). En ce qui concerne la résolution du problème des hallucinations par le GPT-4, il s'agit toujours d'un problème et il est probable qu'il le restera pendant longtemps en raison de la nature autorégressive de ces modèles d'intelligence artificielle (c'est-à-dire que le modèle prédit le mot suivant dans une séquence en fonction du mot précédent et n'est pas lié à une quelconque connaissance de la réalité).

Dans une présentation donnée la semaine dernière à l'université de New York, Yann LeCunn, l'une des personnalités les plus en vue dans le domaine de l'AI, a mis en évidence ce problème et a déclaré que l'approche actuelle des LLM était vouée à l'échec, car elle ne résoudrait jamais le problème de l'hallucination. Ces modèles doivent être liés à la réalité d'une manière ou d'une autre (voir le diaporama ici), ce qui rejoint ce que nous avons dit dans les articles précédents, à savoir que nous devons ancrer les résultats dans le monde réel : il est vital que la source de vérité dans le sport provienne de fournisseurs de données sportives de confiance comme Stats Perform. L'inquiétude suscitée par ce problème et le potentiel de nuisance et de désinformation est telle qu'une lettre ouverte a été rédigée par plus de 1 000 dirigeants du secteur technologique pour demander l'arrêt du développement de ces LLM, car ils présentent "des risques profonds pour la société et l'humanité" [LIEN]. Plus d'informations à ce sujet à la fin.

Qu'en est-il de la mise à jour des données ? Les choses ont-elles changé à cet égard ?

Oui et non. Bien que le problème des hallucinations persiste, OpenAI a publié la semaine dernière une série de plugins pour ChatGPT qui permettront au chatbot d'interagir avec des personnes de 3rd partie des API [LIEN]. Grâce à ces plugins, il est possible d'incorporer la fonctionnalité de ChatGPT dans la pile de code existante, ce qui permet aux développeurs de récupérer des appels d'information en temps réel. Surveillez cet espace.

En outre, cela soulève la question de savoir comment une technologie d'intelligence artificielle telle que ChatGPT peut être utilisée dans un environnement en direct. En général, la plupart des questions que les gens se posent sont basées sur une base de connaissances statique qui ne change pas. Cependant, le sport est différent, surtout dans le cas d'un jeu en direct. On peut évidemment poser une question simple, comme "Qui gagne ?" ou "Qui a marqué ?", mais ces réponses sont déjà disponibles via les chatbots "pré-ChatGPT". Pour obtenir des informations plus approfondies, il est difficile d'interroger les choses en direct, car le temps de taper une requête sur un élément spécifique du jeu, quelque chose d'autre peut déjà s'être produit, ce qui diminue la valeur ou l'intérêt de cette requête. C'est pourquoi il est nécessaire de procéder à une interrogation automatique ou à une "détection des faits marquants", qui est déclenchée par un événement intéressant. Nous avons cette capacité dans notre plateforme PressBoxLive, où lorsque quelque chose d'intéressant, comme un but, se produit, nous pouvons automatiquement générer des informations intéressantes immédiatement. La beauté de la chose, c'est qu'elle est évolutive. Par exemple, lors d'un récent match de deuxième division de la Bundesliga (2. Bundesliga) entre Arminia Bielefeld et Nurnberg, lorsqu'un but est marqué, nous pouvons générer un aperçu pour ce match comme nous le ferions pour la première division, ce qui souligne la valeur de l'AI dans le sport - la capacité de s'adapter (et de le faire en direct). Il ne s'agit pas seulement d'informations textuelles ; nous pouvons générer des superpositions automatiques sur la vidéo, qui peuvent donner une couleur supplémentaire à la performance, comme nous l'avons fait récemment dans le tennis.

La possibilité de saisir des images et des dessins était intéressante - Peut-on introduire une image ou un dessin sportif dans ChatGPT et obtenir un résultat ?

Comme mentionné dans l'article précédent, chez Stats Perform, nous avons été les pionniers du domaine de l'analyse sportive interactive, où vous pouvez dessiner un jeu et récupérer des jeux similaires, ou faire des analyses sur le jeu [LIEN], ou même prédire où les joueurs auraient dû se trouver dans une situation donnée grâce à notre travail sur les fantômes [LIEN]. En ce qui concerne la démo GPT-4, le fonctionnement est légèrement différent. Le réseau de transformation texte-image ou image-texte apprend à partir d'une énorme quantité de paires texte-image (c'est-à-dire que pour chaque image, il y a une description textuelle comme une légende). Pour cet ensemble de formation, le transformateur apprend la corrélation entre les descriptions textuelles et les parties de l'image. Grâce au comportement émergent de ces très grands réseaux neuronaux, il peut raisonner sur certains éléments de l'image (par exemple, pourquoi une certaine image est-elle drôle ?).

Pour le sport, nous sommes encore en train d'élargir le vocabulaire des événements, que l'on peut considérer comme une légende du jeu. Il ne suffit pas d'avoir le flux d'événements ; en utilisant nos métriques et nos modèles d'apprentissage automatique, nous pouvons détecter la qualité d'une action (comme un tir avec xG, ou une passe en utilisant notre valeur de possession en football). Élargir le vocabulaire est une chose, mais augmenter la quantité de données en est une autre.

C'est pourquoi le Opta Vision est si important, car il permet à la fois : a) d'élargir le vocabulaire des événements dans le football et b) d'augmenter le nombre de matchs pour lesquels nous disposons de ce riche vocabulaire.

En outre, en associant le flux d'événements élargi (qui peut être considéré comme le sous-titrage) aux données de suivi, nous pouvons accroître nos capacités de raisonnement autour de chaque jeu grâce à cet ensemble de données appariées (c'est-à-dire le vocabulaire élargi et les données de suivi). Nous sommes actuellement au point de basculement qui nous mènera au niveau suivant de l'analyse sportive.

LLMs : Confiance, perturbation et impact sur la société

Comme nous l'avons mentionné plus haut, en raison du caractère impressionnant et de l'amélioration rapide de la technologie LLM, de nombreuses personnalités du monde entier commencent à se méfier de l'impact que cette technologie aura sur la société et du potentiel de nuisance qu'elle représente, et ont donc appelé à une pause sur cette technologie. Il s'agit d'un sujet extrêmement important, mais en ce qui concerne le sport, il s'agit de mon point de vue personnel sur mon point de vue personnel sur le sport :

  • En tant qu'outil d'assistance, les chatbots d'AI basés sur le LLM changent la donne en termes d'aide à l'apprentissage et d'efficacité. Comme pour toute technologie, il faut savoir ce qu'elle peut faire et ce qu'elle ne peut pas faire. À mon avis, ces outils d'AI sont l'outil d'assistance ultime et peuvent aider les novices à atteindre un niveau d'efficacité plus élevé, ce qui a été mis en évidence dans une étude récente réalisée par des chercheurs du MIT [LIEN]. Une autre étude a montré que les développeurs qui utilisaient GitHub Copilot accomplissaient leurs tâches 55,8 % plus rapidement que le groupe de contrôle [LIEN]. Lorsque la base de connaissances est statique, fiable et à jour, la possibilité de poser des questions et d'approfondir des éléments de connaissance spécifiques est étonnante (mais l'essentiel est de pouvoir poser la bonne question et de comprendre si la réponse est liée au problème que vous souhaitez résoudre).
  • Toutefois, des garde-fous doivent être mis en place. Si les données sont fiables (comme celles dont dispose Stats Perform), il n'y a pas de mal à les utiliser à ces fins, mais il faut veiller à ce que les faits soient préservés (et non hallucinés). Dans les domaines autres que le sport, où un mélange de faits et de fiction existe dans l'éther, c'est plus problématique car la désinformation peut se propager, et il faut donc mettre en place des contrôles pour éviter que cela ne se produise. En outre, il est important de protéger les informations privées et sensibles, car une fois que ces informations se trouvent dans les LLM, il est presque impossible d'empêcher leur propagation.
  • Dans le domaine du sport, des garde-fous naturels sont en place. Par exemple, chez Stats Perform, nous sommes les gardiens du registre public des données de match, mais nous ne disposons pas d'informations privées telles que les données médicales, psychologiques, d'entraînement et de contrat des joueurs (et nous ne nous attendons pas à ce qu'il en soit ainsi). Ce garde-fou naturel assure une protection. Il permet également aux joueurs/clubs/clients d'utiliser notre analyse/modèle au niveau des matches comme l'une des données d'entrée, qu'ils peuvent ensuite fusionner avec les données privées dont ils disposent.
  • En outre, l'homme doit être le décideur ultime (et il doit être en mesure de savoir quand la technologie se trompe et quand on peut lui faire confiance). On peut comparer cette situation à celle d'un pilote d'avion. Au cours des 100 dernières années de transport aérien commercial, le nombre de pilotes n'a pas changé. En revanche, la technologie embarquée s'est considérablement améliorée, ce qui a permis de renforcer la prise de décision, la sécurité et l'efficacité des voyages en avion. Malgré cela, le nombre de pilotes est resté le même. Essentiellement, ce que la technologie de l'AI fait dans notre domaine sportif, c'est créer une technologie d'assistance pour aider les experts du domaine à prendre les meilleures décisions et à être aussi efficaces que possible.
  • Par ailleurs, le monde n'existe pas uniquement en langage naturel ou en données sportives. Il y a beaucoup de choses que nous ne pouvons pas encore numériser (et que nous ne numériserons probablement pas en raison des données publiques et privées mentionnées ci-dessus), comme le fait de savoir si un joueur a bien dormi la nuit précédente, s'il s'est disputé avec sa moitié, si ses enfants sont malades ou perturbés, ou encore les interactions entre les personnalités des joueurs. Les décideurs sont en mesure de numériser eux-mêmes ces informations grâce aux nombreux capteurs dont ils disposent et, à ce titre, ils disposent des informations les plus pertinentes pour prendre la meilleure décision. Notre travail consiste à leur fournir les meilleures informations possibles à partir des données dont nous disposons. 

L'espace de l'intelligence artificielle évolue quotidiennement et nous ferons de notre mieux pour tenir tout le monde au courant des progrès réalisés dans ce domaine et de la manière dont ils nous concernent. Dans le prochain article, nous nous pencherons plus en détail sur le projet Opta Vision et sur les parallèles avec ce qui se passe dans le domaine des véhicules autonomes. Nous vous tiendrons au courant.

Patrick Lucey est le scientifique en chef du géant des données sportives Stats Perform. Il dirige l'équipe d'AI dans le but de maximiser la valeur des profonds trésors de données sportives de l'entreprise. Patrick a étudié et travaillé dans le domaine de l'AI au cours des 20 dernières années, occupant des postes de recherche chez Disney Research et à l'Institut de robotique de l'Université Carnegie Mellon. Il a également passé du temps au Centre de recherche T.J. Watson d'IBM dans le cadre de son doctorat. Patrick est originaire d'Australie, où il a obtenu son BEng(EE) à l'Université de Southern Queensland et son doctorat à l'Université de technologie de Queensland. Il est l'auteur de plus de 100 articles évalués par des pairs et a été coauteur d'articles dans le cadre du MIT Sloan Best Research Paper Track, remportant le prix du meilleur article en 2016 et le deuxième prix en 2017 et 2018.