Bienvenue dans la nouvelle édition de la série Latest Trends in AI in Sport de Stats Perform, dans laquelle notre Chief Scientist, Patrick Lucey, discute des développements récents en matière d'IA générative et de leurs applications dans l'industrie du sport.
Pour les acteurs du monde de l'IA et du sport, le Super Bowl de février a été un véritable régal, tant sur le terrain qu'en dehors.
Sur le terrain et sur nos écrans, nous avons vu des joueurs utiliser des jeux conçus avec l'aide de l'apprentissage automatique par les analystes de leur équipe, et nous avons entendu les présentateurs nous donner des informations alimentées par l'IA pour nous aider à comprendre le contexte et le sens.
En dehors du terrain, le Super Bowl a présenté des publicités mettant l'accent sur l'IA en tant que fonction dans les produits de consommation courante, comme la publicité Copilot de Microsoft et l'utilisation de l'IA par Google pour démontrer sa puissance dans son téléphone Pixel.
Dans la courte période qui a précédé et suivi le Super Bowl, nous avons assisté à des sorties de gros titres tels que Gemini de Google, le lancement de la Vision Pro d'Apple et, plus récemment, la sortie de l'outil multimodal text2video "Sora" d'OpenAI, ainsi qu'à des rumeurs concernant la sortie d'agents d'IA et l'utilisation accrue de la Génération Assistée par Récupération (RAG).
Dans cet article, nous traiterons certains de ces développements dans le monde de l'IA générative et expliquerons les RAG et les LLM multimodaux. Nous décrirons leur rapport avec le sport (à la fois pour les supporters et pour les applications des équipes professionnelles) et nous verrons comment, malgré les nouveaux changements, une chose reste inchangée : la valeur des données sous-jacentes qui alimentent les modèles de GenAI.
En résumé : plus de 12 mois après le ChatGPT
Un an environ après le lancement de ChatGPT, nous constatons que la technologie de l'IA générative ne remplace pas les humains dans leur travail, comme le craignaient certains cercles, mais qu'elle permet aux humains d'en faire plus.
ChatGPT et les technologies basées sur le LLM qui ont suivi nous ont fourni une gamme d'outils "assistés par l'IA" qui peuvent aider certains d'entre nous à effectuer certaines de leurs tâches un peu mieux et plus rapidement.
Par exemple, le service à la clientèle, la traduction linguistique, la recherche et l'interrogation de la documentation (qu'elle soit publique ou privée) commencent tous à être réalisés de manière beaucoup plus efficace et à plus grande échelle qu'auparavant. Elle peut également permettre de créer de nouveaux contenus, qu'ils soient textuels, audio ou sous forme d'images et de vidéos (ou une combinaison de ceux-ci).
En fin de compte, les progrès réalisés dans ces domaines (et ce qui a motivé Copilot, Gemini et Sora) sont dus au fait que la GenAI maximise notre capacité à extraire de la valeur des données. Les données sous-jacentes restent l'élément le plus important de l'écosystème de la GenAI.
La troisième vague de l'IA générative : les données différenciées
Le président-directeur général deVista Equity Partners, Robert Smith, a récemment présenté un excellent résumé de ce qu'il considère comme "les trois vagues de l'IA générative".
Dans la première vague, il a décrit que la valeur durable irait aux fournisseurs de matériel (par exemple, NVIDIA).
Dans la deuxième vague, il a déclaré que la valeur durable irait aux "super scalers" (par exemple, les fournisseurs d'informatique en nuage).
Et dans la troisième vague, il a déclaré que la valeur durable profiterait à ceux qui peuvent utiliser cette capacité sur les marchés spécifiques où ils vendent leurs produits. En d'autres termes, si vous disposez d'une différenciation clé dans un domaine particulier (comme des données d'une profondeur et d'une ampleur uniques dans le domaine du sport), l'IA générative peut "surmultiplier" les produits et les services dans ce domaine.
Les deux premières vagues se déroulent actuellement.
La première profite aux fabricants de puces, la soif de puces pouvant être utilisées pour la GenAI semblant inextinguible. Ce phénomène s'est répercuté sur la deuxième vague, où les fournisseurs d'informatique en nuage disposent du stockage et du calcul nécessaires pour mettre à l'échelle les solutions GenAI et les intégrer dans leurs solutions générales, ce qui est également en train de se produire.
Mais la valeur durable à long terme résidera dans la troisième vague, où des marchés spécifiques ont besoin de solutions adaptées à leurs cas d'utilisation particuliers.
Pourquoi les données sont-elles toujours aussi importantes pour les applications de l'IA générative dans le sport ?
Il convient de rappeler que pour obtenir les résultats les plus précis, les systèmes d'IA générative ont besoin des données d'entrée les plus précises, les plus fiables et les plus uniformes. Sans données de qualité, des résultats erronés ou des informations fausses peuvent être propagés, ou les applications de l'IA sont sérieusement limitées, en particulier lorsqu'il s'agit d'une utilisation dans des domaines spécifiques.
Ainsi, même s'il semble que les choses évoluent et changent, au fond, tout est toujours pareil, car toutes les informations et tous les points de vue reposent sur des données fiables et exactes.
Dans des domaines spécifiques comme le sport ou la médecine, avec des cas d'utilisation spécifiques comme l'analyse des joueurs et les prévisions de performances, ou le diagnostic des symptômes et l'évaluation des traitements, vous ne pouvez pas vous tromper sur les faits. Si c'est le cas, l'analyse, les prévisions et le diagnostic en aval seront également erronés.
En outre, plus les données sont détaillées et cohérentes, plus les résultats et les réponses sont spécifiques, pertinents et utiles.
Par exemple, dans le domaine du football, où Stats Perform dispose de données Opta détaillées pour plus de 13 500 équipes professionnelles masculines et féminines, nous veillons à ce que les mêmes données et mesures soient générées pour tous les matchs (et pas seulement pour quelques ligues sélectionnées).
Ainsi, une passe et un tir ont chacun la même définition uniforme et la même collecte dans toutes les ligues de football. Chaque événement utilise les mêmes protocoles pour les métadonnées telles que les noms, les horodatages et les coordonnées de localisation.
La classification et la structure uniformes des données - collectées en temps réel - signifient que les modèles d'IA générative peuvent être entraînés sur des quantités massives de données, qu'il s'agisse de données historiques ou de statistiques de jeu.
Cela améliore leur efficacité ainsi que les capacités de recherche et facilite l'identification des corrélations et des modèles dans l'ensemble des données.
Si elles ne sont pas collectées et distribuées de manière uniforme, les statistiques et les résultats dérivés n'ont pas de sens pour les humains et les modèles de GenAI.
L'IA générative nous aide à découvrir des informations précieuses qui étaient auparavant enfouies ou invisibles à l'œil nu. Elle permet de maximiser la valeur des données sous-jacentes. Si ces données sont détaillées, uniformes et objectives, leur valeur peut être encore accrue.
Plus l'ensemble de données source est profond, plus les modèles sont perspicaces et plus les prédictions produites par la GenAI sont précises, et plus l'utilité pour des applications et des domaines spécifiques, comme le sport, est grande.
La qualité, la profondeur, l'étendue et la cohérence des données sont les ingrédients clés pour que les systèmes d'IA (et plus particulièrement les systèmes de GenAI) puissent prospérer.
Dans un autre ordre d'idées, l'augmentation de la couverture médiatique des deepfakes susceptibles d'influencer les élections m'a amené à réfléchir à la valeur des données sportives indépendantes et fiables pour combattre ou contrer le potentiel d'utilisation néfaste des deepfakes vidéo qui pourrait menacer l'intégrité du sport.
Certains d'entre vous se souviennent peut-être d'une "histoire alternative" profondément fausse du célèbre tir de Michael Jordan sur Craig Ehlo, qui a été publiée sur les médias sociaux il y a quelques années.s il y a quelques années. On y voit Jordan manquer le tir gagnant qu'il a en fait réussi, ce qui a trompé de nombreux observateurs. À mesure que les LLM text2video deviennent de plus en plus efficaces, la probabilité que des deepfakes infiltrent le sport s'accroît.
C'est une autre raison pour laquelle nous prenons très au sérieux le rôle de Stats Performen tant que gardien de confiance du sport, et nous sommes reconnaissants à notre incroyable équipe Data Operations qui se concentre jour et nuit sur l'intégrité de nos données, parce que des sources fiables, indépendantes et vérifiables comme les données d'Opta sont susceptibles d'être encore plus cruciales dans un avenir de deepfake.
Qu'est-ce que le RAG ?
Retrieval-Augmented Generation (aka RAG) est un autre développement relativement nouveau dans le domaine de l'IA générative qui permet à des "experts non techniques" d'être en mesure d'extraire et d'interroger des bases de connaissances, sans dépendre d'un ingénieur ou d'un expert en bases de données pour récupérer ces données, ce qui est un obstacle majeur.
S'il dispose d'une base de données solides et précises, RAG peut alors envelopper ces informations dans la technologie actuelle basée sur le LLM.
Cette technologie GenAI peut permettre aux gens d'en faire plus, de procéder à des itérations plus rapides et d'obtenir des connaissances plus rapidement. D'une certaine manière, il s'agit de l'assistant ultime - comme si un expert était en permanence sur votre épaule pour vous donner les réponses (isi le système a accès aux données les plus précises et les plus récentes).
Lorsque l'on dispose d'une base de connaissances étendue, l'utilisation de la GenAI peut permettre de récupérer et d'interroger des informations sur le sport, et RAG peut faciliter la tâche des systèmes qui ont besoin d'accéder à des connaissances spécifiques à un domaine.
Une fois encore, il convient de faire preuve d'une grande prudence, car des hallucinations et des informations obsolètes peuvent se propager, ce qui signifie que la qualité et la confiance dans les données sources sous-jacentes sont impératives. la qualité et la confiance dans les données sources sous-jacentes sont impératives.
Mais s'ils sont utilisés correctement, avec des garde-fous et une supervision, les RAG pourraient être extrêmement utiles pour personnaliser le contenu et les traitements dans le monde du sport.
Dans un prochain article, nous approfondirons ce sujet.
Développements utilisant la vidéo, les images et les LLM multimodaux
Le langage du sport est constitué à la fois des données recueillies sur la balle et des données recueillies sur les mouvements hors balle. Nous l'appelons multimodal, car il capture deux modes d'information complémentaires, comme des images ou des vidéos accompagnées d'un texte décrivant ce qui se passe (c'est ainsi que GPT-4, Gemini et Sora peuvent générer du texte2image et du texte2vidéo).
L'une des façons d'utiliser efficacement la vidéo dans les LLM pour le sport est de capturer et de combiner les données du joueur et du ballon, qu'elles soient en dehors ou sur le ballon, car cela permet de mesurer une reconstruction complète de la performance, ainsi que de créer des applications interactives.
Récemment, nous avons pu utiliser notre vaste base de données Opta et un LLM multimodal pour estimer l'emplacement des joueurs manquants qui ne peuvent être vus sur la vidéo (en partie ou en totalité), ce qui permet d'analyser chaque passe et chaque décision dans le contexte complet de la position des autres joueurs et de ce qu'ils font.
Nous venons de présenter cette application avancée de l'IA générative dans le domaine du sport lors de la 2024 Conférence MIT Sloan sur l'analyse sportive. Mais ce n'est que le début - ce modèle de base est à l'origine d'un grand nombre d'applications supplémentaires. Attendez-vous à de nombreuses autres mises à jour de notre part dans ce domaine.
Comment les récentes avancées en matière d'IA générative pourraient-elles s'appliquer à l'analyse du sport professionnel ?
Les LLM spécifiques aux sports peuvent également être utilisés pour créer des prédictions qui ne pouvaient pas être modélisées avec précision auparavant, ce qui donne aux analystes d'équipe et aux entraîneurs un assistant très puissant.
Par exemple, la modélisation des statistiques individuelles d'un joueur de football est notoirement difficile, car elle dépend des coéquipiers avec lesquels il joue, des adversaires, ainsi que de l'état du jeu pour les prédictions en direct (par exemple, l'équipe gagne-t-elle/perd-elle, un joueur est-il expulsé, etc.)
Les mêmes méthodes d'IA générative utilisées pour former les modèles qui alimentent ChatGPT et Gemini (c'est-à-dire les réseaux neuronaux transformateurs) peuvent toutefois être utilisées pour générer des prédictions pour chaque joueur (et l'équipe) à partir du même modèle, ce qui constitue un changement de paradigme dans la façon dont les prédictions sportives peuvent être effectuées.
La puissance de cette approche ne consiste pas seulement à fournir des prédictions plus précises, mais aussi à permettre de nouvelles applications telles qu'un "entraîneur assistant virtuel", où un utilisateur pourrait demander "si je retire le joueur X et fais entrer le joueur Y - comment cela pourrait-il changer l'issue du match, ou conduire à plus ou moins de tirs ? Une autre question pourrait être : "Où aurait dû se trouver le défenseur dans cette situation pour arrêter le tir ?", ou "Où le joueur va-t-il frapper la balle ensuite ?".
Il pourrait s'agir d'une nouvelle façon d'interagir avec le sport qui était autrefois confinée à un jeu vidéo, et pour ce dernier exemple, nous avons fait exactement la même chose avec nos grands partenaires de Tennis Australia pendant le dernier Open d'Australie en janvier 2024. Vous pouvez le voir en action ICI.
Comme pour les autres assistants IA, les analystes sportifs et les entraîneurs seront en mesure de développer des stratégies et des tactiques de plus en plus sophistiquées, ce qui se traduira par des moments encore plus spectaculaires pour les fans sur le terrain.
Comment les données sportives et les LLM jouent-ils un rôle dans les progrès de la réalité mixte (c'est-à-dire Apple Vision Pro) ?
Regarder et interagir avec le sport joue un rôle important dans la vidéo de présentation de l'Apple Vision Pro.
En plus de regarder le match sous plusieurs angles, les utilisateurs ont la possibilité d'obtenir toutes les données et les informations qu'ils souhaitent dans leur écosystème de visionnage, que ce soit par le biais d'une requête audio ou d'un geste. Ils peuvent également interagir avec des modules pour consommer des contenus adjacents tels que les temps forts, d'autres jeux, des discussions avec des amis ou des commentaires (ou de la publicité contextuelle).
L'ambition semble être de créer une expérience à 360 degrés qui rende chaque détail du jeu plus intéressant et plus divertissant, en rapprochant le fan des joueurs, des équipes, du "diffuseur" et des sponsors.
Des données sportives de qualité sont à la base de bon nombre de ces expériences, que ce soit de manière visible ou en coulisses.
Parmi ces moyens en coulisses, on peut citer Les LLM permettent de faire des prédictions, de sélectionner le meilleur contenu et la meilleure publicité à diffuser au meilleur moment, y compris les temps forts, de personnaliser ce que les utilisateurs voient, entendent et ressentent en fonction de l'état du jeu et de leurs préférences, d'exploiter les possibilités de gamification, d'ajouter d'incroyables couches de contexte pour rendre les compétences des athlètes encore plus mémorables et, d'une manière générale, d'approfondir le pouvoir de narration de l'événement et, partant, sa valeur pour les fans et les sponsors.
Sans parler des informations tactiques qu'il apportera aux analystes et aux entraîneurs, ce qui portera le spectacle sur le terrain à un niveau encore plus élevé !
Conférence Sloan sur l'analyse sportive 2024
Pour conclure cette mise à jour, je reviens de deux jours passionnants à la Sloan Sports Analytics Conference. Comme mentionné précédemment, nous avons présenté un article sur la manière dont l'IA générative peut être utilisée pour une application spécifique dans le domaine du sport, à partir de données sources de haute qualité, à savoir la prédiction de l'emplacement exact des joueurs de football qui ne sont pas perçus visuellement lors des retransmissions (lien ci-dessous). D'autres panels et présentations ont abordé les applications générales de l'IA générative dans les tâches des organisations sportives telles que le service client et la recherche. Nous aborderons ces applications et d'autres utilisations spécifiques dans de futurs articles.
Patrick Lucey est le scientifique en chef de Stats Perform. Vous pouvez lire ses autres opinions et réflexions sur le rôle de ChatGPT et des grands modèles de langage dans le sport, ainsi que sur les prochaines étapes.
Prochainement dans les articles de Patrick : il discutera de l'article 2024 deStats Perform de Stats Perform à la Sloan Sports Analytics Conference, si l'IA générative pourrait améliorer l'application de la VAR (Video Assistant Referee) dans le sport, si les agents d'IA seront utiles dans le sport et les applications de l'IA générative pour améliorer les retransmissions sportives et les parrainages. Il jettera également un regard neuf sur l'objectif initial de la RoboCup, qui est de permettre à des robots humanoïdes entièrement autonomes de battre la meilleure équipe de football humaine du monde, sur un vrai terrain en plein air, d'ici à 2050 !