L'avenir de la couverture sportive : Partie 1

Le ChatGPT d'OpenAI a été lancé vers la fin de l'année 2022. Le "chatbot conversationnel", formé sur une énorme quantité de texte Internet, a rapidement accumulé des millions d'utilisateurs désireux de faire l'expérience d'une nouvelle percée dans l'utilisation quotidienne des technologies de l AI

Mais le ChatGPT est-il pertinent pour le sport ? Complète-t-il ou rivalise-t-il avec les propres modèles d'apprentissage automatique de Stats Perform, formés sur notre énorme quantité de données sportives ?

Résumé : ChatGPT utilise certaines des mêmes approches d'apprentissage profond que l'équipe d'AI de Stats Perform, mais avec des données d'entrée différentes et pour un objectif différent. Ces mêmes techniques d'AI peuvent en fait être trouvées à travers le monde de la technologie, résolvant de nombreux problèmes. Ici, nous utiliserons ChatGPT pour expliquer ces technologies d'AI sous-jacentes ainsi que la valeur de ChatGPT, ses limites, et où il pourrait être pertinent dans l'industrie du sport.

Dans un article de suivi, nous aborderons également quelques utilisations actuelles et futures de méthodes d'apprentissage profond similaires par Stats Perform pour résoudre des problèmes pour le sport.

Qu'est-ce que ChatGPT ?

ChatGPT est un modèle qui a lu la plupart des textes sur l'internet pour comprendre comment les mots, les phrases et les paragraphes sont structurés, de sorte qu'il peut accepter des questions en tant qu'entrées de texte et générer des réponses cohérentes sous la forme de sorties de texte de type dialogue.

Il utilise l'" AIgénérative" pour générer des prédictions sur les mots suivants d'une séquence qui sont des suites statistiquement probables à partir d'un large éventail d'invites de saisie données, sur la base du contexte des mots précédents. Son résultat prend la forme de réponses textuelles fluides et naturelles.

En termes techniques, ChatGPT est une variante d'un grand modèle linguistique (LLM) à transformateur génératif pré-entraîné (GPT) qui utilise l'ingénierie de l'invite pour l'amener à produire un comportement de type conversationnel.

Les modèles de langage ne sont pas nouveaux, mais ce qui est étonnant avec le LLM GPT-3 utilisé par ChatGPT, c'est qu'il est vraiment Il s'agit non seulement des données sur lesquelles il est entraîné (c'est-à-dire toutes les données textuelles de l'internet), mais aussi du nombre de paramètres qu'il utilise (175 milliards). Il utilise une approche de réseau transformateur pour apprendre des corrélations et des modèles dans cette vaste base de données textuelles qui semblent surhumains.

En élaborant intelligemment la question d'entrée pour décrire le contenu et le style requis de la réponse, ce que l'on appelle la ingénierie de l'inviteChatGPT est capable de sélectionner un petit nombre d'échantillons textuels sur lesquels il a été formé et qui présentent le style et le contenu requis, et de synthétiser ces échantillons pour générer des sorties de type rédactionnel pour des textes, des articles et des réponses à des questions d'une manière qui imite le langage humain.

Que peut faire d'autre l'AI générative ?

Les grands modèles de langage sont un type de modèles d'AI générative. Ils peuvent également être invités à prendre des entrées textuelles et à générer d'autres sorties, telles que des images (par exemple OpenAI's DALL-E-2) et des vidéos (par exemple Meta's MakeAVideo). Même la robotique utilise cette technologie, avec la sortie de RT-1qui est un transformateur prenant en entrée des instructions textuelles en langage naturel et des images, et qui peut être invité à générer directement des tâches robotiques du monde réel en sortie.

Les LLM sont également utilisés pour la compréhension du contenu, la traduction et la réponse aux questions dans des domaines spécifiques (par exemple, l'extraction, le résumé et l'encodage de dossiers cliniques). l'encodage de dossiers cliniquesou documents juridiques) et le service à la clientèle. Un LLM alimente un outil d'assistance au codage, par exemple Copliot de Githubde Github, qui peut signaler les erreurs et générer ou compléter automatiquement le code. code, en fonction du contexte de l'API spécifique avec laquelle on travaille.

Les limites de ChatGPT

L'AI générative fait ce qui est indiqué sur l'étiquette : elle génère des prédictions.

ChatGPT connaît les mots et sait quels mots sont susceptibles d'apparaître ensemble dans des phrases et dans quel ordre. Le mot qu'il choisit en fin de compte n'a pas d'importance, tant que le mot dans la phrase entière semble plausible, ce qui pose un problème car il "hallucine" souvent certains de ces mots qui sont des faits - et les faits ne peuvent pas changer.

Outre le problème de l'hallucination, ChatGPT rédige les réponses d'une manière si autoritaire que les réponses incorrectes semblent toujours crédibles, en particulier pour les non-experts.

Ce n'est pas seulement un problème pour ChatGPT, mais pour les outils d'AI générative en général. L'IA générative est très douée pour simuler des contenus réels (par exemple, des simulations profondes d'images, de vidéos et d'enregistrements audio). Comme pour tous les outils, il faut savoir ce que la technologie peut faire, mais surtout ce qu'elle ne peut pas faire.

Que peut faire (et que ne peut pas faire) la ChatGPT dans le domaine du sport ?

Premièrement, ChatGPT n'a été entraîné que sur des mots jusqu'en septembre 2021, il ne peut donc pas donner de réponses récentes. Deuxièmement, le GPT-3 requiert du texte comme entrée. Le langage du sport est différent du texte, et chez Stats Performnous avons créé le " langage du sport " qui alimente notre AI. Enfin, et c'est important, ChatGPT n'est pas optimisé pour garantir que les "réponses" qu'il prédit sont correctes sur le plan factuel.

ChatGPT ne sait rien du rugby ou du cricket, du basket ou du football, des pays, des coupes, des battes, des ballons ou de quoi que ce soit d'autre dans le monde. Il n'a pas été formé aux faits et aux statistiques ou à la reconnaissance d'informations précises sur lesquelles fonder ses prédictions. Il ne connaît que l'ordre des mots.

Cela le rend restrictif dans des domaines tels que l'actualité et le sport, où les résultats sont des résultats et les statistiques sont des statistiques, d'autant plus que ChatGPT peut générer des articles très bien écrits qui semblent crédibles mais qui ne sont pas basés sur ce qui s'est réellement passé.

Vous pouvez le constater en lui posant des questions très spécifiques, comme celle-ci sur un joueur de rugby de la Coupe du monde 2019 :

Les deux premières phrases de cette réponse bien rédigée sont incorrectes - Cheslin Kolbe a marqué deux essais contre l'Italie en phase de groupes et un essai en finale contre l'Angleterre.

Le ChatGPT a-t-il un rôle à jouer dans le sport ?

Prâce à des données structurées, précises et actualisées et à des flux de contenu, une future version de ChatGPT pourrait en théorie produire rapidement des articles textuels pour informer les fans, en réponse à une question textuelle telle que "écrivez-moi un aperçu de tous les matchs de demain".

Cependant, des articles automatisés rédigés par des machines comme ceux-ci existent déjà. Ils n'utilisent pas les mêmes processus "conversationnels" que ChatGPT - mais ils sont factuellement corrects.

C'est une nuance, mais ChatGPT génère à la fois le récit et les informations qu'il contient. Cela rend l'AI générative problématique pour synthétiser les reportages d'actualité, y compris les reportages sportifs.

Au lieu de cela, des produits spécifiques basés sur des faits, comme les Automated Game Previews de Stats Perform, utilisent d'abord les statistiques et les faits issus de nos flux de données sportives comme base de l'histoire, puis construisent la narration autour de ces informations concrètes.

Comme nos outils partent de nos flux de données, et que ces flux de données sont structurés et précis, cela signifie que les articles rédigés ne changent pas et qu'il ne s'agit pas de prédictions "générées" - ils correspondent à ce qui s'est passé.

Parmi les autres services automatisés de type reportage sportif qui s'appuient sur nos flux de données, citons "Pressbox Live", qui génère des informations en temps réel pour les commentateurs de télévision et "Pressbox Graphics", qui produit des images automatisées pour les médias sociaux ou les blogs chaque fois qu'un but, un touchdown ou un panier est marqué.

Quelle est la prochaine étape ?

Dans la deuxième partie, nous examinerons l'AI sous-jacente à ChatGPT et nous verrons comment elle est déjà utilisée pour améliorer les expériences sportives, en particulier dans le monde du sport de haut niveau.

Dans la troisième partie, nous aborderons les implications du dernier modèle ChatGPT-4 et ce qu'il change pour le sport.

L'avenir de la couverture sportive : Partie 1

Nous recommandons également

S'inscrire au tableau d'affichage