Ir para o conteúdo principal
Torcedores torcendo no Estádio Luzhniki durante o jogo entre Rússia e Arábia Saudita na Copa do Mundo de 2018
Mídia de clubes, Mídia de faculdades, Federações e detentores de direitos, Editoras

O futuro da cobertura esportiva: Parte 1

Patrick Lucey, cientista-chefe da Stats Perform, fala sobre ChatGPT, aprendizagem profunda e tecnologias AI no esporte.

Por: Patrick Lucey

O ChatGPT da OpenAI foi lançado no final de 2022. O "chatbot de conversação", treinado em uma enorme quantidade de texto da Internet, rapidamente acumulou milhões de usuários interessados em experimentar um novo avanço na utilização diária de tecnologias AI .

Mas o ChatGPT é relevante para o esporte? Ele complementa ou compete com os próprios modelos de aprendizado de máquina da Stats Perform, treinados em nossa enorme quantidade de dados esportivos?

Spoiler: O ChatGPT utiliza algumas das mesmas abordagens de aprendizagem profunda que a equipe de AI do Stats Performestá usando, mas com entradas diferentes e para um objetivo diferente. Essas mesmas técnicas de AI podem, de fato, ser encontradas em todo o mundo da tecnologia, resolvendo vários problemas. Aqui, usaremos o ChatGPT para explicar essas tecnologias AI subjacentes, bem como o valor do ChatGPT, suas limitações e onde ele pode ser relevante no setor esportivo.

Em um artigo posterior, também abordaremos alguns usos atuais e futuros de métodos semelhantes de aprendizagem profunda pela Stats Perform para resolver problemas no esporte. 

O que é o ChatGPT?

O ChatGPT é um modelo que leu a maior parte do texto na Internet para entender como as palavras, as frases e os parágrafos são estruturados, de modo que ele possa aceitar perguntas como entradas de texto e gerar respostas que soem coerentes na forma de saídas de texto no estilo de diálogo.

Ele usa " AIgenerativa" para gerar previsões das próximas palavras em uma sequência que são estatisticamente prováveis a partir de uma ampla gama de prompts de entrada fornecidos, com base no contexto das palavras anteriores. Sua saída assume a forma de respostas de texto fluentes e com som natural.

Em termos técnicos, o ChatGPT é uma variante de um modelo de linguagem grande (LLM) de transformador pré-treinado generativo (GPT) que usa engenharia de prompt para induzi-lo a produzir um comportamento semelhante ao de uma conversa.

Os modelos de linguagem não são novos, mas o incrível sobre o LLM GPT-3 usado pelo ChatGPT é o fato de que ele é realmente grande: não apenas os dados em que é treinado (ou seja, todos os dados de texto na Internet), mas o número de parâmetros que utiliza (175 bilhões). Ele usa uma abordagem de rede transformadora para aprender correlações e padrões nesse vasto repositório de texto que parecem sobre-humanos.

Ao elaborar de forma inteligente a pergunta de entrada para descrever o conteúdo e o estilo exigidos da resposta, conhecido como engenharia de promptso ChatGPT é capaz de selecionar um pequeno número de amostras de texto nas quais foi treinado e que exibem o estilo e o conteúdo exigidos, e sintetizar essas amostras para gerar resultados do tipo ensaio para textos, artigos e respostas a perguntas de uma forma que imita a linguagem humana.

O que mais AI generativa pode fazer?

Os modelos de linguagem grande são um tipo de modelo de AI generativa. Eles também podem ser solicitados a receber entradas de texto e gerar outras saídas, como imagens (por exemplo, OpenAI's DALL-E-2) e vídeo (por exemplo, Meta's MakeAVideo). Até mesmo a robótica está utilizando essa tecnologia, com o lançamento do RT-1que é um transformador que recebe instruções de texto em linguagem natural e imagens como entradas, e pode ser solicitado a gerar diretamente tarefas de robótica do mundo real como saídas.

Os LLMs também são usados para compreensão de conteúdo/tradução/resposta a perguntas para domínios específicos (por exemplo, extração, resumo e codificação de registros clínicosou documentos jurídicos) e atendimento ao cliente. Um LLM alimenta uma ferramenta de assistência para codificação, por exemplo Copliot do Githubdo Github, que pode sinalizar erros e gerar ou autocompletar código, com base no contexto da API específica com a qual se está trabalhando.

As limitações do ChatGPT

AI generativa faz o que está escrito no rótulo: gera previsões.

O ChatGPT sabe sobre palavras e quais palavras provavelmente aparecerão juntas em frases e em que ordem. A palavra que ele escolhe não importa, desde que a palavra dentro da frase inteira pareça plausível, o que é um problema, pois muitas vezes ele "alucina" algumas dessas palavras que são os fatos - e os fatos não podem mudar.

Além do problema de alucinação, o ChatGPT escreve as respostas de forma tão autoritária que as respostas incorretas ainda soam confiáveis, especialmente para quem não é especialista.

Esse não é um problema apenas do ChatGPT, mas das ferramentas de AI generativa em geral. Ela é muito boa em falsificar conteúdo real (por exemplo, falsificações profundas em imagens, vídeos e áudio). Como todas as ferramentas, você precisa saber o que a tecnologia pode fazer e, principalmente, o que ela não pode fazer.

O que o ChatGPT pode fazer (e o que ele não pode fazer) no esporte?

Primeiro, o ChatGPT só foi treinado com palavras até setembro de 2021, portanto, não pode fornecer respostas recentes. Em segundo lugar, o GPT-3 requer texto como entrada. A linguagem do esporte é diferente do texto, e na Stats Perform's criamos a "linguagem do esporte" que alimenta nossa AI. E, por fim, mas não menos importante, o ChatGPT não é otimizado para garantir que as "respostas" que ele prevê sejam de fato corretas.

O ChatGPT não sabe nada sobre rúgbi ou críquete, basquete ou futebol, países, copas, tacos, bolas ou qualquer outra coisa sobre o mundo. Ele não foi treinado em fatos e estatísticas nem para reconhecer informações precisas para gerar suas previsões. Ele só conhece a ordem das palavras.

Isso o torna restritivo em domínios como notícias e esportes, em que resultados são resultados e estatísticas são estatísticas, especialmente porque o ChatGPT pode gerar artigos muito bem escritos que parecem confiáveis, mas não se baseiam no que realmente aconteceu.

Você pode ver isso fazendo consultas muito específicas, como esta sobre um jogador de rúgbi na Copa do Mundo de 2019:

As duas primeiras frases desta resposta bem escrita estão factualmente incorretas - Cheslin Kolbe marcou dois tries contra a Itália na fase de grupos e um try na final contra a Inglaterra.

Existe uma função para o ChatGPT no esporte?

Pom base em feeds de conteúdo e dados estruturados, precisos e atualizados, uma versão futura do ChatGPT poderia, em teoria, produzir rapidamente artigos de texto para atualizar os torcedores, acionados por uma pergunta de texto como "escreva-me uma prévia de todos os jogos de amanhã".

No entanto, já existem artigos automatizados escritos por máquinas como esses. Eles não usam os mesmos processos de "conversação" que o ChatGPT oferece, mas são factualmente corretos.

É uma nuance, mas o ChatGPT gera a narrativa e gera as informações dentro da narrativa. Isso torna AI generativa problemática para sintetizar reportagens, inclusive as esportivas.

Em vez disso, produtos específicos baseados em fatos, como o Automated Game Previews da Stats Perform, usam primeiro as estatísticas e os fatos de nossos feeds de dados esportivos como sementes da história e, em seguida, constroem a narrativa em torno dessas informações concretas.

Como nossas ferramentas começam com nossos feeds de dados, e esses feeds de dados são estruturados e precisos, isso significa que os artigos que são escritos não mudam e não são previsões "geradas" - são o que aconteceu.

Outros serviços automatizados no estilo de relatórios esportivos que usam nossos feeds de dados como base incluem o "Pressbox Live", que gera informações em tempo real para comentaristas de TV e o "Pressbox Graphics", que produz imagens automatizadas para mídias sociais ou blogs sempre que um gol, touchdown ou cesta é marcado.

O que vem a seguir?

Na Parte 2, examinamosa AI subjacente ao ChatGPT e analisamos como ela também já está sendo usada para elevar as experiências esportivas, principalmente no mundo do alto desempenho.

Na Parte 3, abordamos as implicações do mais recente modelo ChatGPT-4 e o que ele muda para o esporte.