GPT-4: Isso muda alguma coisa para o esporte?

Em novembro de 2022, o laboratório de pesquisa de inteligência artificial, Open AI, lançou seu aplicativo de AI ChatGPT superpopular, que conquistou o mundo. A tecnologia que impulsiona a tecnologia do ChatGPT é o modelo de linguagem grande (LLM) chamado GPT-3 (ou, mais precisamente, GPT-3.5) - para obter uma descrição do que é um LLM e nossa visão inicial sobre essa tecnologia e como ela se relaciona com o esporte, confira nossa série de duas partes aqui (Parte 1 & Parte 2). Há algumas semanas, a OpenAI lançou seu novo modelo de linguagem grande (LLM), o GPT-4. De acordo com a OpenAI, o novo modelo pode fazer mais coisas e é mais preciso do que o LLM anterior. Mas o que realmente deixou as pessoas de cabelo em pé foi a introdução do recurso de compreensão de imagens, especialmente quando o cofundador da OpenAI fez o upload de um desenho para um site de piadas[LINK]. Seguindo o exemplo, alguns dias depois, o Google lançou seu chatbot "Bard" em modo de pesquisa. Há muitos artigos com uma boa visão geral que dão uma ideia do que esses dois lançamentos recentes podem fazer, mas neste artigo discutiremos as implicações do modelo GPT-4 no esporte. As ideias compartilhadas aqui são um resumo do que apresentei no último mês no MIT Sloan (resumo aqui) e em nossoForum Opta .

O GPT-4 resolveu o problema da "alucinação de Facts" no esporte?

Em nossos artigos anteriores, destacamos os principais problemas ao usar o ChatGPT no esporte: 1) ele alucina fatos e 2) o corte no conjunto de dados em que foi treinado foi setembro de 2021. Vamos discutir o primeiro problema. Como já foi mencionado, o GPT-4 deve ser mais preciso, portanto, vejamos o exemplo que usamos no artigo anterior (como lembrete, perguntamos quantas tentativas Cheslin Kolbe marcou na Copa do Mundo de Rúgbi de 2019? A resposta dada foi 2 tries (um contra a Nova Zelândia e outro contra o Japão), o que estava errado, pois ele marcou 3 tries - 2 contra a Itália na fase de grupos e 1 contra a Inglaterra na final.

Como você pode ver na imagem acima, quando o chatbot recebe a mesma pergunta, a resposta é muito mais restrita. Assim, a resposta está correta, pois ele marcou 3 tentativas na Copa do Mundo de Rugby, mas não tem o nível de detalhes que foi fornecido na resposta anterior. Quando pedimos mais detalhes, foi isso que obtivemos:

Pelos resultados, ele respondeu corretamente a algumas das perguntas (2 tentativas contra a Itália), mas errou na outra parte (ele não marcou contra o Canadá, mas marcou uma tentativa na final contra a Inglaterra). Portanto, no que diz respeito ao GPT-4 resolver o problema da alucinação, isso ainda é um problema e é provável que continue assim por muito tempo devido à natureza autorregressiva desses modelos de inteligência artificial (ou seja, o modelo prevê a próxima palavra em uma sequência dada a palavra anterior e não está vinculado a nenhum conhecimento da realidade).

Em uma apresentação na semana passada na NYU, uma das figuras mais proeminentes da AI, Yann LeCunn, destacou esse problema e disse que a abordagem atual dos LLMs está fadada ao fracasso, pois nunca resolverá esse problema de alucinação. Esses modelos precisam estar vinculados à realidade de alguma forma (veja a apresentação de slides aqui), o que se alinha com o que dissemos nos artigos anteriores, que precisamos fundamentar os resultados no mundo real: é vital que a fonte da verdade no esporte venha de provedores de dados esportivos confiáveis, como Stats Perform. Tamanha é a preocupação com esse problema e o potencial de danos e desinformação - houve uma carta aberta de mais de 1.000 líderes de tecnologia para interromper o desenvolvimento desses LLMs, pois eles apresentam "riscos profundos para a sociedade e a humanidade" [LINK]. Mais sobre isso no final.

E quanto a ter um conjunto de dados atualizado? Houve alguma mudança nesse aspecto?

Sim e não. Embora o problema de alucinação persista, conforme mencionado, a OpenAI lançou na semana passada uma série de plug-ins para o ChatGPT que permitirão que o chatbot interaja com o 3rd parte das APIs [LINK]. Com esses avanços nos plugins, é possível incorporar a funcionalidade do ChatGPT à pilha de códigos existente, permitindo que os desenvolvedores recuperem chamadas de informações em tempo real. Fique atento a este espaço.

Além disso, isso levanta a questão de como a tecnologia de inteligência artificial, como o ChatGPT, pode ser usada em um ambiente ao vivo. Em geral, a maioria das perguntas que as pessoas fazem se baseia em uma base de conhecimento estática que não muda. No entanto, o esporte é diferente, especialmente em um jogo ao vivo. Obviamente, você poderia fazer uma pergunta simples, como "Quem está ganhando?" ou "Quem fez o gol?", mas essas respostas já estão disponíveis atualmente por meio dos chatbots "pré-ChatGPT". Para obter insights mais profundos, a capacidade de fazer consultas ao vivo é difícil porque, no momento em que se digita uma consulta sobre um elemento específico do jogo, outra coisa já pode ter ocorrido, o que diminui o valor ou o interesse dessa consulta. É por isso que é necessária a consulta automática ou a "detecção de destaque", que é acionada por um evento interessante. Temos esse recurso em nossa plataforma PressBoxLive, onde, quando algo interessante, como um gol, ocorre, podemos gerar automaticamente insights interessantes sobre isso imediatamente. O bom disso é que é possível escalonar. Por exemplo, em um jogo recente na segunda divisão da Bundesliga (2. Bundesliga) entre Arminia Bielefeld e Nurnberg, quando um gol é marcado, podemos gerar um insight para esse jogo como faríamos para a primeira divisão, o que ressalta o valor da AI nos esportes - a capacidade de escalar (e fazer isso ao vivo). Não se trata apenas de insights de texto; podemos gerar sobreposições automáticas em vídeo, o que pode dar mais cor ao desempenho, como fizemos recentemente no tênis.

A capacidade de inserir imagens e desenhos foi legal - Podemos inserir uma imagem ou desenho de esportes no ChatGPT e obter um resultado?

Conforme mencionado no artigo anterior, na Stats Perform, fomos pioneiros no domínio da análise interativa de esportes, em que era possível desenhar uma jogada e recuperar jogadas semelhantes ou fazer análises sobre a jogada [LINK], ou até mesmo prever onde os jogadores deveriam estar em uma determinada situação usando nosso trabalho de Ghosting [LINK]. Em termos da demonstração do GPT-4, no entanto, isso funciona de forma um pouco diferente. A rede transformadora de texto para imagem ou de imagem para texto aprende com uma enorme quantidade de pares de texto para imagem (ou seja, para cada imagem, há uma descrição textual como uma legenda). Para esse conjunto de treinamento, o transformador aprende a correlação entre as descrições textuais e as partes da imagem. Devido ao comportamento emergente dessas redes neurais muito grandes, ele pode fazer algum raciocínio sobre determinados elementos da imagem (por exemplo, por que uma determinada imagem é engraçada?).

No caso do esporte, ainda estamos expandindo o vocabulário de eventos, que pode ser considerado uma legenda da jogada. Não basta apenas ter o fluxo de eventos; usando nossas métricas e modelos de aprendizado de máquina, podemos detectar a qualidade de uma ação (como um chute com xG ou um passe usando nosso valor de posse no futebol). Expandir o vocabulário é uma coisa, mas dimensionar a quantidade de dados é outra coisa que precisa ser feita.

É por isso que a Opta Vision é tão importante, pois faz as duas coisas: a) amplia o vocabulário de eventos no futebol e b) aumenta o número de jogos para os quais temos esse rico vocabulário.

Além disso, tendo emparelhado o fluxo de eventos expandido (que pode ser visto como a legenda) com os dados de rastreamento, podemos aumentar nossos recursos de raciocínio em torno de cada jogada por meio desse conjunto de dados emparelhado (ou seja, vocabulário expandido e dados de rastreamento). No momento, estamos no ponto de inflexão, que levará ao próximo nível de análise esportiva.

LLMs: Confiança, perturbação e impacto na sociedade

Conforme mencionado acima, devido à grande imponência e ao rápido aprimoramento da tecnologia LLM, muitas pessoas proeminentes em todo o mundo estão se tornando extremamente cautelosas em relação ao impacto que essa tecnologia terá na sociedade e ao potencial de danos - e, como tal, pediram uma pausa nessa tecnologia. Esse é um tópico extremamente importante, mas com relação ao esporte, esta é minha opinião pessoal sobre como vejo essa questão atualmente:

Como uma ferramenta de assistência, os chatbots de AI baseados em LLM são um divisor de águas em termos de auxílio ao aprendizado e eficiência. Como toda tecnologia, é preciso saber o que ela pode e o que não pode fazer. Na minha opinião, essas ferramentas AI são a melhor ferramenta de assistência e podem ajudar os novatos a atingir um nível mais alto de eficiência, o que foi destacado em um estudo recente realizado por pesquisadores do MIT [LINK]. Outro estudo mostrou que os desenvolvedores que usaram o GitHub Copilot concluíram as tarefas 55,8% mais rápido do que o grupo de controle [LINK]. Quando a base de conhecimento é estática, confiável e atualizada, poder questionar e detalhar partes específicas do conhecimento é incrível (mas o principal é poder fazer a pergunta certa e entender se a resposta está relacionada ao problema que você deseja resolver).
No entanto, é necessário que haja barreiras de proteção. Se os dados forem confiáveis (como os dados que temos na Stats Perform), não há muito mal na utilização desses dados para tais fins, mas é preciso garantir que os fatos sejam preservados (e não alucinados). Em áreas fora do esporte, onde existe uma mistura de fatos e ficção no éter, isso é mais problemático, pois a desinformação pode ser propagada, portanto, é necessário que haja verificações para evitar que essas coisas aconteçam. Além disso, a proteção de informações privadas e confidenciais é importante, pois uma vez que essas informações estejam nos LLMs, é quase impossível impedir que sejam propagadas.
No esporte, existem essas proteções naturais. Por exemplo, na Stats Perform, somos os detentores do registro público dos dados das partidas, mas não temos informações privadas, como informações médicas, psicológicas, de treinamento e de contrato dos jogadores (e nunca esperaríamos ter). Essa barreira natural oferece proteção. Também oferece a oportunidade de os jogadores/clubes/clientes usarem nossas análises/modelos em nível de partida como uma das entradas, que podem ser mescladas com os dados privados que possuem.
Além disso, os seres humanos precisam ser os tomadores de decisão finais (e precisam ser capazes de saber quando a tecnologia erra e quando é possível confiar nela). Você poderia pensar nisso como um piloto em um avião. Nos últimos 100 anos de viagens aéreas comerciais, o número de pilotos não mudou. No entanto, a tecnologia do avião melhorou muito, o que aprimorou a tomada de decisões, a segurança e a eficiência das viagens aéreas. Apesar disso, o número de pilotos permaneceu o mesmo. Essencialmente, o que a tecnologia AI está fazendo em nossa área de esporte é criar uma tecnologia de assistência para ajudar os especialistas no domínio a tomar as melhores decisões, além de ser o mais eficiente possível.
Além disso, o mundo não existe apenas em linguagem natural ou dados esportivos. Há muitas coisas que ainda não podemos digitalizar (e provavelmente não o faremos, devido aos dados públicos e privados mencionados acima), como, por exemplo, se um jogador teve uma boa noite de sono na noite anterior, se brigou com a pessoa amada, se as crianças estão doentes/incomodadas ou as interações entre as personalidades dos jogadores. Os tomadores de decisão são capazes de digitalizar isso por meio das muitas entradas de sensores que possuem e, dessa forma, terão as informações mais relevantes à mão para tomar a melhor decisão. Nosso trabalho é fornecer a eles as melhores informações que temos sobre os dados disponíveis.

O espaço da inteligência artificial muda diariamente, e faremos o possível para manter todos atualizados sobre o progresso nesse campo e como ele se relaciona conosco. No próximo artigo, também nos aprofundaremos no projeto Opta Vision e em como ele traça paralelos com o que está acontecendo no domínio dos veículos autônomos. Mantenha-se informado sobre isso.

O Dr. Patrick Lucey é o cientista-chefe da gigante de dados esportivos Stats Perform, liderando a equipe de AI com o objetivo de maximizar o valor dos profundos tesouros de dados esportivos da empresa. Patrick estudou e trabalhou na área de AI nos últimos 20 anos, ocupando cargos de pesquisa na Disney Research e no Robotics Institute da Carnegie Mellon University, além de ter passado um tempo no T.J. Watson Research Center da IBM enquanto fazia seu Ph.D. Patrick é natural da Austrália, onde obteve seu BEng(EE) na University of Southern Queensland e seu doutorado na Queensland University of Technology. Ele é autor de mais de 100 artigos revisados por pares e foi coautor de artigos no MIT Sloan Best Research Paper Track, ganhando o prêmio de melhor artigo em 2016 e vice-campeão em 2017 e 2018.

GPT-4: Isso muda alguma coisa para o esporte?

Também recomendamos

Inscreva-se no Scoreboard