
Bem-vindo à mais nova edição da série Últimas Tendências em AI no Esporte da Stats Perform, na qual nosso cientista-chefe, Patrick Lucey, discute os recentes desenvolvimentos em AI generativa e suas aplicações no setor esportivo.
Para quem está no mundo da AI e dos esportes, o Super Bowl de fevereiro foi um deleite dentro e fora do campo.
No campo e em nossas telas, vimos jogadores usando jogadas criadas com a ajuda do aprendizado de máquina pelos analistas de suas equipes, e ouvimos locutores nos dando insights AI para nos ajudar a entender o contexto e o significado.
Fora do campo, o Super Bowl apresentou anúncios com foco na AI como um recurso em produtos de consumo convencionais, como o anúncio do Copilot da Microsoft e o Google usando AI para mostrar seu poder no telefone Pixel.
No curto período antes e depois do Super Bowl, vimos lançamentos de manchetes como o Gemini do Google, o lançamento completo do Vision Pro da Apple e, mais recentemente, o recente lançamento da OpenAI de sua ferramenta multimodal text2video "Sora", bem como rumores sobre o lançamento de agentes AI e o aumento da utilização do Retrieval-Augmented Generation (RAG).
Neste artigo, processaremos alguns desses desenvolvimentos no mundo da AI generativa e explicaremos o RAG e os LLMs multimodais. Descreveremos como eles se relacionam conosco no esporte (tanto para fãs quanto para aplicativos de equipes profissionais) e discutiremos como, apesar das novas mudanças, uma coisa permanece a mesma: o valor dos dados subjacentes que alimentam os modelos de GenAI.
Em resumo: Mais de 12 meses após o ChatGPT
O que estamos vendo mais ou menos um ano após o lançamento do ChatGPT é que a tecnologia de AI generativa não está substituindo os humanos em seus trabalhos, como se temia em alguns círculos, mas permitindo que os humanos façam mais.
O ChatGPT e as tecnologias subsequentes baseadas em LLM nos forneceram uma série de ferramentas "AI" que podem ajudar alguns de nós a realizar algumas de nossas tarefas de forma um pouco melhor e mais rápida.
Por exemplo, o atendimento ao cliente, a tradução de idiomas, a pesquisa e a consulta de documentos (públicos ou privados) estão começando a ser feitos com muito mais eficiência e em maior escala do que antes. Ela também pode permitir a criação de novos conteúdos, sejam eles textuais, de áudio ou em imagens e vídeo (ou uma combinação deles).
Em última análise, o progresso nessas áreas (e o que impulsionou o Copilot, o Gemini e o Sora) se deve ao fato de a GenAI maximizar nossa capacidade de extrair valor dos dados. Os dados subjacentes ainda são o elemento mais importante no ecossistema da GenAI.
A terceira onda da AI geradora: dados diferenciados
Recentemente, o presidente e CEOVista Equity Partners, Robert Smith, fez um excelente resumo do que ele considera "As três ondas da AI geradora".
Na primeira onda, ele descreveu que o valor duradouro iria para os fornecedores de hardware (por exemplo, NVIDIA).
Na segunda onda, ele disse que o valor duradouro iria para os superescaladores (por exemplo, provedores de nuvem).
E na terceira onda, ele disse que o valor duradouro beneficiaria aqueles que podem utilizar essa capacidade nos mercados específicos em que vendem seus produtos. Em outras palavras, se você tiver uma diferenciação importante em um domínio específico (como dados amplos e profundos exclusivos em esportes), AI generativa poderá "super impulsionar" produtos e serviços nesse campo.
Estamos vendo as duas primeiras ondas se desenrolarem atualmente.
A primeira está beneficiando os fabricantes de chips, pois a sede por chips que possam ser usados para a GenAI parece insaciável. Isso fluiu para a segunda onda, em que os provedores de nuvem têm o armazenamento e a computação necessários para dimensionar as soluções de GenAI e integrá-las às suas soluções gerais, o que também está acontecendo agora.
Mas o valor duradouro de longo prazo estará na terceira onda, em que mercados específicos precisam de soluções adaptadas aos seus casos de uso específicos.
Por que os dados ainda são tão importantes para as APLICAÇÕES DE AI GERADORA nos esportes?
Vale a pena lembrar que, para obter os resultados mais precisos, os sistemas de AI generativa exigem entradas de dados mais precisas, confiáveis e uniformes. Sem entradas de qualidade, podem ser propagados resultados errôneos ou desinformação, ou as aplicações da AI são severamente limitadas, principalmente quando se trata de uso em campos específicos.
Portanto, mesmo que pareça que as coisas estão evoluindo e mudando, em sua essência, tudo ainda é o mesmo, pois todas as informações e insights são baseados em dados confiáveis e precisos.
Em áreas específicas, como esportes ou medicina, com casos de uso específicos, como análise de jogadores e previsões de desempenho, ou diagnóstico de sintomas e avaliação de tratamento, não se pode errar nos fatos. Se isso acontecer, a análise, as previsões e o diagnóstico posteriores também estarão errados.
Além disso, quanto mais detalhados e consistentes forem os dados, mais específicos, relevantes e úteis serão os resultados e as respostas.
Por exemplo, no futebol, onde Stats Perform tem dados detalhados Opta para mais de 13.500 equipes profissionais masculinas e femininas, garantimos que os mesmos dados e medidas sejam gerados em todos os jogos (não apenas em algumas ligas selecionadas).
Dessa forma, um passe e um chute têm a mesma definição e coleta uniformes em todas as ligas de futebol. Todos os eventos usam os mesmos protocolos para metadados como nomes, registros de data e hora e coordenadas de localização.
A classificação e a estrutura uniformes dos dados - coletados em tempo real - significam que os modelos de AI generativa podem ser treinados em grandes quantidades de dados, tanto em dados históricos quanto em estatísticas de jogo.
Isso melhora sua eficácia, além de aprimorar os recursos de pesquisa e facilitar a identificação de correlações e padrões no conjunto de dados.
Se eles não forem coletados e distribuídos uniformemente, as estatísticas e os resultados derivados não terão sentido para os seres humanos e para os modelos de GenAI.
AI generativa nos ajuda a descobrir insights valiosos que antes eram ocultados ou não eram vistos apenas pelo olho humano. Ela ajuda a maximizar o valor dos dados subjacentes. Se esses dados forem detalhados, uniformes e objetivos, seu valor poderá ser ainda maior.
Quanto mais profundo for o conjunto de dados de origem, mais perspicazes serão os padrões e mais precisas serão as previsões produzidas pela GenAI, e maior será a utilidade para aplicativos e campos específicos, como esportes.
A qualidade, a profundidade, a amplitude e a consistência dos dados são os principais ingredientes para que os sistemas AI (e especificamente os sistemas de GenAI) prosperem.
Por outro lado, o aumento da cobertura da mídia sobre os deepfakes que podem influenciar as eleições também me fez considerar o valor de dados esportivos independentes e confiáveis para combater ou neutralizar o potencial de usos nefastos de vídeos deepfake que podem ameaçar a integridade do esporte.
Alguns de vocês devem se lembrar de uma "história alternativa" profundamente falsa do famoso chute de Michael Jordan sobre Craig Ehlo, que foi publicada nas mídias sociais há alguns anos.s anos atrás. Ela mostra Jordan errando o chute vencedor do jogo que ele realmente fez, enganando muitos observadores. À medida que os LLMs text2video se tornam cada vez mais eficazes, aumenta a probabilidade de infiltração de deepfakes no esporte.
Esse é outro motivo pelo qual levamos incrivelmente a sério o papel da Stats Performcomo detentora de registros confiáveis do esporte e somos gratos à nossa incrível equipe de Operações de Dados, que se concentra dia e noite na integridade dos nossos dados, porque fontes confiáveis, independentes e verificáveis, como os dados da Opta, provavelmente serão ainda mais importantes em um futuro de deepfake.
O que é RAG?
O Retrieval-Augmented Generation (também conhecido como RAG) é outro desenvolvimento relativamente novo no campo AI generativa que permite que "especialistas não técnicos" possam recuperar e interrogar bases de conhecimento, sem depender de um engenheiro ou especialista em banco de dados para buscar esses dados, o que, de outra forma, é um grande obstáculo.
Se tiver uma base de dados sólidos e precisos, o RAG poderá então envolver essas informações na tecnologia atual baseada em LLM.
Essa tecnologia GenAI pode permitir que as pessoas façam mais, além de possibilitar iterações mais rápidas e obter conhecimento mais rapidamente. De certa forma, é o assistente definitivo, como ter um especialista permanentemente em seu ombro lhe dando as respostas (ise o sistema tiver acesso aos dados mais precisos e atualizados).
Onde quer que você tenha uma ampla base de conhecimento de informações, o uso da GenAI pode permitir a recuperação e a interrogação de informações esportivas, e o RAG pode facilitar isso para os sistemas que precisam acessar o conhecimento específico do domínio.
Novamente, ainda é necessário ter muita cautela, pois alucinações e informações desatualizadas podem ser propagadas, o que significa que a qualidade e a confiança nos dados de origem subjacentes são imperativas.
No entanto, se usado corretamente, com proteções e supervisão, o RAG pode ser de grande valor para personalizar o conteúdo e os tratamentos no mundo do esporte.
Em um artigo futuro, vamos nos aprofundar nesse tópico.
Desenvolvimentos usando vídeo, imagens e LLMs multimodais
A linguagem dos esportes são os dados coletados sobre a bola e os dados de movimento fora da bola. Chamamos isso de multimodal, pois captura dois modos de informação que são complementares - como imagens ou vídeos com uma legenda de texto para descrever o que está ocorrendo (que é como o GPT-4, o Gemini e o Sora podem fazer a geração de text2image e text2video).
Uma maneira de utilizar o vídeo de forma eficaz em LLMs para esportes é capturar e combinar dados do jogador e da bola fora e dentro da bola, pois isso permite a medição de uma reconstrução completa do desempenho, bem como a criação de aplicativos interativos.
Em um avanço recente, conseguimos usar nosso vasto banco de dados Opta e um LLM multimodal para estimar a localização dos jogadores ausentes que não podem ser vistos no vídeo (parcial ou totalmente), o que permite que cada passe e decisão sejam analisados no contexto completo de onde os outros jogadores estão posicionados e o que estão fazendo.
Acabamos de apresentar essa aplicação avançada de AI generativa em esportes na Conferência de análise esportiva do MIT Sloan de 2024. Mas isso é apenas o começo - a partir desse modelo básico, há muitas outras aplicações. Aguarde muitas outras atualizações nossas neste espaço.
De que outra forma os recentes avanços AI generativa poderiam se relacionar com a análise de esportes profissionais?
Os LLMs específicos de esportes também podem ser usados para criar previsões que antes não podiam ser modeladas com precisão, dando aos analistas de equipes e treinadores um assistente muito poderoso.
Por exemplo, a modelagem das estatísticas individuais de um jogador de futebol é notoriamente difícil, pois depende dos companheiros de equipe com os quais ele está jogando e dos adversários, bem como do estado do jogo para previsões ao vivo (por exemplo, se o time está ganhando/perdendo, se um jogador foi expulso etc.).
Os mesmos métodos de AI generativa usados para treinar os modelos que alimentam o ChatGPT e o Gemini (ou seja, redes neurais transformadoras) podem, no entanto, ser usados para gerar previsões para cada jogador (e para a equipe) a partir do mesmo modelo, o que representa uma mudança de paradigma na forma como as previsões nos esportes podem ser realizadas
O poder dessa abordagem não está apenas fornecendo previsões mais precisas, mas possibilitando novos aplicativos, como um "assistente técnico virtual", em que um usuário poderia perguntar "se eu tirar o jogador X e colocar o jogador Y, como isso poderia mudar o resultado da partida, ou levar a mais ou menos chutes?". Ou outra pergunta poderia ser "onde o defensor deveria estar naquela situação para impedir o chute?", ou "onde o jogador vai bater na bola em seguida".
Essa pode ser uma nova maneira de interagir com os esportes que antes estavam confinados apenas a um videogame e, para esse último exemplo, fizemos exatamente isso com nossos grandes parceiros da Tennis Australia durante o último Australian Open em janeiro de 2024. Você pode ver isso em ação AQUI.
Assim como acontece com os outros assistentes AI , os analistas e treinadores esportivos poderão desenvolver estratégias e táticas cada vez mais sofisticadas, o que resultará em ainda mais "momentos incríveis" em campo para os torcedores.
Como os dados esportivos e os LLMs contribuem para os avanços da realidade mista (ou seja, Apple Vision Pro)?
Assistir e interagir com esportes tem um papel de destaque no vídeo de lançamento do Apple Vision Pro.
Além de assistir ao jogo de vários ângulos, os usuários podem ter todos os dados e percepções que quiserem em seu ecossistema de visualização, seja por meio de uma consulta de áudio ou de um gesto. Eles também podem interagir com os módulos para consumir conteúdo adjacente, como destaques, outros jogos, bate-papo com amigos ou ver comentários (ou publicidade contextual).
A ambição parece ser criar uma experiência de 360 graus que, em última análise, torna cada detalhe do jogo mais interessante e divertido, aproximando o torcedor dos jogadores, das equipes, da "emissora" e dos patrocinadores.
Dados esportivos de qualidade sustentam muitas dessas experiências, tanto de forma visível quanto nos bastidores.
Entre essas maneiras nos bastidores estão LLMs que potencializam as previsões; curadoria do melhor conteúdo e publicidade para exibição no melhor momento, incluindo os destaques; personalização do que os usuários veem, ouvem e sentem com base no estado do jogo e nas preferências; potencialização das oportunidades de gamificação; adição de camadas incríveis de contexto para tornar as habilidades dos atletas ainda mais memoráveis e, de modo geral, aprofundamento do poder de contar histórias do evento e, consequentemente, seu valor para fãs e patrocinadores.
Sem mencionar os insights táticos que ele proporcionará aos analistas e técnicos, elevando o entretenimento em campo a patamares ainda mais altos!
Conferência Sloan Sports Analytics 2024
Para concluir esta atualização, acabei de voltar de mais dois dias fascinantes na Sloan Sports Analytics Conference. Conforme mencionado anteriormente, apresentamos um artigo sobre como AI generativa pode ser aproveitada para uma aplicação específica em esportes, com dados de origem de alta qualidade, para prever a localização precisa de jogadores de futebol que não são percebidos visualmente nas transmissões (link abaixo). Outros painéis e apresentações discutiram aplicações amplas da GenAI em tarefas para organizações esportivas, como atendimento ao cliente e pesquisa. Falaremos sobre esses e outros usos específicos em artigos futuros.
Patrick Lucey é o cientista-chefe da Stats Perform. Leia outras opiniões e insights dele sobre o papel que o ChatGPT e os modelos de linguagem de grande porte desempenham no esporte e sobre o que veremos a seguir.
Em breve, nos artigos de Patrick, ele discutirá o artigo 2024 daStats Perform da Stats Perform na Sloan Sports Analytics Conference em mais detalhes, se AI generativa poderia melhorar a aplicação do VAR (Video Assistant Referee, árbitro assistente de vídeo) no esporte, se os agentes AI serão úteis no esporte e as aplicações da AI generativa para aprimorar as transmissões e os patrocínios esportivos. Ele também fará uma nova análise do objetivo original da RoboCup, que é permitir que robôs humanoides totalmente autônomos derrotem o melhor time de futebol humano do mundo, em um campo externo real, até o ano de 2050!