Ir para o conteúdo principal
Torcedores torcendo no Estádio Luzhniki durante o jogo entre Rússia e Arábia Saudita na Copa do Mundo de 2018
Federações e detentores de direitos, clubes profissionais e faculdades

O futuro da cobertura esportiva: Parte 2

Patrick Lucey, cientista-chefe da Stats Perform, fala sobre ChatGPT, aprendizagem profunda e tecnologias AI no esporte.

Por: Patrick Lucey

Para ver a primeira parte, consulte nossa história aqui.

O que os modelos e transformadores de linguagem por trás do ChatGPT podem fazer no esporte?

Além dos chatbots, existe um lugar para modelos de linguagem e Inteligência Artificial Generativa no esporte?

A resposta é um retumbante "sim" e, em nossa opinião, é a próxima revolução na análise esportiva, para proporcionar uma compreensão mais profunda do que nunca do jogo para equipes e torcedores, especialmente no futebol.

Para começar, temos que especificar o idioma do esporte. Para o texto, que é a entrada necessária para o ChatGPT, o idioma já existe. Como vimos, o modelo de linguagem do ChatGPT utiliza dados de texto brutos, que têm sua própria estrutura inerente (pense em letras, palavras, frases, parágrafos). A arquitetura do transformador aprende as estatísticas e as correlações prevendo as palavras que faltam, utilizando o contexto dentro da frase, do parágrafo e da narrativa geral da história.

Os dados esportivos têm uma estrutura de linguagem inerente diferente. No futebol, por exemplo, são 11 contra 11 (ou 10 jogadores em campo contra 10 jogadores em campo na maioria das vezes). Cada um desses jogadores tem uma função, que pode evoluir ou mudar durante um jogo.

A representação das informações do jogador durante o jogo dentro de uma equipe é extremamente importante. Poderíamos dizer que cada jogador é uma letra (em vez de usar o nome ou o número da camisa, utilizamos a localização e as estatísticas do jogo, bem como as estatísticas de jogo recentes e de longo prazo), e cada evento em campo poderia ser descrito como uma palavra, e essas letras precisam ser ordenadas corretamente para que possamos entender essa palavra.

Cada jogada poderia ser uma frase, e cada posse de bola poderia ser vista como um parágrafo. O capítulo poderia ser a partida, e a temporada poderia ser vista como um livro. Além de criar a estrutura (ou gramática) correta, a entrada de dados esportivos é espaço-temporal (ou seja, as posições x e o dos jogadores) e baseada em eventos (ou seja, o tipo de evento e o resultado das posses), o que exige um pré-processamento significativo. Portanto, podemos pensar nos dados esportivos como um filme, em vez de um livro - a entrada é multimodal em vez de uma única fonte de entrada.

Agora que a linguagem de entrada do futebol foi definida, podemos começar a aprender um "modelo de linguagem de futebol" que pode nos permitir gerar resultados que não conseguíamos antes. Agora, considerando os problemas inerentes que os chatbots de AI têm em "alucinar" fatos, em vez de tentar gerar resultados para qualquer pergunta feita, podemos usar a "engenharia de prompt inteligente" para responder a perguntas que não podiam ser respondidas anteriormente. Para saber mais sobre a engenharia de prompt inteligente, consulte o primeiro artigo desta série.

Apresentamos uma série de exemplos práticos a seguir.

Opta Vision

Opta Vision é um feed de dados AI que utiliza tanto dados vision computacional quanto nossos dados de eventos humanos. Em seguida, esses dados são processados por meio de nossa rede neural gráfica para fornecer previsões sobre cada evento que descreve a capacidade de tomada de decisão e execução da equipe e do jogador individual.

Por exemplo, com nossa representação (ou linguagem) de formação subjacente, podemos detectar qual formação uma equipe está jogando (por exemplo, 4-4-2, 3-4-3, 4-3-3 etc.) e como ela muda com e sem posse de bola.

Também podemos atribuir a função de um jogador em cada quadro, o que nos permite ver quando os jogadores se sobrepõem ou se há uma mudança tática durante a partida.

Usando a mesma representação subjacente, também podemos prever a probabilidade de um jogador fazer um passe, a probabilidade de o passe criar uma chance de gol nos próximos 10 segundos ou avaliar se foi a opção certa.

Usando nosso modelo de linguagem de futebol, prevemos todas as opções possíveis ao mesmo tempo; em outras palavras, prevemos a frase, em vez de prever cada letra separadamente. Fazemos isso usando os locais, a dinâmica e os eventos de todos os jogadores como sequência de entrada e, em seguida, mapeando-os para a sequência de saída que corresponde à dificuldade de passe, disponibilidade etc.

Anteriormente, analisávamos cada opção de jogador de forma independente, mas usando nossa abordagem de modelagem de linguagem de futebol de grande porte, agora podemos analisar todos os jogadores de uma só vez. Obviamente, isso é valioso para compreender a capacidade de tomada de decisão de cada jogador em cada evento, mas podemos usar uma abordagem semelhante para prever as estatísticas de cada jogador no final do jogo.

Previsão de desempenho do jogador com base no transformador 

Imagine que você é um técnico de futebol e quer saber qual jogador terá o maior impacto na mudança do resultado durante o jogo. As previsões anteriores do desempenho de um jogador eram feitas independentemente de outros jogadores e adversários. Usando nossa abordagem de transformação com nosso enorme banco de dados de futebol, criamos um modelo que pode prever todos os resultados do jogador e da equipe ao mesmo tempo.

Novamente usando a analogia da tradução automática, a ideia é mapear uma sequência de entrada de informações sobre o jogador e a equipe no início do jogo (ou durante o jogo) como a sequência de entrada. Em seguida, usamos nossa rede transformadora para mapear isso para a sequência de saída mais provável, que, neste caso, são as estatísticas finais da partida. O poder de usar a rede transformadora é que ela pode generalizar rapidamente para situações inéditas. No futebol, isso é comum, pois os times em uma temporada regular jogam em casa e fora, e as escalações geralmente são diferentes (assim como os técnicos), além da forma recente.

Essa é uma inovação e, em 2023, estaremos mostrando o poder dessa tecnologia. Para treinar esse modelo, utilizamos nosso banco de dados Opta exclusivamente profundo de dados de eventos, que tem mais de 1,5 TB (o que não inclui nosso considerável arquivo de dados de rastreamento).

Fantasma

Também podemos utilizar técnicas semelhantes para aprimorar nossa capacidade de fazer ghosting (ou seja, simular onde os jogadores deveriam estar em uma jogada, trabalho do qual fomos coautores anteriormente em futebol e basquete).

As abordagens anteriores utilizavam uma rede de políticas supervisionadas para prever os comportamentos das equipes de forma determinística, mas, com os avanços na modelagem de linguagem, poderiam ser gerados resultados mais criativos (alguns que talvez não tenham sido vistos antes). Mas vale a pena observar que, às vezes, os técnicos/analistas preferem ter a previsão determinística (ou seja, o que aconteceu) em vez das diferentes maneiras pelas quais a jogada poderia ter sido executada.

Coleta de dados

Outro benefício do uso da modelagem de linguagem é que ela pode ser usada como um auxílio auxiliar em nosso processo de coleta de dados esportivos (semelhante ao assistente de codificação mencionado anteriormente), onde é usada em nossos sistemas de rastreamento de jogadores e bolas vision computacional ou para destacar um ponto de dados potencialmente errôneo para nossas operações humanas ou equipes de integridade avaliarem.

Conclusão

O ChatGPT é uma ferramenta fantasticamente ambiciosa e incrivelmente bem executada. Embora possa não ter tantas aplicações diretas em esportes ou reportagens como em outros campos, as abordagens subjacentes AI generativa já estão em uso na Stats Perform, usando nossa própria linguagem de esporte como entrada. Elas já estão alimentando muitos aplicativos na área de desempenho da equipe e certamente aumentarão muitos aspectos do conteúdo e da análise esportiva no futuro.

O Dr. Patrick Lucey é o cientista-chefe da gigante de dados esportivos Stats Perform, liderando a equipe de AI com o objetivo de maximizar o valor dos profundos tesouros de dados esportivos da empresa. Patrick estudou e trabalhou na área de AI nos últimos 20 anos, ocupando cargos de pesquisa na Disney Research e no Robotics Institute da Carnegie Mellon University, além de ter passado um tempo no T.J. Watson Research Center da IBM enquanto fazia seu Ph.D. Patrick é natural da Austrália, onde obteve seu BEng(EE) na University of Southern Queensland e seu doutorado na Queensland University of Technology. Ele é autor de mais de 100 artigos revisados por pares e foi coautor de artigos no MIT Sloan Best Research Paper Track, ganhando o prêmio de melhor artigo em 2016 e vice-campeão em 2017 e 2018.