Após o prazo de envio da semana passada para a segunda etapa do concurso de pesquisaOpta Forum 2024, quatro projetos foram indicados para apresentação no palco, e outros cinco foram recomendados para apresentações em pôsteres.
Cada proposta enviada foi avaliada com base em quatro critérios principais: inovação, metodologia, relevância e aplicação. Agora, os nove projetos mais fortes serão apresentados a um público convidado de representantes do setor em Londres.
Uma nova iniciativa para o Opta Forum 2024 é a introdução de um novo palco, onde cada um dos cinco expositores de pôsteres terá a oportunidade de fazer uma palestra de destaque de 10 minutos. Elas ocorrerão durante os intervalos programados para networking, permitindo que os delegados saibam mais sobre seus projetos e principais descobertas.
O Opta Forum, que está sendo realizado pelo décimo primeiro ano consecutivo, continua sendo uma data importante no calendário analítico do futebol. No evento, vários apresentadores anteriores passaram a trabalhar em várias funções no setor de futebol profissional, como destacado aqui.
Além dessas apresentações de pesquisa, o Opta Forum 2024 contará com uma agenda repleta de palestras e painéis de discussão, que se concentrarão em temas importantes sobre o papel dos dados para melhorar o desempenho e o recrutamento em um ambiente de equipe, bem como aumentar o envolvimento do público a partir de uma perspectiva voltada para os fãs.
A linha completa de apresentações de pesquisas e pôsteres para o Opta Forum 2024, listada em nenhuma ordem específica, é a seguinte:
Apresentações no palco
Harsh Mishra - Uma análise causal das cobranças de escanteio
Esse projeto foi escolhido na categoria de envio aberto, que se baseia na pesquisa anterior de Laurie Shaw sobre o estabelecimento de um manual para cobranças de escanteio por meio das lentes de uma Estrutura Causal.
Usando uma combinação de dados de eventos e de rastreamento, o projeto de Harsh divide mais de 600 cobranças de escanteio diferentes, tentadas durante a temporada 2021-22 da Ligue 1, com base no tipo de lançamento, na configuração defensiva (marcação masculina ou zonal) e no resultado geral. As configurações de ataque recorrentes em escanteios, levando em conta os locais de início e fim do jogador, o movimento dinâmico e a marcação adversária, também são agrupadas.
A estrutura causal de Harsh é então aplicada para estabelecer a probabilidade de ocorrência de um chute para cada configuração de ataque diferente, tanto quando se joga contra configurações defensivas específicas quanto quando se visa tipos específicos de escanteio.
O objetivo do projeto é ajudar os analistas de jogadas de bola parada a identificar rapidamente tipos específicos de escanteio, tornando seus fluxos de trabalho mais eficientes e maximizando o tempo disponível para analisar jogadas de bola parada em um contexto de ataque e defesa.
Originário da Índia e agora radicado no Reino Unido, Harsh tem mestrado em Ciência da Computação e atualmente trabalha como engenheiro de aprendizado de máquina na Rothamsted Research. Ele é um membro ativo da comunidade global de análise de futebol, onde você pode acessar seu blog ou conectar-se a ele no LinkedIn.
Alex Sattari - Identificação de estilos de jogadores por meio da análise de passes, recepções e corridas de alta intensidade para otimizar o perfil de recrutamento
Este projeto foi escolhido na categoria de submissão liderada por profissionais do Opta Forum, definido por Mathieu Lacome, de Parma, que aplica os dados Opta Vision para criar novas caracterizações interpretáveis de estilos individuais de jogadores.
Depois de estabelecer redes dedicadas de passe, recepção e corrida de alta intensidade, abrangendo todos os jogadores em uma competição específica, Alex propõe a aplicação da Fatoração de Matriz Não Negativa (NMF), com o objetivo de descobrir padrões comuns de passe, recepção e corrida de alta intensidade entre todos os jogadores. A análise NMF também será usada para identificar a combinação exclusiva desses padrões comuns para cada jogador, o que resultará em uma nova caracterização interpretável do estilo de cada jogador.
O objetivo desta pesquisa é aprimorar o pipeline de perfis existente em um departamento de recrutamento, simplificando o processo para que os analistas identifiquem jogadores com semelhanças estilísticas e características de campo procuradas para perfis de jogadores dentro do modelo de jogo de um clube.
Alex é PhD em geofísica pela Universidade de Calgary, no Canadá, e, mais recentemente, trabalhou como pesquisador associado de pós-doutorado em análise de esportes na Universidade de Jönköping, na Suécia. Atualmente, ele mora em Calgary.
Niamh Graham, Yasmin Hengster e Maia Trower - Net Gains: Analysing the Impact of Diversity on Performance in Women's Football (Análise do impacto da diversidade no desempenho do futebol feminino)
Usando os principais dados biográficos das jogadoras e os dados de eventos Opta da FA Women's Super League, o projeto de Niamh, Yasmin e Maia aborda a questão de saber se existe uma ligação entre diversidade e coesão nas equipes da WSL e o desempenho individual das jogadoras.
Eles analisarão a relação entre a diversidade de um elenco em termos de idade, nacionalidade e histórico do clube e a coesão de uma equipe medida pelo tempo que os jogadores passaram jogando juntos no passado.
Em seguida, ao criar redes de passes para cada cadeia de posse de bola em uma partida da WSL, eles procurarão atribuir uma pontuação de diversidade e uma pontuação de coesão a cada posse de bola. Em seguida, usarão um valor xG para cada cadeia de posse de bola que termina em um chute, para avaliar o impacto da diversidade e da coesão no desempenho individual e da equipe.
Niamh, Yasmin e Maia trabalham na Universidade de Edimburgo, onde cada uma delas está concluindo o doutorado em matemática.
Matthieu le Gall - Analisando o impacto dos arremessos no futebol moderno: Possession, Patterns, and Game Context (Posse, padrões e contexto do jogo)
A apresentação de Matthieu aplica dados de eventos Opta com o objetivo de identificar padrões recorrentes de jogo, após um arremesso, para ajudar a identificar as equipes que são mais eficazes na criação de oportunidades de gol a partir de sequências que começam com um arremesso, em diferentes cenários de jogo.
O projeto de Matthieu está dividido em duas partes. Na primeira parte, ele dividirá os arremessos em diferentes categorias, tanto do ponto de vista do ataque quanto da defesa, levando em conta fatores-chave como tempo de posse de bola, passes feitos durante uma sequência e território conquistado. Essas informações serão usadas para criar um índice de arremessos para as equipes de toda a liga, destacando como as equipes usam a bola a partir de um arremesso, como reinícios rápidos, retenção de bola ou, em um contexto defensivo, alta pressão para forçar uma virada.
Na segunda parte, ele analisará os padrões de passe, a partir de arremessos, para identificar insights sobre como as equipes capitalizam estrategicamente as oportunidades de arremesso para gerar ameaça de gol. Ele também mostrará uma análise das probabilidades das coordenadas de localização da extremidade do passe para eventos de passe após um arremesso lateral.
Morando em Rennes, na França, Matthieu trabalha como cientista de dados para o Ministério das Forças Armadas da França. Ele combina seu trabalho com os estudos para obter um diploma em Big Data e AI no Conservatoire National des Arts et Métiers. Ele deve concluir seu diploma no final deste ano e, em seguida, deseja ingressar em um clube ou empresa que trabalhe com esportes como cientista de dados.
Expositores de pôsteres
Hoyoung Choi - Uma abordagem de rede neural gráfica para avaliar formações defensivas
Este pôster apresentará uma abordagem para medir o desempenho de várias formações defensivas adotadas pelas equipes durante uma temporada.
Por meio do desenvolvimento e da aplicação de um modelo de Graph Neural Network (GNN), com ênfase específica na retenção da posse de bola, Choi compartilhará insights criados para ajudar a melhorar a compreensão das estratégias defensivas de uma equipe e a influência coletiva de todos os jogadores em campo em relação à sua eficácia em manter a bola.
Essa abordagem GNN foi projetada para oferecer às equipes líderes um sistema prático e aplicável para a análise de estruturas defensivas no mundo real.
Choi é um estudante de graduação que obteve o diploma de bacharel no início deste ano e agora está fazendo mestrado no departamento de Engenharia Industrial e de Sistemas do KAIST, localizado em Daejeon, República da Coreia.
Leo Martins de Sá Freire - Apresentando o "Threat-to-Goal" - Medindo a eficiência coletiva na conversão do volume ofensivo em oportunidades de marcar gols
Nos últimos anos, a aplicação de dados de eventos tem se concentrado significativamente em métricas de avaliação de ações, como Valor de Posse (PV) e Ameaça Esperada (xT). Essas métricas permitem que os analistas de dados meçam a qualidade de cada ação na bola durante uma partida. No entanto, a relação entre os valores gerados por uma equipe por meio dessas ações e o perigo representado para um adversário por meio de chances de gol continua pouco explorada.
O pôster de Leo tem como objetivo preencher essa lacuna, apresentando as descobertas de uma investigação aprofundada sobre a relação entre duas métricas avançadas, Expected Goals (xG) e Expected Threat (xT), e usando os resultados para mostrar uma nova métrica, Threat to Goal, que tem como objetivo fornecer informações sobre a eficácia de uma equipe em utilizar sua ameaça na bola para gerar tentativas de chute de alta qualidade.
Morando em Belo Horizonte, Brasil, Leo combina seus estudos na Universidade Federal de Minas Gerais, onde está concluindo um mestrado em Ciência da Computação, com uma função de cientista de dados no Atlético Mineiro, time da Série A.
Atom Scott e Taiga Someya - FootballGPT: Avaliação contrafactual com um modelo de base para futebol
A avaliação contrafactual permite que os cientistas de dados explorem cenários hipotéticos e entendam o impacto potencial de diferentes decisões táticas no futebol. Normalmente, isso envolve o treinamento de um modelo generativo para prever os movimentos dos jogadores e, em seguida, comparar os movimentos reais e simulados com cenários específicos.
O pôster de Atom e Taiga apresentará os resultados da criação do FootballGPT, um modelo de base que se concentra no movimento coletivo no futebol. Eles buscarão responder a perguntas como: "Como uma pressão maior da linha defensiva afeta a vulnerabilidade a bolas longas?" ou "A probabilidade de marcar um gol aumentaria se mais um jogador entrasse em um contra-ataque?" Além disso, eles analisarão a capacidade do FootballGPT de generalizar para tarefas posteriores.
Ao utilizar o modelo FootballGPT como um simulador para cenários selecionados, a Atom e a Taiga pretendem capacitar as equipes a fazer avaliações e tomar decisões estratégicas com base em dados quantitativos. O simulador permitiria que as equipes simulassem os efeitos de diferentes mudanças táticas em cenários de jogos reais, como alterações na linha defensiva ou no número de jogadores envolvidos em contra-ataques, além de tornar os processos de análise de desempenho mais eficientes por meio da identificação e análise de sequências de posse de bola semelhantes em vários jogos.
Atualmente, Atom está fazendo doutorado em Inteligência Artificial na Universidade de Nagoya, no Japão, e é o fundador de uma start-up emergente voltada para a análise de esportes. Taiga está fazendo mestrado em Linguística Computacional na Universidade de Tóquio e, usando sua experiência como ex-jogador da seleção japonesa sub-15/16, também está explorando a pesquisa em análise esportiva, especialmente no futebol.
Andrew Kang, Travis Curson e Scott Powers - Nem todos os recursos são iguais: Motivação para clustering e avaliação de cluster específicos do objetivo
O agrupamento de funções de jogadores é um problema bem conhecido na análise de esportes, muitas vezes prejudicado por uma falha comum em muitas metodologias de agrupamento: a ponderação igual de todos os recursos, independentemente de sua relevância para o objetivo específico da análise.
Para identificar jogadores de diferentes equipes que são estilisticamente semelhantes em campo para aprimorar os fluxos de trabalho de recrutamento, o pôster de Andrew, Travis e Scott aplicará os dados Opta Vision para apresentar um algoritmo de agrupamento K-means recursivo de duas etapas. Esse algoritmo primeiro agrupa os estilos de função com base nas tendências dentro e fora da bola de um jogador e, em seguida, cria subagrupamentos com base nos requisitos específicos de um analista de recrutamento, como a aplicação de recursos relacionados a passes quando se busca identificar jogadores.
Para comparar a habilidade dos jogadores em cada grupo e avaliar sua contribuição para as vitórias, Andrew, Travis e Scott adaptarão o método Box Plus-Minus (BPM) usado na análise de basquete. Isso envolve o uso do Regularized Adjusted Plus-Minus (RAPM) para estimar a contribuição de cada jogador para o diferencial de gols esperados (xG) de sua equipe. Ao fazer isso, a análise destacará a importância numérica de cada habilidade em que os diferentes grupos de jogadores devem se destacar para o sucesso da equipe.
Andrew é estudante de graduação em Ciência da Computação na Rice University em Houston, Texas, onde também atua como analista de dados para o time de futebol feminino da Rice Athletics, cuja equipe de bastidores inclui Travis como treinador assistente. Elas competem na Divisão I da NCAA. Scott ingressou no Departamento de Gestão Esportiva da Rice University como professor assistente de análise esportiva em 2023.
Matthew Hilton - Beyond the Scoreboard: A Bayesian Approach to Valuing Football Players' Actions (Uma abordagem bayesiana para avaliar as ações dos jogadores de futebol)
Para analisar o desempenho de cada jogador, devemos examinar a contribuição de cada um para marcar e sofrer gols. Entretanto, como há muitas ações diferentes que um jogador pode realizar em um jogo, quais ações são mais valiosas, pois têm maior probabilidade de levar à marcação de um gol e menor probabilidade de levar a um gol sofrido?
O pôster de Matt apresenta uma nova estrutura bayesiana para a avaliação das ações dos jogadores de futebol. A estrutura é construída com base em um modelo xG bayesiano fundamentado que quantifica explicitamente a incerteza associada a cada previsão de gol em vez de se basear em estimativas pontuais. Essa estrutura pode ser ampliada para analisar todas as ações executadas pelos jogadores e como elas contribuem para a probabilidade de marcar e sofrer gols. De forma crucial, os analistas de dados podem avaliar a variação nas ações dos jogadores e sua execução.
Com um mestrado em ciência de dados, Matt trabalha atualmente para o Barclays no Reino Unido. Como parte da equipe de ciência de dados do banco, ele trabalha na modelagem financeira de seu portfólio de hipotecas.
Stats Perform gostaria de agradecer a todos que enviaram uma proposta e parabenizar os nove grupos que estarão apresentando ou expondo no Opta Forum 2024.