Ir para o conteúdo principal

Apresentando o Role Discovery: Geração de funções orientadas por dados no futebol profissional de elite

 

Ao definir funções no modelo de jogo de um clube, os analistas de recrutamento podem comparar diretamente os jogadores que se encaixam nos parâmetros de cada função de forma mais objetiva. Neste artigo, Stats Perform descreve como os modelos AI, alimentados por dados de eventos, podem detectar automaticamente as funções em campo dos jogadores que competem nas principais competições do mundo.

 

Por: Andy Cooper

Uma abordagem diferente para o escotismo técnico

Durante a última década, o processo de um departamento de olheiros para identificar, monitorar e avaliar os prospectos de recrutamento evoluiu continuamente à medida que novas tecnologias, alimentadas por vídeo e dados, se tornaram disponíveis.

No entanto, isso resultou em alguma mudança perceptível na forma como o clube realmente define seus critérios de avaliação dos jogadores? Dentro dos departamentos, os KPIs posicionais terão sido definidos com base no modelo de jogo, que é medido em relação aos resultados de desempenho de um jogador. Os KPIs também podem ser aplicados a modelos específicos de posição para que os olheiros avaliem subjetivamente os jogadores, acrescentando uma camada adicional de contexto.

No entanto, embora esses processos sejam, sem dúvida, mais focados e rigorosos em comparação com os de 10 anos atrás, há uma questão importante que não foi abordada adequadamente: qual é a confiabilidade de avaliar os jogadores com base nos KPIs de uma posição específica?

Atualmente, os jogadores e suas posições continuam a ser rotulados da mesma forma que eram há 25 anos: lateral, zagueiro, centroavante e assim por diante. No entanto, quando se comparam os prospectos de recrutamento que jogam em clubes diferentes na mesma "posição", muitos possuem qualidades fundamentalmente diferentes, o que dificulta a avaliação objetiva em relação aos mesmos KPIs.

É aqui que entra o novo conceito de descoberta de função do Stats Perform. O Role Discovery é um novo método de avaliação de jogadores, criado pela nossa equipe deAI , que aborda as limitações da avaliação de jogadores com base na posição. Em vez disso, ele se concentra em traçar o perfil dos jogadores com base em sua função em uma equipe.

Por meio da aplicação de processos de aprendizagem não supervisionados, o Role Discovery permite que os analistas de recrutamento avaliem os jogadores dentro de um estilo de equipe mais amplo: agrupando os candidatos com base nas principais tendências e características necessárias para desempenhar cada função dentro de um modelo de jogo.

Neste artigo, vamos analisar alguns dos principais componentes por trás do Role Discovery, que permitirá que os clubes considerem uma nova abordagem para o scouting técnico no próximo ano.

Etapa 1: Identificação das tendências espaciais de cada jogador, no contexto do estilo de jogo

No total, o Role Discovery detecta 18 tipos diferentes de funções em todo o campo, trabalhando com 29 grupos de jogadores diferentes. O ponto de partida para a detecção de funções é identificar o local mais comum de início e fim dos passes de um jogador, para gerar mapas de calor espaciais.

O gráfico abaixo mostra as três áreas mais comuns do campo onde dois centroavantes, Robert Lewandowski e Roberto Firmino, deram seus passes durante a temporada 2018/19.

Embora ambos os jogadores sejam rotulados como centroavantes, fica claro nesses mapas de calor que os dois jogadores desempenharam funções diferentes em seus respectivos clubes. A localização mais comum dos passes de Lewandowski foram as áreas centrais ao redor da borda e dentro da área. Em contraste, Firmino jogou muitas bolas do meio espaço dentro do canal direito.

No entanto, essas informações, por si só, fornecem uma visão limitada e não têm nenhum contexto de situações de jogo. Portanto, ao aplicar a estrutura do Stats Perform Playing Styles aos toques de um jogador, podemos começar a entender como cada jogador influencia uma fase específica do jogo.

Isso destaca outras diferenças de estilo entre Lewandowski e Firmino. Os gráficos abaixo mostram o conjunto de toques de bola de cada jogador quando sua equipe está envolvida em um estilo específico, em comparação com outros jogadores nas cinco principais ligas.

Em comparação com a média, o cluster de Firmino está mais envolvido na fase de contra-ataque e também aparece fortemente na fase de ameaça sustentada. O cluster de Lewandowski está abaixo da média em Ameaça sustentada, indicando que sua função não está tão envolvida nas sequências de posse de bola da equipe no terço ofensivo em comparação com outras funções.

Etapa 2: Quantificação da qualidade das contribuições de um jogador com a posse de bola

Depois de estabelecer as áreas do campo em que um jogador mais frequentemente fica com a bola e sua contribuição para Estilos de Jogo específicos, o Role Discovery aplica a Estrutura de Valor de Posse (PV) do Stats Performpara determinar como o envolvimento de um jogador durante as sequências de posse de bola aumenta a probabilidade de gol da equipe durante os próximos dez segundos de jogo.

O valor da posse de bola atribui crédito aos jogadores com base em contribuições positivas e negativas, abrangendo os principais eventos com bola, incluindo passes, dribles e cruzamentos, bem como ações defensivas, como desarmes e interceptações.

A tabela abaixo lista os jogadores que registraram a maior produção de PV+ por 90 para o Liverpool na temporada 2018/19 da Premier League, destacando as contribuições progressivas de Mo Salah, Andrew Robertson e Firmino no aumento da probabilidade de gol.

Outra nova métrica aplicada para analisar o uso da bola por um jogador é a Expected Pass Completion (xP). Esse modelo leva em conta vários fatores, inclusive a distância e o ângulo de um passe e outros elementos contextuais de uma jogada de posse de bola, para estabelecer a probabilidade de um passe ser concluído.

Ao aplicar essa métrica, podemos obter uma melhor compreensão das tendências de um jogador com posse de bola - para identificar quais jogadores tentam e concluem uma alta proporção de passes de penetração que, de uma perspectiva de probabilidade, são mais difíceis de concluir.

Para incorporar esses dados ao modelo Role Discovery, dividimos o campo em diferentes zonas para destacar o local e a taxa de conclusão de xP de um jogador em cada zona, a fim de estabelecer onde eles estão fazendo contribuições importantes para a equipe.

Combinando PV e xP, podemos avaliar a recompensa em potencial de um jogador que faz um passe, comparando-a com o risco em potencial e comparando seu desempenho com o de outros jogadores.

Voltando à nossa comparação entre Lewandowski e Firmino, o gráfico abaixo mostra o desempenho de cada jogador ao fazer passes para uma zona central do meio-campo ofensivo durante 2018/19.

A taxa de conclusão de xP de Firmino acima de 0,75 indica que ele faz passes seguros e de alta probabilidade para essa zona. Ao mesmo tempo, ele também está aumentando a probabilidade de sua equipe marcar gols, pois está no percentil 10% superior de PV progressivo.

Lewandowski, por ser um tipo diferente de atacante, está mais próximo da média para a taxa de conclusão de xP e está no percentil 10% inferior para PV, reforçando o fato de que ele está envolvido em menos cadeias de posse de bola e é mais provável que dê muitos chutes a gol, tornando-o o último jogador em uma cadeia. No entanto, isso não conta a história completa, sobre a qual falaremos mais adiante neste artigo.

Etapa 3: Estabelecer como um jogador está envolvido nas sequências de posse de bola

Para identificar ainda mais como um jogador interage com seus companheiros de equipe, o Role Discovery incorpora outro novo modelo, o Movement Chains, que identifica os padrões de passes mais comuns de uma equipe que geram o maior PV em campo.

As cadeias de movimento são rotuladas com base em motivos de passe que compreendem quatro passes, o que pode ajudar a identificar como uma equipe avança com a bola e os jogadores envolvidos.

Assim como no xP, para analisar as Cadeias de Movimento, dividimos o campo em zonas, de modo que possamos identificar os padrões mais frequentes, usando agrupamento, de como uma equipe move a bola de uma zona para outra. Conforme ilustrado abaixo, a zona inicial poderia ser a área central do terço defensivo, com a zona final sendo a borda da área adversária.

As Cadeias de Movimento também podem ser aplicadas no contexto de Estilos de Jogo, para identificar como as equipes movimentam a bola quando estão envolvidas em um estilo específico. O exemplo abaixo mostra as cadeias mais perigosas do Liverpool durante 2018/19 que terminaram na área de pênalti adversária quando o time estava envolvido em Build-Up, destacando como ele joga pelos canais internos direito e esquerdo para penetrar na área.

Etapa 4: Aplicação de cada modelo para criar funções

Para identificar o envolvimento de um jogador individual nas cadeias de posse de bola de sua equipe, aplicamos um modelo Chain2Vec, inspirado no Word2Vec, para identificar os grupos de cadeias em que um jogador aparece com frequência, seu contexto e como o jogador interage em um único motivo de passe. Essa modelagem avançada por meio de técnicas de aprendizagem profunda fornece uma representação compacta do envolvimento do jogador e da equipe.

Além disso, os mapas de toque do jogador são aplicados para fornecer informações sobre o contexto espacial de cada jogador, bem como os modelos de estilo de jogo, xP e PV. Além disso, é incluído um detalhamento do tipo de chutes em jogo aberto que um jogador faz e sua localização.

Todos esses resultados são então aplicados ao modelo final de descoberta de função, usando um algoritmo de agrupamento, o Gaussian Mixture Model, para aprender agrupamentos e separar os jogadores em grupos distintos. A partir desses agrupamentos, podemos usar descrições orientadas por dados para condensar mais de 400 descritores individuais de jogadores em 18 funções distintas no campo.

Essas funções são rotuladas da seguinte forma (clique para ampliar):

Voltando a Lewandowski e Firmino, tendo estabelecido que cada jogador se encaixa em uma função diferente, podemos agora compará-los a jogadores em suas respectivas funções, em vez de fazer comparações diretas.

O gráfico abaixo exibe a mesma comparação de passes que usamos anteriormente, mas desta vez isolamos os jogadores em suas respectivas funções, que estão destacadas em laranja.

No caso de Firmino, quando comparado a todos os jogadores das cinco principais ligas, ele está no décimo percentil superior em relação à taxa de conclusão de xP, mas quando comparado apenas a outros jogadores de "Ameaça criativa de ataque", ele está muito mais próximo da média.

Com Lewandowski, quando comparado apenas com outros "atacantes avançados", podemos ver que seus passes são muito mais seguros em comparação com a média e, embora sua contribuição de PV progressivo ainda esteja abaixo da média, os números não são tão extremos quanto quando comparados com todos os jogadores.

Conclusão: Tornando as comparações de jogadores mais objetivas

Ao definir funções, os analistas de recrutamento podem aplicar o Role Discovery para comparar diretamente os jogadores que se encaixam nos parâmetros de cada função de forma mais objetiva. Isso pode agilizar o processo de prospecção para garantir que os jogadores, que atuam na mesma posição no campo, não sejam avaliados como iguais, mas sim analisados no contexto da função que desempenham.

Os elementos que compõem o modelo englobam quatro considerações fundamentais sobre recrutamento:

  • Onde um jogador atua no campo? - Pegada espacial
  • Quando eles fazem suas principais contribuições? - Envolvimento com os estilos de jogo
  • Qual é o perfil de risco-recompensa e a qualidade de suas principais contribuições, em comparação com outras pessoas na mesma função? - xP e resultados progressivos de PV
  • Em que tipos de movimentos de passe um jogador está envolvido? - Envolvimento na cadeia de movimentos

Além disso, o Role Discovery também pode ser usado como um auxílio para identificar jogadores que possuem os principais atributos para uma função ou posição diferente daquela em que jogam atualmente no clube. Isso ajudaria os analistas a identificar jogadores como um jovem Gareth Bale ou Philipp Lahm, exemplos de jogadores que evoluíram de laterais no início de suas carreiras para funções mais altas no campo.

Os estudos de caso, que fornecem exemplos de como a descoberta de função pode ser aplicada para identificar substitutos para uma função específica, serão publicados no site da Stats Perform ainda este ano, juntamente com alguns exemplos de análises derivadas de modelos que potencializam o conceito, incluindo xP e Movement Chains.

Se quiser saber mais sobre o Role Discovery ou tiver alguma dúvida em relação ao que desenvolvemos até agora, entre em contato conosco aqui.