Ir para o conteúdo principal

Analisando as decisões dos jogadores de futebol dentro e fora da área de pênalti

Por: Stats Perform

Tendo apresentado um pôster no OptaPro Analytics Forum de 2017, Martin Eastwood fornece uma análise por escrito de seu trabalho, discutindo os processos que o sustentam, a abordagem adotada, os desafios ao longo do caminho e como ele foi recebido pelo setor de análise de futebol.

Veja o pôster de Martin aqui

Siga Martin no Twitter: @penaltyblog

 

Introdução

É o 67º minuto e o Crystal Palace está perdendo por 1 a 0 em casa para o AFC Bournemouth. Andros Townsend tem a bola fora da área e decide chutar, apesar de ter companheiros de equipe mais perto do gol para quem poderia dar o passe. A bola voa para as mãos do goleiro e a posse de bola é perdida.

Como avaliamos as decisões que os jogadores de futebol tomam durante as partidas?

Essa foi a pergunta que fiz a mim mesmo para o OptaPro Analytics Forum deste ano e a solução que encontrei foi usar o aprendizado de máquina. Para aqueles que ainda não conhecem o aprendizado de máquina, trata-se de uma forma de inteligência artificial que pode dar aos computadores a capacidade de aprender sem serem explicitamente programados. O aprendizado de máquina é a forma como os carros autônomos do Google sabem para onde ir e como o Facebook reconhece automaticamente os rostos de seus amigos em suas fotos.

A segunda parte da tarefa era como tornar esses insights acessíveis aos times de futebol. O aprendizado de máquina é um assunto bastante pesado que envolve muita matemática complexa, então como eu poderia pegar essa ideia e apresentá-la a um clube de futebol de uma forma que fosse relevante para eles?

Os dados

Comecei o trabalho com grandes visões de resolver o problema do futebol. Recentemente, o Google usou uma técnica de aprendizado de máquina conhecida como Deep Learning para vencer o campeão mundial do jogo de tabuleiro Go e eu queria aplicar os mesmos conceitos aqui. No entanto, com apenas seis semanas para concluir todas as análises e fazer uma apresentação, contive minhas ambições para um nível mais realista e decidi me concentrar apenas na avaliação das ações de ataque das equipes dentro e ao redor da área de pênalti.

Para isso, solicitei os dados de eventos Opta sobre a bola e os dados de rastreamento do ChyronHego como parte da minha proposta. Os dados Opta fornecem um conjunto de eventos com bola que ocorrem durante a partida, enquanto os dados de rastreamento óptico fornecem as coordenadas XY de todos os jogadores em campo 25 vezes por segundo.

Identificação de boas decisões

Como o objetivo era avaliar as decisões dos jogadores de futebol, eu precisava de uma maneira de determinar o que eram decisões boas e ruins. Depois de explorar algumas opções, decidi verificar se as ações dos jogadores aumentavam a probabilidade geral de gol da equipe.

Para calcular essa probabilidade de gol, criei uma rede neural com base na localização do jogador que chuta a gol e na localização de todos os jogadores adversários. Em seguida, verifiquei a precisão da previsão de gols marcados pela rede neural testando-a em um conjunto de chutes que a rede nunca tinha visto antes.

Infelizmente, os resultados foram um tanto desanimadores. A rede neural pode exigir muitos dados para ser treinada e, com apenas um conjunto limitado de partidas para construir o modelo, simplesmente não havia dados suficientes para a rede convergir totalmente. Tentei simplificar o modelo incluindo apenas as localizações dos defensores e do goleiro adversários, mas isso não melhorou muito as coisas.

Eu precisava ajudar um pouco a rede a identificar as informações relevantes nos dados, por isso adicionei vários recursos extras, incluindo as tesselações de Voronoi dos jogadores, em vez de confiar apenas nas coordenadas XY brutas.

As tesselações de Voronoi são formas desenhadas ao redor de cada jogador, marcando a área que está mais próxima do jogador do que de qualquer outro jogador (veja o exemplo na Figura 1 abaixo).

Quanto maior for a área do Voronoi de um jogador, maior será a quantidade de espaço que ele terá ao seu redor e menor será a pressão que ele provavelmente sofrerá da oposição. Esse recurso adicional de engenharia fez maravilhas e a precisão da rede neural melhorou consideravelmente.

Figura 1: Exemplo de tesselações de Voronoi mostrando a quantidade de espaço ao redor de cada jogador

Interpretabilidade

Embora as redes neurais sejam excelentes em muitas coisas, uma de suas desvantagens é que elas são difíceis de interpretar, pois são essencialmente caixas pretas. Você alimenta seus dados em uma extremidade e obtém um resultado na outra, mas não sabe realmente como ou por que a rede chegou à resposta que obteve.

Eu queria poder discutir os resultados com os times de futebol e, por experiência própria, pode ser necessário um salto de fé para que pessoas sem formação matemática confiem em algoritmos de caixa preta, por isso também criei um modelo mais simples com base em uma regressão logística.

Embora a precisão da regressão não tenha sido igual à da rede neural, ela criou um conjunto de coeficientes que poderia ser usado para ajudar a explicar cada resultado. Por exemplo, se um jogador tivesse apenas 5% de chance de marcar, eu poderia mostrar a um técnico exatamente quanto dessa chance se devia à localização do jogador no campo, seu ângulo em relação ao gol, quantos defensores estavam ao seu redor, quão pequena era sua área de Voronoi e assim por diante.

Depois de deixar meu computador analisando os dados por alguns dias, finalmente consegui mostrar o impacto de cada evento na probabilidade de pontuação de uma equipe e explicar por que cada ação estava tendo um efeito positivo ou negativo.

Apresentação dos dados

O principal resultado que eu queria apresentar era como as ações dos jogadores estavam afetando a chance de a equipe marcar um gol. Para isso, criei um aplicativo da Web que animava os dados de rastreamento em tempo real (consulte o final do artigo para obter mais detalhes).

Em seguida, identifiquei qual equipe estava atacando e sobrepus a probabilidade de o jogador com a bola marcar um gol a partir de sua localização atual, bem como a probabilidade de o jogador passar com sucesso para um membro da equipe e, em vez disso, ele chutar e marcar um gol.

A Figura 2 mostra um exemplo de captura de tela em que o jogador com a bola tem apenas 2% de chance de marcar um gol se chutar de seu local atual. O mesmo jogador também tem 7% de chance de passar com sucesso para um companheiro de equipe próximo e, em vez disso, ele chutar e marcar.

Se você assistir ao vídeo desse exemplo de volta, o passe é claramente a melhor opção, mas temos o benefício adicional de poder quantificar exatamente o quanto essa decisão é melhor em termos de marcar um gol.

Em seguida, é possível agregar essas decisões em um período mais longo para ver como as decisões de cada jogador estão afetando a equipe.

Figura 2: Exemplo de probabilidades de metas

O exemplo acima presume que os jogadores normalmente procuram chutar ou passar diretamente para um companheiro de equipe enquanto atacam, mas nem sempre é esse o caso. Muitas vezes, os jogadores procuram mover a bola para o espaço para um companheiro de equipe correr. Para levar isso em conta, acrescentei a porcentagem cumulativa de chance de gol, que é o valor mostrado no canto inferior esquerdo da Figura 2.

Essa métrica combina todas as porcentagens individuais dos jogadores em um único número para que você possa ver se o movimento e a forma da equipe estão tendo um impacto positivo ou negativo na probabilidade geral de marcar gols. O uso de uma porcentagem cumulativa aqui não é estritamente preciso, já que apenas um desses jogadores realmente consegue chutar a gol, mas achei que é um indicador útil da ameaça geral de gol de uma equipe e o conceito pareceu agradar muito aos analistas a quem mostrei isso.

Feedback

Tive a sorte de ter a oportunidade de discutir o trabalho em detalhes com vários técnicos e analistas de equipes profissionais e o feedback foi extremamente positivo. Os treinadores de times juvenis, em particular, acharam que o aplicativo seria uma ótima maneira de ensinar às crianças o que fazer em situações específicas, pois eles poderiam observar a mudança das porcentagens em tempo real à medida que os jogadores corressem, cruzassem a bola etc.

Na verdade, todo o aspecto interativo do aplicativo pareceu funcionar muito bem. Em vez de ser um gráfico estático ou uma planilha de números, a possibilidade de assistir aos jogadores correndo e ver como isso afetava a chance de o time marcar um gol realmente pareceu atrair as pessoas e chamar sua atenção. Durante todo o dia, houve um fluxo constante de pessoas brincando com o aplicativo e pulando as imagens para explorar os efeitos de diferentes tipos de eventos.

Próximas etapas

Tive pouco tempo para desenvolver o aplicativo a tempo para o Forum OptaPro e houve um monte de ideias que não tive a chance de implementar. Uma área que estava no topo da minha lista de tarefas era verificar se tudo poderia ser invertido para quantificar a defesa em vez de apenas o ataque, por exemplo, verificando se os defensores estão conseguindo orientar os atacantes para locais menos perigosos, se estão rompendo a linha defensiva e assim por diante.

Eu também estava ansioso para tentar sobrepor os dados ao vídeo. A forma como os dados são apresentados pode precisar de alguns ajustes, mas há potencial para um envolvimento ainda maior quando os usuários podem ver os jogadores no vídeo, em vez de apenas os gráficos bidimensionais simples que desenhei para as animações.

Finalmente...

Fiz um vídeo rápido mostrando as probabilidades de gol e algumas das outras sobreposições que podem ser adicionadas aos dados de rastreamento aqui para quem quiser ver o aplicativo em ação.