Ir para o conteúdo principal

Introdução de uma estrutura de posses

Por: Stats Perform

Ao longo do último ano de trabalho de análise de futebol, houve uma ampla mudança da aplicação de métricas que giravam em torno de eventos únicos na bola para uma abordagem mais holística, analisando sequências de eventos que constituem um período de posse de bola.

Essa abordagem pode, muitas vezes, fornecer o contexto adicional que, às vezes, não existe nas métricas de evento único. Considere os gols esperados (xG). Ele reconhece chutes e características anteriores, como a localização do campo e o ângulo em relação ao gol, e estima a probabilidade de o chute resultar em um gol. A incorporação do tipo de assistência no modelo xG também é comum.

A inclusão de assistências é uma extensão lógica do pensamento sobre o que constitui uma boa chance, e você poderia estender isso ainda mais, considerando as segundas assistências ou outros tipos de eventos (dribles) que precedem um chute. Métricas de evento único como essa geralmente pedem uma estrutura de contextualização, que é onde um modelo de posse de bola se encaixa.

Assista ao nosso vídeo explicativo abaixo:

Eventos em sequência

No passado, escrevemos sobre a combinação de eventos para redefinir posses, mas desde então formalizamos essa estrutura em um modelo a partir do qual várias estatísticas úteis e novas podem ser obtidas nos níveis de jogador, equipe e evento. Muitos profissionais de análise de futebol também demonstraram ideias e algoritmos semelhantes.

Os detalhes do modelo de posses Opta são semelhantes ao que o artigo acima, de 2012, descreve, mas os eventos são organizados em sequências e posses.

As sequências são definidas como passagens de jogo que pertencem a uma equipe e são encerradas por ações defensivas, interrupções de jogo ou um chute.

As posses são definidas como uma ou mais sequências seguidas pertencentes à mesma equipe. Uma série de passes que leva a um chute que é defendido e resulta em uma cobrança de escanteio incluiria uma posse, já que a mesma equipe mantém o controle, mas mais de uma sequência, já que a bola saiu de jogo. Uma posse de bola é encerrada quando o adversário obtém o controle da bola.

Vale a pena observar alguns recursos importantes desse modelo:

- Nem todo evento pertence a uma sequência ou posse de bola
- Da mesma forma, nem todos os segundos de uma partida em que a bola está em jogo são marcados como pertencentes a uma determinada equipe
- Uma sequência começa com um jogador fazendo uma ação controlada sobre a bola. Isso inclui passes, mas não eventos defensivos, como tackles e interceptações, a menos que esses eventos sejam seguidos por uma ação controlada, como um passe ou drible.
- O número de posses de bola pertencentes a cada equipe só pode diferir em um em uma determinada partida. Isso pode parecer contraintuitivo em relação à noção tradicional de porcentagem de posse de bola, mas é logicamente consistente ao contar as posses individuais que, se uma equipe termina a posse de bola, a outra equipe começa uma posse de bola
- No entanto, tanto o tempo de posse de cada equipe quanto o número de sequências dentro das posses de uma determinada equipe não precisam ser iguais

Considere este exemplo de sequência (neste caso, também uma posse de bola), em que o Liverpool começa com um passe de cabeça (em verde) de Joel Matip e termina com um chute na trave (seta verde).

 

A sequência acima nos diz onde e que tipo de evento recuperou a bola para o Liverpool antes do chute. Também sabemos que decorreram cerca de 14,5 segundos entre a recuperação da bola e o chute, e que a sequência traçada entre todos os eventos percorreu 126,44 metros, 55,96 metros se considerarmos apenas a distância percorrida diretamente para o campo.

Nessa sequência, também podemos identificar o número de passes na preparação para esse chute.

Tendências de posses

O histograma abaixo mostra a distribuição básica do número de posses de bola por jogo e a frequência com que ocorrem diferentes números de posses de bola. As partidas normalmente têm um pouco menos de 200 posses de bola por jogo, ou 90-100 por equipe.

 

 

O gráfico abaixo mostra a distribuição das durações das sequências em todas as sequências da temporada 2016-17 da Premier League. Como você pode ver, muitas sequências são curtas e são interrompidas antes de cobrir muito terreno, e a tendência geral é que a frequência diminua para comprimentos totais cada vez mais longos.

 

 

Velocidade direta

Um exemplo de estatística que pode ser calculada a partir de uma sequência é a velocidade direta. Definimos isso como o número de metros que a bola percorre (ao medir diretamente para cima do campo), dividido pelo tempo total da sequência.

Com relação à sequência anterior do Liverpool, a velocidade direta seria de 3,85 metros por segundo (55,96 metros divididos por 14,5 segundos). Ao comparar com outras, verifica-se que essa é uma sequência relativamente rápida. Novamente, isso é mais relevante no nível da sequência do que no nível das posses de bola, já que as interrupções nas posses de bola tornam as métricas de velocidade menos significativas.

Abaixo, você pode ver a velocidade direta média das sequências de jogo aberto para os times da Premier League em 2016/17. É interessante observar que isso capta alguns elementos de estilo não necessariamente correlacionados com resultados bem-sucedidos, como evidenciado pelo fato de o Arsenal aparecer entre o Stoke City e o Leicester, enquanto o Manchester United está mais próximo do Hull e do Bournemouth.

 

 

Introdução de aplicativos táticos

A estrutura de posses pode responder a muitas perguntas que um analista ou técnico pode fazer e que as métricas de evento único muitas vezes têm dificuldade de encapsular. Especificamente, ela pode fornecer respostas a perguntas que tratam de como os padrões e as ações ocorrem em sucessão.

Para obter um exemplo mais detalhado, considere como a direcionalidade de uma equipe muda dependendo de dois fatores: onde eles recuperam a bola e se estão jogando de forma ampla ou centralizada.

Para responder a essa pergunta, é necessário ter o local de início e uma noção de largura como características das sequências. O agrupamento de sequências com base em seu local de início (metade própria versus metade adversária) atende ao primeiro objetivo. Para categorizar a largura, defini as sequências como amplas ou centrais, considerando se a maior parte do progresso para cima do campo ocorreu no canal central ou em um dos canais amplos mostrados abaixo.

O Chelsea não se destaca inicialmente em relação à velocidade direta. No entanto, considerando divisões específicas com base no local de início e na largura da posse de bola, podemos destacar que eles se classificam entre os três primeiros na Premier League de 2016-17 por essa métrica ao recuperar a bola em seu próprio campo e progredir centralmente (2,47 m/s, em comparação com 1,93 m/s ao progredir centralmente a partir de seu próprio campo).

É claro que esse é um exemplo um tanto particular, mas é uma boa demonstração de como o contexto fornecido por vários eventos pode permitir que abordagens estatísticas respondam a perguntas que, às vezes, são difíceis de responder com métricas de um único evento. Um exemplo semelhante também foi adotado por Will Gürpinar-Morgan em sua apresentação no OptaPro Analytics Forum de 2017.

Ao aplicar dados de eventos para analisar o jogo, essa estrutura de estilo de posse - que agora está se tornando comum - pode ajudar significativamente esse estilo de trabalho, oferecendo uma plataforma para obter uma compreensão mais informada da abordagem estilística geral de um jogador, equipe ou liga.

 

Em nome da OptaPro, gostaria de aproveitar esta oportunidade para agradecer a Michael Caley, Garry Gelade, Sam Green e Ian Graham por suas ideias e comentários sobre este modelo.