Ir para o conteúdo principal

Usando a ciência de rede para quantificar a identificação de times de futebol

 

Em um blog convidado para a Stats Perform, Javier Buldú e David Garrido apresentam suas descobertas de um projeto de pesquisa que aplicou dados de eventos da temporada 2017/18 da LaLiga, com o objetivo de estabelecer o quanto uma equipe mantém seu estilo de jogo ao longo de uma temporada.

 

Por: Stats Perform

Javier Buldú e David Garrido exibiram uma apresentação de pôster no Forum OptaPro 2020, que introduziu uma abordagem de Ciência de Rede para quantificar como o estilo de jogo de uma equipe é mantido ao longo de uma temporada, com base na persistência dos padrões de passe, usando dados Opta .

Neste blog de convidados, eles descrevem a metodologia por trás de sua apresentação, juntamente com um resumo das principais conclusões.

Clique aqui para ver seu pôster.

Apresentando os times de futebol como sistemas complexos

"Um sistema complexo é um sistema composto de muitos componentes que podem interagir entre si. Sistemas complexos são sistemas cujo comportamento é intrinsecamente difícil de modelar devido às dependências, competições, relacionamentos ou outros tipos de interações entre suas partes ou entre um determinado sistema e seu ambiente"

O cérebro, o clima da Terra e os ecossistemas são exemplos óbvios de sistemas complexos. Nós também argumentaríamos que o futebol tem um forte argumento para ser categorizado dessa forma.

Por quê?

Bem, durante uma partida de futebol, vinte e dois componentes, chamados de jogadores, interagem entre si de forma complexa, criando dependências, competindo e, o que é mais importante, gerando propriedades emergentes, como "padrões de jogo". Por esses motivos, as ciências da complexidade são uma alternativa viável para analisar conjuntos de dados de futebol, introduzindo novas perspectivas na análise do belo jogo.

As razões para isso estão na natureza complexa do futebol, que, parafraseando o paradigma fundamental das ciências da complexidade, "não pode ser analisado observando seus componentes individualmente (ou seja, os jogadores), mas, ao contrário, considerando o sistema como um todo". Até mesmo o jogador mais bem-sucedido em uma partida reconhece que "não sou só eu, é a equipe".

Traduzir a atividade da equipe em uma rede complexa é uma das muitas abordagens baseadas nas ciências da complexidade. A organização de uma equipe pode ser analisada considerando a interação entre seus jogadores por meio de passes. Podemos construir redes de passes, que contêm informações sobre como a bola foi movimentada, de jogador para jogador, durante toda a partida.

As redes de passagem são "redes complexas" por dois motivos principais:

1. Eles são compostos de nós (jogadores) e links (passagens) entre eles;

2. A interação entre os nós segue certas regras "complexas".

Além disso, essas redes não são fáceis de analisar, pois são direcionadas (ou seja, os vínculos entre os jogadores têm uma determinada direção), ponderadas (o peso dos vínculos é o número de passes entre os jogadores), espacialmente incorporadas (ou seja, a posição euclidiana da bola e dos jogadores é altamente relevante) e com evolução temporal (ou seja, a rede muda continuamente sua estrutura).

A Figura 1 abaixo mostra um exemplo da rede de passes do Real Madrid durante uma partida contra o Barcelona na temporada 2017/18. No gráfico, os tamanhos dos jogadores são proporcionais à sua importância na rede de passes. Os jogadores são colocados na posição média de onde seus passes foram feitos. As larguras dos links são proporcionais ao número de passes entre dois jogadores. Por fim, as substituições são destacadas em verde.

A partir desse gráfico, podemos ter uma ideia rápida de como o Real Madrid jogou, como ocupou o campo, como seus jogadores interagiram entre si e como a organização mudou após as substituições.

Figura 1: Uma ilustração esquemática de uma rede de passes, Real Madrid vs. Barcelona, temporada 2017/2018.

Esse é apenas um instantâneo de como a tradução da atividade da equipe em uma rede pode nos ajudar a entender a organização da equipe. Uma diversidade de métricas pode ser extraída da estrutura da rede em diferentes escalas espaciais e temporais, levando a uma melhor compreensão de como uma equipe é organizada e como os jogadores contribuem para o desempenho da equipe (Buldú et al., 2018).

Essa é uma tarefa da Ciência de Redes, o ramo das ciências da complexidade que analisa as estruturas e a dinâmica das redes. A ciência das redes ainda não foi totalmente adaptada para a análise de dados no futebol, mas tem o potencial de oferecer novas perspectivas sobre o desempenho nos próximos anos.

Redes de passes de arremesso

Há outras maneiras de criar redes de passes. Se estivermos mais preocupados com a organização espacial de uma equipe, e não com a função dos jogadores, podemos construir e analisar redes de passes de campo. Nesse caso, os nós da rede não são específicos do jogador, mas de regiões específicas do campo, que são conectadas por meio de passes feitos pelos jogadores que as ocupam.

A Figura 2 mostra exemplos das redes de passes de campo do Barcelona contra o Real Madrid.

Figura 2: Os gráficos, da esquerda para a direita, são as redes de passes 3×3, 5×6 e 10×10 do Barcelona, em que os nós são regiões do campo e os links representam o número de passes entre eles.

Por que traçamos três redes em vez de uma? O motivo é que o campo pode ser dividido em áreas de diferentes tamanhos, o que resulta em redes de campo de diferentes escalas. Dessa forma, as três redes da Figura 2 correspondem ao mesmo time durante a mesma partida, e a única diferença é o tamanho das partições. No entanto, observe que a estrutura da rede é diferente dependendo do número de divisões, indicando que é necessário analisar as propriedades da rede em diferentes escalas.

A capacidade de identificação dos times de futebol

Agora que definimos a estrutura, é hora de fazer as perguntas:

  • É possível quantificar até que ponto uma equipe tem um estilo de jogo definido?
  • Que equipes se adaptam ao adversário e que equipes permanecem fiéis ao seu estilo?
  • Podemos quantificar quais equipes impõem seu estilo a um adversário durante uma partida?
  • Quais equipes se comportam de maneira diferente quando jogam fora de casa?

Para responder a todas essas perguntas, aplicamos a Network Science para analisar a organização das redes de passagem de arremessos.

Usando os dados de eventos de uma partida, construímos as redes de passagem em várias escalas associadas a cada equipe e analisamos suas estruturas usando diferentes metodologias provenientes da ciência de redes.

Dessa forma, conseguimos identificar:

  • Quais equipes impuseram seu estilo de jogo sobre seus adversários;
  • O que esperar de seus adversários antes de uma partida;
  • Como avaliar se uma equipe jogou de acordo com o que era esperado.

Nossa única fonte de informações foi a maneira como cada equipe passou a bola, desconsiderando o número de chutes, gols, desarmes, dribles ou qualquer outra ação. No entanto, como veremos, os padrões de passe ainda são capazes de captar a essência da organização de uma equipe.

Dividimos o campo em n x m regiões (com n =1,2,3,...10 e m =1,2,3,...10) e construímos as redes de passagem do campo, em que os nós correspondiam às N=(nxm) regiões do campo e aij representava o número de passagens da região i para a região j.

Analisamos, durante toda a temporada, as propriedades das matrizes de conectividade resultantes A{aij} em diferentes escalas espaciais. Os elementos das matrizes de conectividade são o número de passes entre as regiões do campo, ou seja, a abstração matemática dos padrões de passes de cada equipe. Calculamos o parâmetro de consistência (C) de cada equipe quantificando a semelhança entre as matrizes de conectividade de uma determinada equipe durante a temporada.

Em resumo, as equipes com alta consistência mantiveram a estrutura de suas redes de passes durante toda a temporada, enquanto as equipes com baixa consistência mudaram sua organização de jogo para jogo.

Em seguida, quantificamos a exclusividade das redes de passes de campo de cada equipe. Isso pode ser feito comparando a estrutura das redes de passes de uma determinada equipe com as do restante das equipes na competição. Chamamos esse parâmetro de similaridade rival R. Por fim, definimos o parâmetro de identificabilidade (I) de uma equipe como o parâmetro de consistência C menos a similaridade rival R, ou seja, I=C-R.

As equipes com um alto parâmetro de identificabilidade são aquelas que são consistentes e, ao mesmo tempo, diferentes das demais.

Nossa metodologia tem aplicações descritivas e prospectivas. Por um lado, conseguimos identificar quais equipes mantiveram seu estilo de jogo ("alta identificabilidade") durante toda a temporada e aquelas que, ao contrário, não tinham um estilo consistente ("baixa identificabilidade").

Em colaboração com a LaLiga, calculamos o parâmetro de identificabilidade das equipes da primeira divisão espanhola de 2017/18.

A Figura 3 mostra os valores da identificabilidade do Barcelona e do Málaga, as equipes que terminaram no topo e na base da tabela, respectivamente. No eixo horizontal, plotamos o número de nós em que a medula é dividida, pois, como explicamos, todas as escalas devem ser analisadas. Curiosamente, observamos como as divisões de campo de cerca de 50 áreas (nós) foram as que levaram a uma melhor identificação do estilo de jogo do Barcelona. Com relação ao Málaga, podemos ver como sua capacidade de identificação foi bastante baixa em todas as escalas.

Figura 3: O gráfico à esquerda mostra o parâmetro de identificabilidade do Barcelona, com base no número de divisões (nós) do campo. À direita, a mesma análise é exibida para o Málaga.

Aplicativo

Fundamentalmente, essas informações podem ajudar as equipes de treinamento a se prepararem para uma partida, identificando a abordagem esperada de seus adversários.

Por exemplo, é possível que uma equipe avalie a identificabilidade de seu próximo oponente e decida se deve ou não adaptar sua própria abordagem com base no estilo de jogo do adversário (quando a equipe adversária tem alta identificabilidade) ou tentar impor seu próprio estilo a ela (no caso de enfrentar uma equipe com baixa identificabilidade).

Também podemos usar a identificabilidade para quantificar, para cada partida, qual equipe jogou de forma mais semelhante ao seu próprio estilo.

A Tabela 1 mostra a diferença de identificabilidade partida a partida entre os times da casa e da casa durante a temporada 2017/2018 da LaLiga.

As partidas em que o time da casa, listado no eixo vertical, impôs seu próprio estilo de jogo (ou seja, teve maior identificabilidade) estão destacadas em amarelo, enquanto as células verdes correspondem aos times visitantes que impuseram seus estilos. As equipes foram ordenadas com base na classificação final da liga, com o objetivo de mostrar a conexão entre a identificabilidade e o desempenho de uma equipe. As células amarelas aparecem principalmente acima da linha diagonal da matriz, indicando que, quando duas equipes jogam, a que está classificada em uma posição mais alta tem maior probabilidade de impor seu próprio estilo de jogo.

Se destacarmos equipes individuais, veremos que o Barcelona venceu a "disputa de identificabilidade" em mais partidas, tanto em casa quanto fora, seguido de perto pelo Real Madrid. Entretanto, vale ressaltar que as diferenças na identificabilidade nem sempre são um indicador do resultado da partida, pois há algumas partidas em que a identificabilidade foi maior para a equipe que perdeu a partida. Essa é a natureza do futebol, em que jogar do seu jeito nem sempre garante o sucesso.

Tabela 1: Os times da casa estão listados no eixo vertical, organizados por sua posição final na liga. Os times visitantes estão no eixo horizontal, organizados da mesma forma. O resultado da partida é exibido dentro de cada célula. Em amarelo, o time da casa impôs seu estilo; em verde, o time visitante. As células em azul correspondem a partidas em que não houve diferença clara entre a identificabilidade de ambas as equipes.

Para concluir, também vale a pena destacar que é possível obter uma estimativa em tempo real do parâmetro de identificabilidade enquanto o jogo está ocorrendo, destacando quando uma equipe ou seu adversário está jogando conforme o esperado. Essa é uma informação valiosa, que poderia informar a tomada de decisões importantes durante o jogo a partir do banco de reservas.

Outras aplicações dessa metodologia também permitiriam aos analistas a oportunidade de avaliar quais equipes se comportam de forma diferente quando jogam em casa ou fora, ou identificar as regiões do campo onde ocorrem desvios dos padrões de passe esperados de uma equipe durante um jogo.


Referências

Buldú, J. M., Busquets, J., Martínez, J. H., Herrera-Diestra, J. L., Echegoyen, I., Galeano, J., & Luque, J. (2018). Usando a ciência da rede para analisar redes de passes de futebol: dinâmica, espaço, tempo e a natureza multicamada do jogo. Fronteiras em Psicologia, 9, 1900.

Buldú, J. M., Busquets, J., & Echegoyen, I., & F. Seirul.lo (2019). Definindo um time de futebol histórico: Using Network Science to analyze Guardiola's FC Barcelona. Nature Scientific Reports, 9(1), 1-14.


Com doutorado em Física Aplicada, Javier Buldú é coordenador do Grupo de Sistemas Complexos da Universidade Rei Juan Carlos, em Madri, além de ser o pesquisador principal do Laboratório de Redes Biológicas do Centro de Tecnologia Biomédica.

Ele pode ser contatado por e-mail em: javier.buldu@urjc.es

David Garrido é estudante de doutorado no Center for Biomedical Technology & King Juan Carlos University, Madri, Espanha.