Mark Carey e Mladen Sormaz fizeram uma apresentação de pôster no OptaPro Analytics Forum de 2018. Este artigo fornece uma descrição detalhada de suas análises. Seus pôsteres também podem ser lidos aqui:
O papel do lateral mudou drasticamente nos últimos anos, com muitas equipes na Europa agora se concentrando predominantemente em como podem envolver seus laterais no ataque, ainda mais do que na proteção da defesa. De fato, o uso de laterais parece ter voltado à moda, com destaque para o esquema 3-5-2 de Antonio Conte, que funcionou muito bem na conquista do título da Premier League pelo Chelsea na última temporada. Mas, em vez de observar subjetivamente os diferentes estilos de jogo dos laterais na Europa, será que esses estilos podem ser quantificados?
Nós nos concentramos nos laterais porque seu estilo de jogo se tornou muito variado nas últimas temporadas, mas esse método pode ser aplicado a qualquer posição. O que queríamos era fornecer uma medida mais detalhada e objetiva dos diferentes perfis de laterais, que levasse em conta as dimensões mais amplas do estilo de um jogador em vez de suas estatísticas individuais. Para isso, usamos os dados Opta F9 (totais de jogos agregados) para executar primeiro uma Análise de Componentes Principais (PCA) com rotação varimax a fim de reduzir a dimensionalidade dos dados e determinar os perfis mais amplos dos laterais que inserimos na análise (os detalhes de nossa análise PCA podem ser encontrados aqui). A próxima etapa foi usar essas informações para quantificar quais laterais eram mais semelhantes entre si no estilo de jogo.
Os números
Analisamos 417 laterais das temporadas 2015/16 e 2016/17 nas "cinco grandes" competições europeias. Depois que a PCA mostrou perfis estáveis nas duas temporadas, inserimos nossos dados de 2016/17 em uma análise de agrupamento. Os indivíduos com perfis semelhantes ou relacionados são colocados juntos e separados daqueles com perfis diferentes. Devemos observar que a comparação de jogadores entre ligas é difícil, e fizemos o possível para corrigir isso em nossa análise.
Os resultados de nossa análise foram muito interessantes, com 11 grupos de jogadores criados com base em suas estatísticas de desempenho (veja a Figura 1). É importante ressaltar que os jogadores de alto nível que você esperaria agrupar com base em seu estilo de jogo de fato se enquadram no mesmo grupo (por exemplo, Marcelo, Alex Sandro, Davide Zappacosta), destacando a confiabilidade da análise e passando no "teste do olho". A Figura 1, abaixo, cria grupos mais amplos e subgrupos mais específicos, com cada linha representando um jogador individual.
Usamos um método aglomerativo, que procura combinar todos os jogadores com um "parceiro de estilo" e, em seguida, expande o grupo comparando esse par com outros pares e grupos iterativamente, até chegar ao topo da árvore. Para reiterar, a distância entre as linhas (que representam um jogador) abaixo é indicativa da semelhança em seu estilo de jogo.
Tradicionalmente, há maneiras de determinar quantos agrupamentos existem em um dendrograma cortando os galhos da árvore em uma altura consistente. Não fizemos isso aqui, pois o princípio de perder a similaridade do jogador à medida que você sobe na árvore permanece, quer você corte a árvore ou não. Os ramos coloridos estão lá para facilitar a leitura da figura, mas se você quiser saber como isso é feito, há um bom artigo intitulado 'Defining clusters from a hierarchical cluster tree: The Dynamic Tree Cut package for R".
Alguns exemplos de cada grupo podem ser vistos abaixo. Conforme discutido, os jogadores agrupados fazem sentido em termos de futebol, mas como o algoritmo de agrupamento não pressupõe nenhum conhecimento de futebol, esses resultados aumentam a confiabilidade da análise.
Como isso pode ser usado?
O maior uso da análise de cluster é que o modelo pode quantificar e agrupar objetivamente os jogadores que são mais semelhantes entre si em seu estilo de jogo, sem qualquer preconceito ou conhecimento prévio de futebol. Isso pode ajudar enormemente os clubes de futebol no mercado de transferências, especialmente aqueles com orçamentos financeiros restritos. Por exemplo, os clubes podem criar uma lista restrita de transferências para um perfil de jogador que se encaixaria em seu próprio estilo de jogo. A equipe de recrutamento também pode identificar a contratação ideal (por exemplo, Marcelo) e usar o modelo para explorar uma série de jogadores alternativos que seriam muito semelhantes por um preço mais acessível (por exemplo, Cristian Ansaldi). Isso pode ser visto simplesmente no dendrograma acima, pesquisando um jogador e "subindo na árvore" para explorar quem é mais semelhante a esse jogador. Quanto mais você sobe na árvore, menos semelhante é o perfil do jogador, mas os clubes podem ter que fazer concessões entre seu orçamento e o perfil exato que precisam.
Como um método mais realista de visualizar os perfis dos jogadores em um ambiente de clube, fornecemos um exemplo de gráfico de radar de como você pode avaliar os pontos fortes e fracos de um jogador com base em determinados atributos (consulte a Figura 2). Isso pode ser usado para comparar dois alvos de transferência ou comparar uma possível contratação com o jogador que você já tem no clube.
Como mostra o exemplo abaixo, os atributos de Ryan Bertrand se baseiam em uma boa defesa, na qual ele é eficaz em participar do ataque sempre que possível. Por outro lado, Danny Rose pode não ser tão forte defensivamente, mas tem mais contato com a bola e é provável que ofereça mais chances para a equipe. Esse é um exemplo das decisões que os clubes podem tomar em seus planos de transferência, e usar essa ferramenta baseada no algoritmo de agrupamento pode ser um método objetivo para fazer isso.
Resumo
Com acesso a mais dados de ligas de todo o mundo, esse modelo pode ser ainda mais forte para dar aos clubes uma vantagem competitiva em sua política de transferências. Ele oferece um método rápido e econômico que pode ser facilmente implementado e atualizado em um clube, tanto dentro quanto entre as temporadas. É claro que (como sempre acontece com a análise) enfatizamos que esse modelo pode ser implementado como uma ferramenta útil para acompanhar os métodos típicos de scouting que existem atualmente, e não substituí-los completamente. O que ele oferece é uma boa base para identificar objetivamente alvos potenciais de transferência, sem preconceitos, para que os olheiros façam relatórios sobre eles. De fato, esse método pode ser usado como uma boa calibração entre os olheiros tradicionais e os analistas, para determinar se o perfil subjetivo de um jogador-alvo corresponde ao seu perfil estatístico. Considerando o aumento dos preços dos jogadores em toda a Europa, o uso desse modelo poderia economizar muito dinheiro para os clubes no mercado de transferências e ajudar a fornecer um mecanismo de filtragem para evitar as "compras de pânico" que têm atormentado tantas equipes ao longo dos anos.
Recebemos um feedback muito positivo ao apresentar esse trabalho no Forum OptaPro deste ano. Para obter mais informações, entre em contato com Mark e Mladen no Twitter em @MarkCarey93 e @Mladen_Sormaz.


