Um problema comum no recrutamento e na avaliação de jogadores é a comparação de jogadores em diferentes estágios de suas carreiras ou que tiveram diferentes trajetórias profissionais.
Embora seja um exemplo obviamente extremo, considere Marcus Rashford e Wayne Rooney no início desta temporada. Um era um atacante de 18 anos com apenas 11 jogos no campeonato e o outro era um atacante de 30 anos com mais de 400 jogos no campeonato.
Neste blog, utilizo uma estatística relativamente simples - a porcentagem de conversão - como modelo para entender como podemos alterar nossas suposições para informar melhor nossa compreensão da avaliação de jogadores.
Nossa abordagem deve considerar não apenas o desempenho passado de um jogador, mas também os diferentes níveis de incerteza que cercam nossas projeções sobre o desempenho futuro.
Estamos agora em uma fase da análise de futebol em que métricas mais avançadas, como a expectativa de gols, devem ser usadas na avaliação de jogadores avançados. No entanto, a taxa de conversão pode funcionar como um bom ponto de partida, sabendo que há determinados jogadores que apresentam consistentemente uma taxa de conversão acima da média.
Então, como podemos escolher esses jogadores entre os demais?
Começando de novo: de volta ao básico
Decidi seguir uma abordagem usada por David Robinson para estimar as médias de rebatidas no beisebol. Vou descrever isso do início ao fim, e os processos subjacentes a esse modo de pensar ajustado ficarão claros à medida que o artigo for avançando.
Primeiro, analisei todas as porcentagens de conversão de todos os jogadores da Premier League, La Liga, Bundesliga, Serie A e Ligue 1 de 2005-06 a 2015-16. Uma tabela simples revela as melhores porcentagens de conversão durante esse período.
Apesar de suas taxas de conversão aparentemente excelentes, podemos dizer com segurança que Marcel Ziemer, com 37 minutos de futebol na Bundesliga em sua carreira, e o goleiro Tim Howard provavelmente não estão entre os melhores finalizadores nessas competições.
O problema aqui é óbvio: nenhum desses jogadores deu um número suficiente de chutes, portanto, suas porcentagens de conversão são distorcidas pela pequena amostra. Então, o que acontece se colocarmos um filtro de chutes em nossa tabela e analisarmos apenas os jogadores que deram mais de 30 chutes?
A lista agora parece um pouco melhor, mas a porcentagem de conversão mais alta entre todos os jogadores ainda é a do lateral-direito Paul Verhaegh e, embora alguns nomes comecem a fazer um pouco mais de sentido, como os atacantes Bas Dost e Dario Cvitanich, ela ainda parece totalmente insatisfatória.
Um novo diagnóstico...
Dando um passo atrás, podemos começar a diagnosticar o problema e usar uma abordagem mais informada. Em geral, cerca de um em cada 11 chutes é marcado, portanto, podemos começar presumindo que todos os jogadores convertem a essa taxa média. A porcentagem média de conversão para jogadores com 30 ou mais chutes nessa amostra é de 9,12%.

Porcentagem de conversão e chutes na carreira
É evidente que, em média, quanto mais chutes um jogador dá, mais sua porcentagem de conversão se aproxima da média (representada pela linha vermelha), ao passo que há uma variação muito maior entre os jogadores que deram menos chutes. Esse fenômeno estatístico chamado "regressão à média" sugere que, mesmo que um jogador tenha uma porcentagem de conversão superalta em uma amostra pequena - como Paul Verhaegh -, esperamos que ela se reverta para algo mais próximo da média ao longo do tempo.
No entanto, isso pode parecer uma simplificação excessiva de eventos e resultados, pois sabemos que outros fatores podem desempenhar um papel. Para ajustar esse fenômeno, podemos usar o que é chamado de abordagem bayesiana empírica. Constantinos Chappas usou uma abordagem semelhante no OptaPro Analytics Forum para analisar a incerteza ano a ano com métricas agregadas semelhantes.
Ajuste da posição inicial
Começamos com uma crença prévia - neste caso, de que todo jogador começa com uma porcentagem de conversão de 9,12% - e cada novo ponto de dados (neste caso, um chute e seu resultado) afasta nossa estimativa do ponto inicial.
Portanto, se um jogador der um chute e marcar um gol, sua porcentagem de conversão estimada não será imediatamente de 100%, como mostrado nos casos anteriores. Agora, a porcentagem de conversão estimada mudará apenas um pequeno valor com base no quanto isso alterou nossa visão anterior de que a porcentagem de conversão dele era de 9,12% (isso é detalhado no apêndice matemático).
Obtemos uma nova tabela de classificação usando essa abordagem.
Os jogadores em destaque agora começam a parecer mais razoáveis. Entre os cinco primeiros, temos Javier Hernández, que teve uma taxa de gols impressionante tanto no Manchester United quanto no Bayer Leverkusen, assim como Carlos Bacca, que foi igualmente clínico no Sevilla e no Milan. No entanto, ainda há motivos para ceticismo: o lateral-direito Paul Verhaegh continua entre os cinco primeiros, apesar de ter dado apenas 51 chutes a gol.
Isso nos leva à segunda tendência do gráfico. Não se trata tanto de uma tendência estatística clássica, mas de uma tendência baseada na compreensão do próprio jogo: os jogadores com mais chutes tendem a ter uma porcentagem de conversão maior do que a média.

Porcentagem de conversão e chutes na carreira: uma tendência de aumento
A linha de tendência azul deixa isso claro, mas mesmo analisando apenas os jogadores com mais de 500 chutes em suas carreiras, quase todos eles estão acima da média da amostra de porcentagem de conversão de 9,12%.
Então, por que surge essa tendência? Essencialmente, os bons arremessadores arremessam mais. Isso pode ser devido ao fato de os bons arremessadores terem mais minutos, de os bons arremessadores confiarem em si mesmos para arremessar com mais frequência, de os bons arremessadores tentarem criar oportunidades de arremesso com mais frequência, de os colegas de equipe tentarem passar a bola para os bons arremessadores com mais frequência ou de vários outros fatores.
Mudança de nossas crenças
Do ponto de vista da estimativa, isso significa que presumir que todos os jogadores tenham uma taxa de conversão de 9,12% antes de darem um único chute é falho, pois bons chutadores que deram mais chutes e têm uma porcentagem de conversão mais alta aumentam essa média.
Ao reconhecer o número de chutes que um jogador já deu em sua carreira, podemos tentar resolver esse problema (conhecido como regressão Beta-Binomial). Dentro dessa nova abordagem, consideramos que bons arremessadores arremessam com mais frequência.
Por fim, a tabela de classificação realmente começa a passar no teste dos olhos, com os cinco primeiros colocados incluindo alguns dos atacantes mais clínicos da última década.
Essa é apenas uma das muitas maneiras de analisar a capacidade de finalização. Isso também pode ser aplicado a outras estatísticas e métricas, e pode ser aplicado para informar melhor como fazemos benchmarking e avaliamos os jogadores.
No entanto, esse exemplo específico mostra como podemos usar dados agregados bastante simples - nesse caso, essencialmente apenas números de gols e chutes - para obter percepções significativas e identificar os principais conjuntos de habilidades dos jogadores em uma amostra grande e variada de jogadores.
Finalmente, vamos revisitar nosso exemplo Rashford - Rooney. Usando esse método, Rashford tem uma taxa de conversão estimada de 11,31% e Rooney tem uma taxa de conversão esperada de 13,24% (o mesmo que sua porcentagem de conversão real nesse período). Portanto, apesar de ter marcado cinco gols em 16 chutes em sua primeira temporada na Premier League - uma taxa de conversão de 31,25% -, essa porcentagem de conversão estimada se ajusta ao fato de que ele deu muito menos chutes do que Rooney e não nos permite tirar a conclusão, talvez mal informada, de que Rashford já é um finalizador melhor do que Rooney.



