Ir para o conteúdo principal

Analisando os goleiros da La Liga com a identidade do goleiro AI

Por: Stats Perform

Não é segredo que a forma de Thibaut Courtois foi questionada publicamente pelo antigo e atual técnico do Real Madrid, Zinedine Zidane. Mesmo antes disso, ele foi questionado na mídia. Zidane preferiu Keylor Navas, tendo anteriormente permanecido fiel ao seu goleiro na temporada 2017/18, apesar das crescentes críticas ao desempenho do goleiro.

De fato, Zidane convocou Navas em seu primeiro jogo de volta ao comando do time, contra o Celta de Vigo. Ele fez isso porque é o homem no comando e sua opinião é a que mais importa. Mas como podemos medir com precisão o impacto que essa mudança pode ter tido na temporada do Real Madrid até o momento? Para isso, precisamos ser capazes de simular com precisão como um goleiro se sairia diante dos chutes de outro goleiro - ou melhor ainda, como cada goleiro se sairia diante de cada chute em uma amostra uniforme.

Voltaremos ao debate sobre o Real Madrid em breve. Primeiro, vamos considerar o problema maior de avaliar adequadamente o desempenho do goleiro.

O problema com a avaliação de goleiros

Os goleiros são avaliados por meio de métricas como jogos sem sofrer gols, gols sofridos e porcentagem de defesas. Mais recentemente, métricas "esperadas", como defesas esperadas (xS), foram introduzidas para comparar o desempenho com a média da liga. No entanto, os goleiros podem ter que fazer tipos completamente diferentes de defesas, dependendo do estilo defensivo de sua equipe e dos adversários que enfrentam.

Em vez de usar métricas que podem não captar todas as situações e contextos diferentes, por que não podemos ir além das métricas e simplesmente simular cada goleiro para cada chute e depois comparar quem sofreria menos gols?

Aqui, descrevemos como fazemos isso e como nosso método inovador pode ser usado por treinadores e departamentos de recrutamento para analisar melhor os goleiros e entender seus pontos fortes e fracos. Se você estiver interessado em saber mais sobre o método, acesse este link para Trading Places - Simulando o desempenho do goleiro usando dados espaciais e de postura corporal.

Capturando a identidade exclusiva do goleiro

Para captar o efeito que um goleiro tem sobre a decisão dos atacantes, você precisaria de recursos muito detalhados, como a posição do corpo do goleiro. Por exemplo, como ele posiciona os braços? E ele está com os pés chatos? Esses dados são difíceis de obter em grande escala. Outra maneira de fazer isso seria obter centenas de milhares de chutes de cada goleiro e aprender um modelo pessoal para cada um deles, mas a realidade é que um goleiro enfrenta, em média, cinco chutes a gol por jogo. Portanto, essa opção está descartada. Podemos capturar isso de outras maneiras?

Resolvemos esse problema criando um conjunto de recursos que medem os pontos fortes e fracos dos goleiros quando enfrentam chutes em diferentes situações. Por exemplo, eles são mais fortes no lado esquerdo ou direito? Como eles se comportam em situações de 1 contra 1? Eles são facilmente vencidos pelos pés? Depois de gerarmos esses recursos, nós os combinamos no que chamamos de Player Embedding, que cria uma identidade única de goleiro orientada por dados. Quando traçamos esses embeddings, podemos ver que agora somos capazes de separar os goleiros em grupos diferentes, o que significa que somos capazes de captar as nuances exclusivas de cada um (consulte o artigo publicado no link acima para obter detalhes completos sobre como isso é calculado).

Se combinarmos esses embeddings com um modelo xS normal, aumentaremos significativamente nossa precisão na previsão de que um goleiro defenderá um chute no alvo. Crucialmente, isso nos permite entrar na área de previsão personalizada de jogadores. Como resultado, se quisermos saber como o goleiro A lidaria com os chutes do goleiro B ou, no nosso caso, como Navas lidaria com os chutes de Courtois, agora podemos simplesmente pegar a identidade exclusiva de cada jogador e trocá-los para simular o que esperamos que aconteça.

O Real tem 99 problemas, mas Navas não é um deles

Voltando ao nosso exemplo do Real Madrid acima, agora podemos simular com precisão quantos gols Navas teria evitado ao enfrentar os chutes de Courtois e vice-versa. Usando nosso gráfico de defesas simuladas, se executarmos o modelo em 99 chutes que ambos os goleiros enfrentaram nesta temporada, veremos que Navas deveria ter defendido mais quatro gols em comparação com Courtois. Ao visualizar onde cada goleiro é mais forte ou mais fraco, podemos ver que Navas (vermelho) é significativamente melhor em defender chutes em direção ao centro do gol, enquanto Courtois (verde) só é significativamente melhor em defender chutes perto do canto inferior esquerdo.

Essas informações são essenciais para que o técnico possa fazer um julgamento fundamentado ao selecionar o jogador que será titular. Também são valiosas em outras áreas, como a de treinamento e a área de recrutamento de alto risco.

Compras na La Liga - Classificação de gols marcados

A La Liga foi a anfitriã de alguns dos melhores goleiros da atualidade, como Iker Casillas e Jan Oblak, e exportou um grande número de goleiros de alto nível, como David De Gea e Pepe Reina. Como resultado, a La Liga é uma liga privilegiada para o recrutamento de goleiros. No entanto, nem todos podem se dar ao luxo de comprar um goleiro de alto nível bem conhecido. Podemos usar nosso modelo para avaliar facilmente qualquer goleiro em nosso banco de dados e encontrar joias escondidas.

A beleza do modelo é que podemos simular cada goleiro contra cada chute dado em qualquer jogo para o qual tenhamos dados. Como resultado, agora podemos fornecer classificações precisas dos goleiros com base em quantos gols adicionais um jogador evita ou permite em comparação com uma média por 90 minutos. Nosso modelo de gols adicionados gera algumas percepções interessantes com amplas aplicações.

Como era de se esperar, nomes como Jan Oblak e Marc-Andre Ter Stegen estão entre os 10 primeiros. Mas o jogador no topo da classificação - Roberto Santamaria - não se encaixa bem nesse nível de reconhecimento de nome. Santamaria joga no lanterna SD Huesca e tem sido uma espécie de viajante, jogando em cinco clubes nas últimas cinco temporadas. Ele teve sua chance quando Aleksandar Jovanovic - o goleiro menos cotado da liga - foi dispensado. Santamaria se tornou o goleiro número 1 do Huesca em 23 de dezembro. Antes disso, o time tinha uma média de 0,5 ponto por partida, com 32 gols sofridos em 16 jogos da La Liga. Com ele no gol desde então: 1,08 pontos por partida, com 18 gols sofridos em 13 jogos. Considerando que ele está jogando em um time ameaçado de rebaixamento, é um histórico promissor. E quando simulado contra a mesma amostra de chutes que o restante dos goleiros da La Liga, ele é o melhor da divisão.

O STATS AI Goalkeeper Index é um novo modelo que nos permite simular e avaliar com precisão os pontos fortes e fracos de um goleiro e comparar diretamente uma contratação-alvo com outras. Além disso, é possível simular como um novo goleiro aumentaria ou diminuiria o número de gols sofridos em comparação com os jogadores existentes no elenco.

E se o Real precisava de mais uma confirmação de que trazer Zidane de volta foi a decisão correta, parece que sua avaliação de Courtois foi adequada.