Ir para o conteúdo principal

O modelo que mapeia a evolução da Inglaterra como candidata à Copa do Mundo

Por: Stats Perform

Principais conclusões

- A excepcional formação de batedores da Inglaterra se compara favoravelmente a várias equipes lendárias vencedoras da Copa do Mundo.

- A unidade de boliche da Inglaterra é comparativamente fraca em relação a seus rivais na Copa do Mundo.

- Com base no críquete doméstico de 50 overs, James Vince é o principal candidato para substituir Alex Hales como batedor reserva de primeira ordem.

- O nível de desempenho de Jofra Archer no T20 Blast, IPL e Big Bash é comparável ao dos lançadores rápidos de elite que jogam nessas ligas, embora o conjunto de habilidades exigido seja diferente do formato de 50 over.

É muito clichê descrever este verão como um grande verão para o críquete inglês. O início da temporada doméstica serve como ponto de partida, com um exame minucioso das possíveis oportunidades para batedores de primeira linha na equipe de teste e o curso de sobremesa de uma série de Ashes no horizonte no final do verão. O principal alimento, no entanto, será a Copa do Mundo One-Day International (ODI), que será realizada na Inglaterra e no País de Gales de30 de maio a 14 de julho.

A Inglaterra entra no torneio não apenas como a equipe número um no ranking oficial da ICC, mas chegou lá por meio de um jogo de críquete agressivo e empolgante. Em 2016, eles estabeleceram um novo recorde para o maior total de innings em um ODI de 444, antes de quebrar seu próprio recorde em 2018 ao marcar 481 contra a Austrália. Antes desse ciclo da Copa do Mundo, a Inglaterra havia ultrapassado a marca de 350 por duas vezes; eles fizeram isso 13 vezes desde maio de 2015. Esta é uma equipe inglesa diferente das anteriores.

O artigo a seguir apresenta classificações de desempenho de equipes e jogadores a partir de modelos que estão sendo desenvolvidos pela equipe de ciência de dados da OptaPro. O objetivo é dar uma visão geral dos pontos fortes e fracos da Inglaterra e das opções de seleção no momento em que começam os preparativos finais para a Copa do Mundo e a confirmação do elenco.

Quantificação da força da equipe

O críquete internacional é um ambiente desafiador do ponto de vista de modelagem e análise. O cronograma significativamente desequilibrado, a ampla gama de condições nos cinco continentes que recebem jogos regularmente e a variedade de locais têm um impacto substancial no desempenho e na forma. Os ajustes regulares nos regulamentos, bem como a evolução e a capacidade de marcar gols cada vez mais rapidamente dificultam as perspectivas históricas. Além disso, com amadores competindo com estrelas que ganham milhões todos os anos, pode haver um abismo entre a capacidade relativa das equipes.

Por exemplo, em27 de fevereiro deste ano, a equipe da Inglaterra marcou 418 corridas em 50 overs com a perda de seis wickets, vencendo as Índias Ocidentais por 29 corridas. Apenas três dias depois, em2 de março, a Inglaterra foi eliminada por 113 em 28,1 overs, perdendo por sete wickets e com quase 38 overs restantes no turno das Índias Ocidentais. Quantificar os níveis de desempenho considerando esses fatores e a variabilidade é uma tarefa difícil.

No entanto, o críquete é um esporte rico em conhecimento e sabedoria acumulados; as condições na Austrália e em Bangladesh são geralmente diferentes, assim como as da Inglaterra e das Índias Ocidentais. Certos locais têm a reputação de serem hospitaleiros para os batedores, enquanto outros incentivam o contingente de jogadores de boliche. Embora as equipes não joguem entre si em um cronograma sistemático, os confrontos regulares fornecem informações sobre seus pontos fortes e fracos relativos, especialmente em séries com vários jogos. Embora os membros "associados" mais fracos não joguem um grande número de partidas por ano, podemos fazer suposições gerais sobre sua capacidade em relação às nações estabelecidas para informar nosso método.

Essas informações são ideais para a formulação de uma abordagem de modelagem bayesiana que possa usar essa sabedoria prévia e utilizá-la para determinar o impacto dos fatores que podem afetar o desempenho. Usamos o PyMC3 para definir um modelo hierárquico de Markov Chain Monte Carlo (MCMC)para determinar os pontos fortes das equipes internacionais de críquete em ciclos individuais da Copa do Mundo; esses ciclos de 3 a 4 anos são um meio-termo entre o aumento do tamanho da amostra em detrimento de mudanças reais de menor escala no desempenho. Abordagens semelhantes foram usadas anteriormente na literatura acadêmica para classificar batedores de partidas de teste.

Em termos de dados para o modelo, usamos partidas ODI completas que não estavam sujeitas a alterações forçadas pelo clima nas condições de jogo em uma partida desde a Copa do Mundo de 1979. As partidas anteriores a essa eram menos uniformes em termos de condições de jogo, com o número de overs e bolas por over diferindo em muitos casos. Durante a década de 1970, o indicador mais claro do vencedor da partida era o time que estivesse batendo em segundo lugar, pois a capacidade de definir uma meta exigida representava uma barreira significativa, colocando uma influência indevida no lançamento de uma moeda. As classificações e análises apresentadas abaixo consideram apenas as partidas entre Copas do Mundo (ou seja, não incluem as partidas da Copa do Mundo propriamente dita, pois nosso objetivo é quantificar a força das equipes que entram em um torneio).

Determinamos os pontos fortes de rebatidas e boliche separadamente para cada equipe, pois são disciplinas independentes em termos gerais. Conforme definido aqui, a capacidade de campo seria encapsulada na força de boliche de uma equipe.

Mais detalhes sobre a abordagem de modelagem estão incluídos no final do artigo.

Exame de saúde na Inglaterra

Em termos de resultados do modelo, determinamos os pontos fortes da equipe e os expressamos como totais de corridas por turno contra uma equipe "média" em um local neutro. Para comparar as épocas, as classificações são dadas como se uma equipe estivesse jogando no ciclo atual da Copa do Mundo.

Durante os 40 anos e 10 ciclos da Copa do Mundo considerados na análise, as cinco melhores equipes de rebatedores são compostas pelas equipes da Austrália de 2003 e 2007, a equipe da Índia de 2011 e a equipe das Índias Ocidentais de 1987. No lado do boliche, os cinco primeiros são dominados pelas Índias Ocidentais de 1983 a 1996 com seus formidáveis e intimidadores ataques de boliche rápido, com a unidade da África do Sul de 1996 aparecendo sorrateiramente em quarto lugar.

A figura abaixo ilustra as classificações da Inglaterra ao longo do tempo, com totais de corridas mais altos significando uma equipe de batedores melhor e totais de corridas em entradas mais baixos associados a equipes de boliche melhores. Leitores atentos devem ter notado que apenas quatro equipes foram listadas entre as cinco melhores equipes de rebatedores; a equipe omitida foi a atual formação da Inglaterra, que está em segundo lugar em nossas classificações históricas. A excelência constante dos rebatedores da Índia se reflete no fato de eles ocuparem o sexto e o sétimo lugares.

 

 

De acordo com nossas classificações históricas, o rebatimento da Inglaterra tem sido, em geral, de médio a acima da média. A incerteza nessas classificações também é ilustrada e podemos estar bastante confiantes quanto à natureza excepcional desta equipe da Inglaterra, tanto em comparação com seus pares quanto com as equipes anteriores da Inglaterra. Há algum tempo, ficou claro que esta equipe da Inglaterra é muito diferente de seus antepassados e está na vanguarda do críquete moderno, o que nossas classificações ilustram e quantificam.

Por outro lado, o boliche da Inglaterra é motivo de preocupação, pois nossa melhor estimativa do nível de desempenho nos últimos quatro anos é a de uma equipe mediana. Das equipes que se classificaram para a Copa do Mundo de 2019, apenas as Índias Ocidentais e o Sri Lanka são consideradas claramente mais fracas, e o boliche da Inglaterra está ao lado do de Bangladesh. Nossa melhor estimativa é que a África do Sul e a Índia tenham as unidades de boliche mais fortes para a competição.

Grande parte da narrativa que antecedeu o torneio girou em torno do ataque de boliche da Inglaterra, que nossas classificações quantificam explicitamente em relação a seus pares. Com base nessas classificações, há certamente um caso para considerar opções alternativas.

Quantificação da habilidade de rebatidas

Para avaliar os níveis de desempenho dos indivíduos, adaptamos o modelo de força da equipe para estudar batedores e lançadores com foco nas partidas desde a Copa do Mundo de 2015.

Para o batedor, o modelo considera as corridas marcadas em um turno e a taxa de strike nesse turno. As características ideais de um jogador de ODI são a capacidade de marcar muitos pontos e rapidamente, e essa configuração isolará os melhores batedores que demonstram essas habilidades, ao mesmo tempo em que leva em conta fatores como a vantagem de jogar em casa, a oposição e o local. Não prescrevemos explicitamente a importância relativa das corridas marcadas e da taxa de strike no modelo para determinar a capacidade de rebatidas; o exame da relação entre as classificações dos batedores e as corridas marcadas e a taxa de strike revela que a primeira está mais fortemente relacionada à classificação geral, embora a taxa de strike seja claramente uma faceta importante.

Os resultados do modelo são ilustrados abaixo com jogadores individuais que participaram de ODIs de 2015 a 2019 representados pelos marcadores de acordo com sua posição de rebatedor mais frequente no período. Em termos gerais, há um declínio na classificação do batedor ao descer na ordem - o modelo não considera a posição de batedor como uma característica, portanto, não percebe essa expectativa.

 

 

Um aspecto interessante das classificações é que, devido à consideração das corridas marcadas e da taxa de strike, os batedores de ordem inferior podem ter uma classificação relativamente alta em comparação com os batedores de ordem superior, o que normalmente está relacionado ao fato de marcarem mais rápido do que a média. Isso não deve ser interpretado como se esses jogadores fossem necessariamente mais capazes do que seus pares de primeira ordem, apenas que estão tendo um bom desempenho no contexto em que normalmente jogam.

A figura destaca os jogadores da Inglaterra que atuaram durante o período, bem como Virat Kohli, que é o jogador com a classificação mais alta. O que fica claro na figura é que a ordem superior da Inglaterra é excepcional, enquanto a ordem inferior também é muito capaz. A qualidade e a profundidade do rebatimento da Inglaterra impulsionam sua classificação de desempenho delineada pelo modelo de força da equipe apresentado acima.

Identificação de possíveis substitutos para Hales

A exclusão de Alex Hales significa que há uma vaga surpresa na equipe para cobrir o batedor de primeira ordem. O histórico de Hales tem sido excelente, fornecendo regularmente a abordagem agressiva que a Inglaterra tanto preza. A natureza estável da formação de batedores da Inglaterra fez com que houvesse relativamente poucas oportunidades para aqueles que agora estão sendo considerados para substituí-lo. James Vince e Ben Duckett tiveram apenas 5 e 3 entradas, respectivamente, para impressionar em ODIs e, portanto, são difíceis de julgar nesse contexto.

Com base em uma versão preliminar do modelo para o críquete nacional de 50 overs, Vince é o candidato de destaque nos últimos 2 a 4 anos, tendo marcado muitos gols e rapidamente. Ben Slater, companheiro de equipe de Hales e Duckett em Nottinghamshire, e Sam Hain, de Warwickshire, seriam os outros candidatos claros com base apenas no desempenho doméstico. Entretanto, deve-se observar que o número relativamente baixo de partidas domésticas torna essas classificações mais incertas.

Não importa como a Inglaterra proceda, eles perderam um jogador internacional comprovado e capaz em Hales e, se o seu substituto for colocado no meio durante a Copa do Mundo, eles não terão o mesmo histórico internacional para usar.

Quantificação da habilidade de jogar boliche

Para os arremessadores, o modelo considera a taxa de economia e os wickets obtidos, levando em conta o adversário e o local. Em termos gerais, o arremessador de ODI ideal seria um jogador que fizesse muitos wickets e tivesse um baixo índice de economia, o que o modelo tenta isolar. Da mesma forma que as classificações dos batedores, não prescrevemos a importância relativa desses fatores para determinar a capacidade de arremesso, mas parece que a tomada de wickets e a taxa de economia são relativamente uniformes em termos de classificações.

Os resultados do modelo são ilustrados abaixo e estão agrupados de acordo com a ação de boliche do jogador. Para os arremessadores, valores mais baixos significam melhores jogadores e, portanto, o eixo é invertido para refletir isso. Rashid Khan é claramente o arremessador de destaque, com sua incrível capacidade de tomar postigos combinada com uma taxa de economia muito baixa. Jasprit Bumrah é classificado como o principal lançador de ritmo.

 

 

Além de Khan e Bumrah, os arremessadores da Inglaterra são destacados, sendo Adil Rashid, Chris Woakes e Liam Plunkett os destaques, com o apoio competente de Moeen Ali em relação a outros arremessadores de fora. O restante das opções de boliche consideradas é visto como relativamente mediano ou ruim, embora as classificações atualmente não levem em conta o estágio de um turno em que o lançador é normalmente utilizado. No entanto, essas classificações sugerem que a consideração da Inglaterra por opções alternativas pode ser uma medida sensata.

Os méritos de Jofra Archer

Grande parte do foco na preparação para o torneio tem sido o prodigiosamente talentoso lançador rápido Jofra Archer, que agora está disponível para a seleção após cumprir os requisitos de residência. Archer foi incluído na equipe ampliada para os preparativos finais para a Copa do Mundo, que começam com um único ODI contra a Irlanda amanhã, seguido de uma partida T20 e cinco ODIs contra o Paquistão. Archer não foi incluído na equipe inicial de 15 jogadores da Inglaterra para o torneio, mas eles têm a oportunidade de alterá-la até23 de maio.

A reputação de Archer foi amplamente forjada em várias competições de 20 overs, incluindo a IPL e a Big Bash. Com base em um modelo preliminar de arremessadores no T20 Blast, BBL e IPL nos últimos dois anos, Archer está em sexto lugar entre os arremessadores rápidos, indicando que seu nível de desempenho tem sido excelente. O número de partidas que ele disputou significa que sua classificação é mais robusta do que a de muitos de seus colegas. Bumrah é novamente o arremessador rápido mais bem classificado, e Archer se compara favoravelmente a ele, assim como a Kagiso Rabada, que também aparece bem nas classificações de ODI. Uma ressalva em termos de tradução das habilidades de 20 overs para o formato mais longo de um dia é que o modelo pondera mais fortemente a taxa de economia como significante da habilidade de arremesso devido ao fato de os wickets serem relativamente mais difíceis de conseguir no formato mais curto.

Archer terá um teste prolongado nas partidas pré-torneio e, se suas façanhas em 20 overs se traduzirem bem em ODIs, o ataque de boliche da Inglaterra receberá um impulso bem-vindo e oportuno.

Conclusões

As classificações de desempenho da equipe e dos jogadores descritas aqui oferecem espaço para otimismo em relação às perspectivas da Inglaterra na Copa do Mundo, bem como áreas de preocupação. A unidade de rebatidas é excepcional e sua profundidade é extraordinária em comparação com os outros concorrentes. Em um contexto histórico, o rebatedor da equipe é comparável a várias equipes lendárias vencedoras de Copas do Mundo e tem a capacidade de dominar seus adversários ou de correr atrás do que geralmente seria visto como totais imponentes.

A principal preocupação da Inglaterra é certamente seu ataque de boliche. A configuração e a duração do torneio provavelmente significam que um desempenho de rebatidas com falhas não será um terminal em termos de classificação na fase de grupos. No entanto, se os batedores ficarem abaixo de seus padrões habituais em uma partida crucial e fizerem uma pontuação na faixa de 200-250, haverá sérias dúvidas sobre a capacidade da equipe de defender esse total. Considerar suas opções de boliche antes do torneio certamente parece ser o curso de ação mais prudente.

A melhoria geral da Inglaterra nos últimos quatro anos foi notável, com seu críquete ousado e empolgante, combinado com a vantagem de jogar em casa, colocando-a em uma posição melhor para vencer a Copa do Mundo do que qualquer outra equipe da Inglaterra em nossa análise. Esta é uma equipe da Inglaterra diferente das anteriores.

*Mais detalhes do modelo

As funções de probabilidade que são resolvidas por meio da abordagem MCMC usam o número de corridas marcadas em um turno e o número de eliminações que caem e consideram a vantagem de jogar em casa, o local e a identidade da equipe de rebatedores e lançadores. O primeiro e o segundo turnos são separados para que a meta de taxa de corridas possa ser incluída como uma variável no modelo para o segundo turno; isso fornece um contexto adicional para uma determinada partida com totais mais altos no primeiro turno, em média, levando a totais mais altos no segundo turno. O número de overs no turno também é incluído como variável para levar em conta as taxas de corrida, o que é particularmente importante no segundo turno, quando o turno de uma equipe termina porque ela ultrapassa a meta de pontuação.

Os totais de corridas em innings são modelados de acordo com uma distribuição binomial negativa, que é um caso especial da distribuição de Poisson, mas com maior variação ou "dispersão" para refletir a variabilidade significativa predominante no críquete. Os wickets perdidos são modelados como uma distribuição de Poisson.

Efetivamente, a configuração do modelo isolará as equipes de rebatedores mais fortes como aquelas que registram totais de corridas mais altos e perdem menos wickets, considerando o adversário e os outros fatores incluídos no modelo. Por outro lado, as equipes de boliche mais fortes são aquelas que concedem menos corridas e, ao mesmo tempo, eliminam mais wickets.

Para levar em conta a evolução do jogo ao longo do tempo, definimos as alterações relativas à média global de totais de corridas e postigos obtidos que podem variar em cada ciclo da Copa do Mundo. O objetivo aqui é capturar as mudanças nos regulamentos, por exemplo, regras de power-play, bem como táticas e abordagens subjacentes, por exemplo, o advento de "pinch-hitters", especialistas em ODI ou partidas Twenty-20. Observamos totais de corridas em innings relativamente estáveis até a Copa do Mundo de 1996, depois um aumento nos dois ciclos seguintes, antes de outro aumento no final dos anos 2000 e no início desta década, culminando em totais de corridas maiores desde a Copa do Mundo de 2015.

Além dessas mudanças, tentamos isolar as mudanças nas condições dos locais de jogos ao longo do tempo em cada década; essa abordagem é um compromisso entre o tamanho da amostra e as mudanças reais de curto prazo em um local de jogos. O uso de um horizonte de tempo mais longo também desvincula um pouco o ajuste do local do ajuste do ciclo da Copa do Mundo, o que ajuda a separar esses fatores potencialmente altamente correlacionados. Para a maioria dos locais, as mudanças são relativamente pequenas e/ou de magnitude incerta, embora haja tendências claras em locais como Headingley, que era um ambiente particularmente desafiador para batedores na década de 1980, classificado entre os 2,5% mais difíceis dos locais. No entanto, desde a virada do século, ele se tornou muito mais hospitaleiro, com totais de corridas acima da média sendo registrados após a contabilização de todos os outros fatores no modelo.