O estado da análise de dados: como essa tendência mudou para sempre o beisebol – para melhor ou para pior

Há quem afirme que o movimento analítico que se espalhou pelo beisebol no início dos anos 2000, inspirando um livro best-seller e um filme de sucesso, não apenas mudou o esporte, mas o arruinou.
Outros defendem que o avanço da tecnologia e a avalanche de dados só serviram para tornar as diretorias, os treinadores, os jogadores e os torcedores da Major League Baseball mais informados.
A verdade é que: a prática de analisar as estatísticas de uma maneira diferente não é uma tendência do século XXI. Acredita-se que ela tenha surgido, em certa medida, na década de 1950, quando algumas pessoas inovadoras começaram a perceber que as formas tradicionais de avaliar o desempenho dos jogadores muitas vezes não revelavam o quadro completo.
O revolucionário dirigente Branch Rickey, que, como se sabe, contratou Jackie Robinson e criou o sistema de ligas menores, também é considerado um pioneiro no uso da análise estatística por ter escrito um artigo na revista Life sobre uma versão inicial da porcentagem de chegadas à base.
A partir da década de 1980, o torcedor e aspirante a escritor Bill James tentou ampliar o raciocínio além dos números impressos no verso dos cartões de beisebol, levando-o ao que ele chamou de “linha de análise numérica em constante expansão”. James acabou trabalhando com a STATS, Inc. — hoje Stats Perform — para publicar livros sobre suas estatísticas revolucionárias.
Graças ao seu trabalho, que introduziu inovações estatísticas como corridas criadas, fator de alcance, win shares, porcentagem de vitórias pitagórica, pontuação do jogo, pontuações de similaridade e média secundária, ele viria a ser conhecido como o “Padrinho da Sabermetria” – pela Sociedade para a Pesquisa do Beisebol Americano (SABR).
James inspirou outros a seguirem seus passos com suas próprias ideias, estatísticas, fórmulas, artigos e livros, como John Thorn, Pete Palmer e David Reuther, com sua obra “The Hidden Game of Baseball: A Revolutionary Approach to Baseball and Its Statistics”. O fluxo de novas informações continuou a evoluir na década de 90 e se acelerou a partir daí. Ficou claro que a análise estatística não era apenas algo que os escritores faziam para vender livros ou que os fãs exploravam na tentativa de vencer suas ligas de fantasia.
Além do OPS e do WHIP, um dos primeiros grandes avanços foi o WAR (wins above replacement), que tentava reunir as diversas ações de um jogador em campo e traduzi-las em um único número. Mas a comunidade analítica logo percebeu que as estatísticas resumidas a um único número não conseguem retratar o quadro completo, e os analistas deixaram de lado o WAR para se concentrar em questões mais específicas, com respostas mais precisas e estatísticas diferentes que revelam aspectos distintos.
“Acho que (os dados) apenas dão uma noção do contexto e do lugar que isso ocupa na história, e acho que isso acrescenta uma história a ser contada. Não diminui o valor. Faz parte de contar a história completa.” – Eno Sarris, escritor especializado em análise de beisebol
Havia um valor mais profundo nessas informações e, por fim, algumas equipes desesperadas tentaram extrair sucesso desses dados.
O autor Michael Lewis popularizou a análise avançada com o livro de 2003 “Moneyball: A Arte de Vencer um Jogo Desleal”, que narrava como o Oakland Athletics utilizou métricas para montar um time competitivo, apesar de estar limitado por um dos menores orçamentos da MLB.
O livro “The Book: Playing the Percentages in Baseball”, de Tom Tango e Mitchel Lichtman, publicado originalmente em 2006, tinha como objetivo levar o trabalho de James e “The Hidden Game of Baseball” a um novo patamar. A adaptação cinematográfica de “Moneyball”, no entanto, deu à análise estatística do beisebol sua maior exposição até então em 2011 e foi indicada a seis Oscars, incluindo Brad Pitt por interpretar o papel do gerente geral do A’s, Billy Beane.
O Oakland registrou uma média de 94,9 vitórias e chegou aos playoffs cinco vezes, tendo ficado acima da 21ª posição no ranking de folha salarial no início da temporada apenas uma vez entre 2000 e 2006. Beane recusou uma oferta lucrativa do Boston Red Sox, que acreditava que ele poderia ajudá-los a tirar mais proveito de uma folha salarial que figurou entre as sete maiores em cada um desses anos. A recusa de Beane não impediria o Red Sox e outras franquias determinadas de tentar se aproximar da relação vitórias por dólar de Oakland.
O Red Sox contrataria um jovem recém-formado em Direito pela Universidade de Yale chamado Theo Epstein, e James como consultor sênior. Nos anos seguintes, todas as organizações criariam um departamento de análise repleto de cientistas de dados em tempo integral, com pós-graduação em ciência da computação, física, matemática ou áreas afins. A cobertura do esporte seguiu o modelo do A’s, com sites analíticos como o Baseball Prospectus e o FanGraphs se tornando parte do mainstream.
“Acho que (os dados) apenas dão uma noção do contexto e do lugar que isso ocupa na história, e acho que isso acrescenta uma história a ser contada”, disse o escritor especializado em análise de beisebol Eno Sarris, ex-colaborador do FanGraphs. “Isso não diminui o valor. Faz parte de contar a história completa. Acho que os números fazem parte de contar a história completa.”
Talvez o mais surpreendente não seja tanto a forma como os dados influenciaram as operações do beisebol, mas sim o impacto que tiveram na estratégia em campo. Com todas as franquias analisando os indicadores, a Major League Baseball evoluiu nos últimos 20 anos de maneiras totalmente inesperadas. E aspectos do jogo que antes eram comuns estão agora sofrendo uma morte lenta.
“O bunt geralmente é uma perda de tempo. Se você pensar bem, o bunt é a única jogada no beisebol que ambas as equipes aplaudem. Então, o que isso nos diz? Na verdade, ninguém está ganhando aqui.” – Bill James
Não faz muito tempo, a capacidade de uma equipe de “fabricar corridas” era vista como algo intimamente ligado ao seu sucesso. Um time que conseguisse colocar alguém na base, levá-lo para a segunda base com um bunt ou um roubo de base e, em seguida, encontrasse uma maneira de impulsioná-lo a partir da posição de pontuação, tinha chances de vencer alguns jogos. Hoje, uma equipe que precisa recorrer à “fabricação de corridas” provavelmente será considerada um time sem poder ofensivo, com mais do que sua cota de problemas no ataque.
Os dados revelam que o bunt — especialmente o bunt de sacrifício — tornou-se o principal método para avançar os corredores entre 1903 e 1930. O número total de sacrifícios ultrapassou 2.000 em cada uma dessas temporadas e atingiu o pico de impressionantes 4.441 no auge da era da bola morta, em 1915, antes que Babe Ruth, o primeiro rebatedor de peso do esporte, mudasse tudo quatro anos depois ao bater 29 home runs, um recorde da liga na época.
O surgimento dos rebatedores de força levou não só a uma diminuição nos bunts de sacrifício, mas também nas bases roubadas, que caíram para menos de 2.000 em 1920 e não voltaram a ultrapassar essa marca até a década de 1970, quando Lou Brock, o sucesso dos velozes A’s e a chegada do Astroturf nos grandes estádios tornaram o jogo mais rápido e deram início a um renascimento das bases roubadas. Isso continuou na década de 1980, quando Ricky Henderson roubou um recorde de 130 bases em 1982 e Vince Coleman roubou 110, 107 e 109 bases entre 1985 e 1987.
Mas, à medida que o movimento analítico começou a ganhar força na década de 90, a MLB registrou uma queda gradual nas tentativas de roubo de base. Depois de não ter ultrapassado a marca de 3.000 apenas uma vez na década de 90, o total de roubos de base atingiu essa marca apenas uma vez entre 2000 e 2009. Os roubos de base também diminuíram em cada uma das últimas quatro temporadas completas, chegando a 2.280 em 2019 – o menor número em uma temporada não encurtada desde 1973.
Os bunts de sacrifício, por sua vez, sofreram uma queda ainda mais acentuada, diminuindo em cada uma das últimas oito temporadas completas, passando de 1.667 em 2011 para um mínimo histórico de 776 em 2019. Além disso, as equipes parecem ter começado a deixar de escalar jogadores que precisam fazer bunts com frequência para chegar à base.
Então, com os índices de roubos e rebatidas curtas em níveis historicamente baixos, por que as jogadas de corrida na produção estão lentamente se tornando coisa do passado? Bem, os dados ajudaram as organizações a perceberem que isso simplesmente não funciona.
James explicou o motivo em uma entrevista à NPR em 2011, mesmo quando as bases roubadas estavam voltando a crescer um pouco no final da era dos esteróides e chegaram a 3.200 em 2010 e 2011: “Roubar bases acrescenta alguns pontos, mas muito poucos, e você perde a maioria dos pontos que ganha quando os corredores são eliminados ao tentar roubar uma base. E rebater em momentos decisivos é imprevisível e pouco confiável. A maneira de realmente marcar mais corridas é colocando mais pessoas nas bases.”
“O bunt geralmente é uma perda de tempo. Se você pensar bem, o bunt é a única jogada no beisebol em que ambos os lados aplaudem”, acrescentou ele. “Então, o que isso nos diz? Na verdade, ninguém está ganhando aqui.”
Ou, como disse Pitt ao interpretar Beane na versão cinematográfica de Moneyball: “Se alguém fizer um bunt contra a gente, basta pegar a bola e lançá-la para a primeira base. Eles estão te dando uma eliminação – simplesmente te dando. Aceita. Agradece.”
Ele também disse: “Chega de roubar. Eu te pago para chegar à primeira base, não para ser eliminado na segunda.”
Isso porque roubar uma base só traz valor se o corredor tiver sucesso em uma determinada porcentagem das tentativas. No final da temporada de 2019, o ponto de equilíbrio da porcentagem de bases roubadas era de 68,7%. Portanto, um corredor que rouba bases com uma porcentagem superior a 68,7% agrega valor positivo, enquanto aquele com uma porcentagem inferior agrega valor negativo.
Liderados por Christian Yelich, que teve 30 acertos em 32 tentativas de roubo de base, apenas 29 jogadores qualificados terminaram a temporada de 2019 com uma porcentagem de roubos de base acima do ponto de equilíbrio. Em 1987, havia 58 jogadores nessa situação, quando a MLB estabeleceu um recorde da era moderna com 3.585 roubos de base.
O fluxo de dados sobre beisebol também provocou uma grande revolução na área. O “pitch framing” — a habilidade do receptor em transformar uma bola em um strike por meio da forma como apresenta o arremesso ao árbitro — tornou-se um elemento fundamental na avaliação do receptor. As métricas de framing têm se tornado cada vez mais comuns desde que o sistema de rastreamento PITCHf/x passou a ser utilizado em todos os estádios da liga principal, em 2008, como forma de avaliar e classificar os árbitros.
Há quem acredite que a arte do “framing” deva ser considerada uma trapaça – uma forma de enganar o árbitro. Austin Hedges, que liderou a liga principal em corridas marcadas por “framing” em 2019, discorda, tendo declarado ao MLB.com que não está “roubando strikes”, mas sim que seus arremessadores estão acertando os pontos certos e ele está fazendo o possível para garantir que o árbitro perceba a qualidade dos arremessos.
Embora as análises tenham demonstrado que a precisão dos árbitros melhorou desde a introdução da tecnologia PITCHf/x, um estudo da Universidade de Boston revelou que os árbitros cometeram erros em pelo menos 20% das decisões entre 2008 e 2018. Quando os rebatedores estavam com duas strikes, a taxa de erro aumentava para 29%. Os dados também revelaram que 55 jogos foram encerrados devido a decisões erradas dos árbitros em 2018.
Devido à imprecisão generalizada atrás do prato, há um apoio crescente aos “árbitros robóticos”. E a MLB já está testando um sistema computadorizado como parte de um acordo de três anos com a Atlantic League, uma liga independente. Até que as ligas principais implementem essa tecnologia, ter um receptor que se destaque no “pitch framing” deve ser de enorme valor. Especialmente quando se leva em conta o quanto a média de um rebatedor muda drasticamente dependendo da contagem.
“Os mais interessantes são os chamados ‘strike três’”, disse Hedges. “Mas o importante é mudar a contagem. É aquele arremesso em 0-0 ou aquele em 1-1. … Quanto mais conseguirmos mudar a contagem para 0-1 ou 1-2, mais isso se traduz diretamente em eliminações.”
“Nada de bolas rasteiras. Bolas rasteiras são eliminações. Se você me vir rebater uma bola rasteira, mesmo que seja uma rebatida válida, posso garantir: foi um acidente.” – Josh Donaldson, terceira base
Existem também dados que indicam para onde os rebatedores adversários tendem a rebater a bola, de modo que as equipes começaram a experimentar a colocação de jogadores defensivos adicionais nessas áreas, mesmo que isso significasse tirá-los de suas posições tradicionais. Como resultado, a mudança defensiva — considerada uma excentricidade quando os clubes deslocaram três jogadores do campo interno para um lado da segunda base contra Ted Williams há 70 anos — tornou-se comum.
Depois que a estratégia começou a se popularizar, o número de turnos ao bastão que terminaram com uma mudança na defesa interna subiu de 8.505 em 2012 para um recorde histórico de 39.484 em 2019. Nesse período, a porcentagem de turnos ao bastão em que houve mudanças na defesa disparou de 4,62% em 2012 para 21,17% em 2019.
Neste jogo, toda ação tem uma reação. Para cada inovação estratégica, há uma resposta da oposição. Nesse caso, os rebatedores procuraram contornar a mudança defensiva e, ao mesmo tempo, tirar melhor proveito de seus pontos fortes: estádios menores e, em alguns anos, uma bola mais viva. Nasceu assim o fascínio pelo ângulo de lançamento.
Em 2017, o Washington Post noticiou que muitos rebatedores citaram a mudança de posicionamento da defesa como a principal razão pela qual optaram por se concentrar em rebater a bola para o alto, depois de anos em que os treinadores de rebatidas lhes diziam para rebater bolas rasas e retas. Os ângulos de lançamento elevados se espalharam pela liga como fogo, e o ângulo médio de lançamento – o ângulo em que a bola voa após ser rebatida – subiu de 10,1 graus em 2015 para 10,8 em 2016, 11,7 em 2018, 12,2 em 2019 e 12,7 em 2020, de acordo com o site baseballsavant da MLB.
Percorremos um longo caminho desde que a prática de derrubar o adversário com uma pancada na bola (conhecida como “Baltimore Chop”) foi criada na década de 1890.
“Nada de bolas rasteiras”, disse ao *Washington Post* o terceira-base Josh Donaldson, três vezes selecionado para o All-Star, quase repetindo a maneira como o personagem de Pitt falava sobre o bunt. “Bolas rasteiras são eliminações. Se você me vir rebater uma bola rasteira, mesmo que seja uma rebatida válida, posso garantir: foi um acidente.”
“Se você olhar para um campo de beisebol e observar o campo interno, verá que há muitos jogadores ali. Se olhar para o campo externo, há menos jogadores e mais grama. Portanto, se você rebater a bola para o alto, mesmo que não seja com muita força, você tem uma chance.”
Os jogadores estão, de fato, aderindo a essa filosofia, já que a porcentagem de rebatidas rasteiras em 2020 foi de apenas 43,3% — a mais baixa desde que a Stats Perform começou a registrar esses dados em 1987. Como era de se esperar, a média de rebatidas simples por aparição no bastão também caiu para o menor nível de todos os tempos, 13,6%, e as rebatidas triplas – há muito consideradas uma das jogadas mais emocionantes do esporte – permaneceram no nível mais baixo de todos os tempos, 0,4%.
Por outro lado, foram marcados home runs em 3,5% de todas as vezes em que os rebatedores foram ao bastão. Esse número representa uma queda apenas ligeira em relação aos 3,6% registrados em 2019, quando foi estabelecido o recorde de uma única temporada com 6.776 home runs no total.
Aliada à ênfase que as equipes têm dado aos arremessadores de alta velocidade ao longo do século XXI, a abordagem baseada no ângulo de lançamento também levou a um recorde histórico de 23,4% de todas as aparições no bastão que resultaram em um strikeout na temporada encurtada de 2020. Essa taxa vem aumentando há 15 temporadas consecutivas, o que é um tanto preocupante.
| Temporada | RH | %PA/HR | Ks | %PA/K |
|---|---|---|---|---|
| 1915 | 635 | 0.5 | 14,115 | 10.2 |
| 1925 | 1,169 | 1.2 | 6,687 | 6.9 |
| 1935 | 1,325 | 1.4 | 8,016 | 8.3 |
| 1945 | 1,007 | 1.1 | 8,051 | 8.5 |
| 1955 | 2,224 | 2.3 | 10,825 | 11.4 |
| 1965 | 2,688 | 2.2 | 19,283 | 15.7 |
| 1975 | 2,698 | 1.8 | 19,280 | 13.0 |
| 1985 | 3,602 | 2.2 | 22,451 | 14.0 |
| 1995 | 4,081 | 2.6 | 25,425 | 16.2 |
| 2005 | 5,017 | 2.7 | 30,644 | 16.4 |
| 2015 | 4,909 | 2.7 | 37,446 | 20.4 |
| 2020* | 2,304 | 3.5 | 15,586 | 23.4 |
(*Temporada de 60 jogos)
O Tampa Bay Rays, cujas estratégias analíticas foram relatadas no livro de Jonah Keri de 2011,intitulado“The Extra 2%: How Wall Street Strategies Took a Major League Baseball Team From Worst toFirst” (Os2% amais: como estratégias de Wall Street levaram um time da Major League Baseball da última para a primeira posição),começou apensar em maneiras de neutralizar o ângulo de lançamento assim que esse conceito surgiu. O time era considerado pioneiro no movimento que defendia que lançar bolas rápidas altas em alta velocidade poderia neutralizar a abordagem de rebatida.
Em 2019, o Tampa Bay parecia finalmente ter o elenco de arremessadores – que ficou em sexto lugar na liga principal, com uma média de 93,97 mph nas bolas rápidas – para ter sucesso com essa estratégia, lançando 45,7% de todas as bolas rápidas na parte alta da zona de strike ou na parte alta fora da zona, o maior índice da liga. Isso se mostrou eficaz, já que os Rays terminaram com o terceiro maior número de strikeouts (1.621), o quarto menor número de bases por bolas (453) e sofreram apenas 181 home runs – o menor número da liga principal.
No entanto, de modo geral, a mais recente tendência na evolução contínua do jogo gerou um efeito colateral indesejado, que o comissário Rob Manfred espera corrigir. O aumento do número de strikeouts levou a um aumento no número de arremessos, e o aumento no número de arremessos resultou em partidas mais longas. A MLB bateu um recorde pelo quinto ano consecutivo, com 3,96 arremessos por vez no bastão em 2020. Além disso, há menos bolas em jogo devido ao número recorde de strikeouts, à taxa histórica de home runs e à redução da área de falta em estádios menores.
Manfred implementou várias mudanças depois que a duração média de um jogo de nove entradas chegou a três horas e oito minutos em 2017 — um aumento em relação às 2h46 de 2005. A liga impôs limites às visitas ao monte, reduziu os intervalos comerciais e eliminou os arremessos nas bases por bolas intencionais. Em 2019, a MLB determinou que um arremessador de relevo deveria enfrentar pelo menos três rebatedores ou terminar uma entrada antes de poder ser substituído e anunciou que manteria as partidas duplas de sete entradas e continuaria a colocar um corredor na segunda base nas entradas extras em 2021.
Quanto ao que vem por aí no mundo em constante evolução da análise de dados, bem, assim como a mudança defensiva, alguns executivos acreditam que o próximo passo para defender a taxa histórica de bolas altas é implementar com mais frequência uma formação com quatro jogadores no campo externo. Essa formação cresceu drasticamente nas últimas duas temporadas completas, depois de ter sido usada apenas uma vez em 2017.
É claro que os Rays têm sido os pioneiros nessa tendência. De acordo com a MLB, eles utilizaram uma formação com quatro jogadores no campo externo em 60 turnos de rebatida dos adversários durante a temporada regular de 2020 – mais da metade do total da liga. O Tampa Bay também recorreu a quatro jogadores no campo externo em quatro turnos de rebatida nos dois primeiros jogos da ALDS.
Embora pessoas como Beane tenham tradicionalmente estado por trás do movimento analítico do beisebol, isso mudou mais recentemente, com empresas de dados e tecnologia contribuindo para a próxima fase. Com um número crescente de leitores e telespectadores ansiosos por se tornarem fãs mais informados, métricas avançadas e dados históricos aprimoraram as análises dos jornalistas especializados em beisebol e desempenharam um papel fundamental na capacidade das emissoras de levar a transmissão para a era moderna.
A Major League Baseball Advanced Media deu um passo no mundo do rastreamento de jogadores em 2015, quando instalou o sistema Statcast — uma combinação de tecnologia de radar e câmeras de rastreamento — em todos os estádios da liga principal. O Statcast é capaz de capturar dados como a velocidade e a taxa de rotação de um arremessador, a velocidade de saída e o ângulo de lançamento de uma bola rebatida, a velocidade máxima e a eficiência de deslocamento dos jogadores do campo externo, bem como a probabilidade de uma bola rebatida ser capturada.
As equipes estão complementando as avaliações dos jogadores com esses dados, os jornalistas estão usando-os para aprimorar suas descrições de jogadores e eventos de beisebol, e os locutores estão aproveitando a oportunidade para sobrepor gráficos do Statcast em replays e destaques.
Sarris acredita que a próxima grande novidade está relacionada à transição do jogo da tecnologia de radar para a tecnologia óptica. A tecnologia óptica tem a capacidade de analisar os movimentos do corpo e dos membros dos jogadores de uma forma que o radar nunca conseguiu.
A esperança é que a tecnologia não só consiga identificar quando um arremessador está cansado devido a uma mudança no ponto de lançamento ou quando ele precisa fazer um ajuste imediato em sua mecânica, mas também sirva como uma forma de prevenir e/ou prever lesões.
“Estou tentando aprender sobre biomecânica porque isso nos permite compreender melhor como usar o corpo da maneira ideal”, explicou ele. “Assim, poderemos afirmar com mais precisão onde o braço deve estar, onde o taco deve estar em um determinado momento do swing, e teremos mais dados relacionados a esse tipo de coisa, tanto no âmbito público quanto no privado. Vamos falar mais sobre como os corpos se movem no espaço.”
A Sports Illustrated corroborou a teoria de Sarris ao descrever a corrida que está ocorrendo entre as equipes para desenvolver rebatedores por meio de dados e biomecânica — tecnologias que já vêm sendo utilizadas pelos arremessadores.
O Chicago Cubs contratou Justin Stone para o cargo de diretor de rebatidas antes da temporada de 2020, após um ano como consultor de bio-cinemática de rebatidas da equipe, e cada vez mais treinadores com formação em tecnologia estão sendo contratados como diretores e estrategistas de rebatidas. Stone possui um centro de treinamento que utiliza eletromiografia (EMG) – que mede a eficiência da ativação muscular durante o swing –, suportes de rebatidas reprojetados, placas de força no solo e sensores cinemáticos 3D.
É óbvio que a tecnologia está se disseminando rapidamente no beisebol – e, com ela, a próxima onda de análises.
Gostou? Inscreva-se no The Analyst para receber cinco matérias todas as sextas-feiras da Stats Perform. É grátis.








