数据分析现状:这场变革如何永久改变了棒球——无论好坏

有人坚称,21世纪初席卷棒球界的分析热潮——它催生了一本畅销书和一部热门电影——不仅改变了这项运动,更将其毁了。
还有人坚信,数据和技术的涌入只让美国职业棒球大联盟的管理层、教练、球员和球迷变得更加睿智。
事实上:以不同视角看待统计数据的做法并非21世纪才出现的新现象。据信,这种做法在某种程度上始于20世纪50年代,当时一些富有创新精神的人开始意识到,传统评估球员表现的方式往往无法全面反映实际情况。
这位具有革命精神的行政主管布兰奇·里基——他当然曾签下杰基·罗宾逊并创建了小联盟培养体系——也被视为运用统计分析的先驱,他曾在《生活》杂志上发表过一篇关于上垒率早期版本的文章。
从20世纪80年代开始,身为棒球迷和有志于写作的比尔·詹姆斯便试图将思维的疆界从棒球卡背面的数字延伸至他所称的“不断拓展的数字分析领域”。詹姆斯最终与STATS公司(现为Stats Perform)合作,出版了多部关于其革命性统计方法的著作。
由于他开创性地提出了“创造得分”、“范围系数”、“胜场贡献值”、“毕达哥拉斯胜率”、“比赛得分”、“相似度得分”和“次级平均值”等统计学创新概念,他被誉为“棒球统计学之父”——美国棒球研究协会(SABR)。
詹姆斯激励了其他人也提出自己的观点、统计数据、公式、文章和书籍,例如约翰·索恩、皮特·帕尔默以及大卫·鲁瑟合著的《棒球的隐秘游戏:棒球及其统计学的革命性方法》。90年代,新信息的洪流持续涌现,此后更呈加速之势。人们逐渐意识到,统计分析绝非仅仅是作家为卖书而做,也不是球迷为了在梦幻联赛中获胜而进行的探索。
除了OPS和WHIP之外,最早出现的重要突破之一是WAR(替补球员以上胜场数),它试图将球员在场上表现出的各种不同方面整合为一个数字。但分析界很快意识到,单一数字的统计数据无法全面反映情况,于是分析师们逐渐放弃了WAR,转而提出更具体的问题,寻求更细致的答案,并采用能揭示不同信息的各类统计数据。
“我认为(这些数据)只是让你对背景有所了解,明白这件事在历史长河中的定位,而这为故事增添了新的维度。它并没有削弱故事的内涵,而是讲述完整故事的一部分。”——棒球数据分析师埃诺·萨里斯
这些信息蕴含着更深层的价值,最终,几支走投无路的球队试图从这些数据中挖掘出成功的契机。
作家迈克尔·刘易斯凭借2003年出版的《点球成金:赢在数据》一书,将高级数据分析推向了主流。该书记录了奥克兰运动家队如何利用数据指标,在受限于美国职业棒球大联盟(MLB)最低薪资预算之一的情况下,仍组建了一支具备竞争力的球队。
汤姆·唐戈和米切尔·利希特曼合著的《数据棒球:棒球中的概率游戏》(The Book: Playing the Percentages in Baseball)最初于2006年出版,旨在将詹姆斯及其著作《棒球的隐秘游戏》(The Hidden Game of Baseball)的研究推向新的高度。 然而,2011年电影版《点球成金》让棒球数据分析获得了前所未有的广泛关注,并获得了六项奥斯卡奖提名,其中包括布拉德·皮特因饰演奥克兰运动家队总经理比利·比恩而获得的提名。
2000年至2006年间,奥克兰队平均每年赢得94.9场胜利,五次打入季后赛,而其开季薪资总额仅有一年排名高于第21位。比恩拒绝了波士顿红袜队的一份丰厚邀约——红袜队认为,凭借比恩的执教,他们能够更好地发挥那支每年薪资总额均位列联盟前七的球队的潜力。 尽管遭到比恩的拒绝,红袜队及其他志在必得的球队仍不会停止尝试,力求接近奥克兰队“每美元胜场数”的比率。
红袜队聘请了一位名叫西奥·埃普斯坦的年轻耶鲁大学法学毕业生,并任命詹姆斯为高级顾问。在随后的几年里,每支球队都组建了数据分析部门,配备了拥有计算机科学、物理学、数学或相关专业高级学位的全职数据科学家。棒球赛事的报道也效仿运动家队的模式,像《Baseball Prospectus》和FanGraphs这样的数据分析网站逐渐成为主流。
“我认为(这些数据)只是让你对背景有所了解,明白这件事在历史长河中的定位,而这为故事增添了新的维度,”曾供职于FanGraphs的棒球数据分析师埃诺·萨里斯说道。“这并非有损于故事本身,而是讲述完整故事的一部分。我认为数据正是讲述完整故事的重要组成部分。”
或许最令人惊讶的并非数据对棒球运营产生了多大影响,而是它对场上战术的改变。随着每支球队都在分析这些数据指标,过去20年来,美国职业棒球大联盟的发展呈现出了完全出人意料的面貌。而那些曾经司空见惯的比赛环节,如今正逐渐走向消亡。
“触击通常是浪费时间。仔细想想,触击是棒球比赛中唯一能让双方都鼓掌的动作。这说明了什么?其实这里没有真正的赢家。”——比尔·詹姆斯
就在不久前,一支球队能否“制造得分”曾被视为其成功与否的关键指标。一支能够将跑者送上垒包、通过触击或盗垒将该跑者推进至二垒,进而设法将其从得分位置送回本垒的球队,往往能赢得比赛。而如今,一支不得不依赖“制造得分”的球队,很可能被视为一支缺乏进攻火力、饱受进攻端困扰的球队。
数据显示,在1903年至1930年间,触击——尤其是牺牲触击——成为了推进跑垒员的主要手段。 在那些赛季中,牺牲打的总数每年都超过2,000次,并在1915年“死球时代”的巅峰时期达到惊人的4,441次。四年后,棒球史上首位重炮手贝比·鲁斯以29支本垒打创下当时的联盟纪录,彻底改变了这一局面。
强力击球手的崛起不仅导致牺牲触击减少,也使得盗垒次数下降——1920年盗垒数跌破2000次,直到70年代才再次突破这一大关。当时,卢·布罗克的崛起、速度型运动家队的成功,以及大型棒球场开始铺设人造草皮,使得比赛节奏加快,从而引发了盗垒热潮的复兴。 这一趋势延续至80年代:里基·亨德森在1982年创下单季130次盗垒的纪录,文斯·科尔曼则在1985至1987年间连续三年分别完成110次、107次和109次盗垒。
但随着数据分析浪潮在90年代逐渐兴起,美国职业棒球大联盟(MLB)的盗垒尝试次数开始缓慢下降。 90年代期间,盗垒总数仅有一次未能突破3,000大关,而在2000年至2009年间,这一数字也仅出现过一次。过去四个完整赛季中,盗垒数逐年下降,2019年最终定格在2,280次——这是自1973年以来,非缩短赛季中的最低纪录。
与此同时,牺牲触击的数量下降得更为剧烈,在过去的八个完整赛季中逐年减少,从2011年的1667次降至2019年的历史最低点776次。此外,各支球队似乎已开始逐步淘汰那些需要频繁触击才能上垒的球员。
既然偷垒和触击的次数已降至历史最低水平,那么为何“制造跑垒”正逐渐成为历史?其实,数据已让各组织意识到,这种战术根本行不通。
詹姆斯在2011年接受美国国家公共电台(NPR)采访时解释了原因,尽管在类固醇时代末期,盗垒数曾出现小幅回升,并在2010年和2011年达到3200次:“盗垒确实能增加一些得分,但数量很少,而且因跑垒员被抓而损失的得分往往远多于通过盗垒获得的得分。此外,关键时刻的击球既难以预测,也不够可靠。 真正能增加得分的办法,是让更多跑者上垒。”
“触击通常是浪费时间。仔细想想,触击是棒球比赛中唯一能让双方都鼓掌的动作,”他补充道。“这说明了什么?其实这里没人真正赢。”
或者,正如皮特在电影版《点球成金》中饰演比恩时所说:“如果有人对我们打触击,你就捡起来传给一垒。他们是在送你一个出局数——简直是白送。接住它,然后说声谢谢。”
他还说:“别再偷垒了。我付钱让你安全上垒,可不是让你在二垒被抓出局。”
原因在于,只有当跑垒员的盗垒成功率达到一定比例时,盗垒才具有价值。2019赛季结束时,盗垒成功率的盈亏平衡点为68.7%。因此,盗垒成功率高于68.7%的跑垒员能带来正向价值,而成功率低于该比例的则会产生负向价值。
在克里斯蒂安·耶利奇(32次盗垒尝试成功30次)的带领下,2019赛季仅有29名符合资格的球员以高于“盈亏平衡点”的盗垒成功率结束赛季。而在1987年,当美国职棒大联盟(MLB)以3,585次盗垒创下现代时代纪录时,此类球员多达58名。
棒球数据的涌入也引发了该领域的一场重大变革。投球构图——即捕手通过向裁判展示投球的方式,将球转化为好球的能力——已成为评估捕手表现的重要指标。自2008年PITCHf/x追踪系统在所有大联盟球场全面启用,作为评估和评定裁判表现的手段以来,投球构图指标已日益成为主流。
有人认为“接球造好球”的技巧应被视为作弊——一种欺骗裁判的方式。2019年大联盟“接球造好球”得分榜首的奥斯汀·赫奇斯对此持不同意见。他告诉MLB.com,与其说他在“偷好球”,不如说他的投手们投得精准到位,而他只是竭尽全力确保裁判注意到这些投球的质量。
虽然数据分析表明,自PITCHf/x技术引入以来,裁判的判罚准确率有所提高,但波士顿大学的一项研究显示,在2008年至2018年间,裁判的误判率至少达到20%。当击球手面临两好球时,误判率升至29%。数据还显示,2018年共有55场比赛因裁判的误判而结束。
由于本垒后方判罚的失误屡见不鲜,对“机器人裁判”的支持声浪日益高涨。美国职棒大联盟(MLB)已与独立联盟大西洋联盟达成一项为期三年的协议,正在测试一套计算机化系统。在职业大联盟正式采用这项技术之前,拥有一名擅长“投球框架”的捕手将具有巨大的价值。尤其是考虑到击球手的平均打击率会随着球数变化而发生巨大波动。
“最关键的往往是那些被判为好球的第三球,”赫奇斯说道,“但这更多是关于改变球数。关键在于0-0或1-1的投球……我们越能将球数扭转为0-1或1-2,就越能直接形成出局。”
“绝不打滚地球。滚地球就是出局。如果你看到我打出滚地球,哪怕是安打,我也能告诉你:那纯属意外。”——三垒手乔什·唐纳森
此外,还有数据可以显示对手击球手可能将球击向何处,因此各队开始尝试在这些区域增派防守球员,即使这意味着要让他们离开原有的守备位置。结果,这种“防守移位”——70年前当各队为了对付泰德·威廉姆斯而将三名内场手移至二垒一侧时,曾被视为一种怪异的做法——如今已变得司空见惯。
随着这一战术的普及,以内场防守阵型调整告终的打席次数从2012年的8,505次上升至2019年的历史最高值39,484次。在此期间,采用防守阵型调整的打席占比从2012年的4.62%飙升至2019年的21.17%。
在这项运动中,任何行动都会引发相应的反应。每当出现一项战术创新,对手总会采取相应的应对措施。在这种情况下,击球手们一方面试图规避防守方的站位调整,另一方面则力求更好地发挥自身优势——包括较小的球场,以及某些年份使用弹性更强的棒球。对击球出棒角度的痴迷由此而生。
2017年,《华盛顿邮报》报道称,许多击球手将“防守位移”视为他们选择专注于击出高飞球的主要原因,此前多年,击球教练一直要求他们击出低平线驱球。 高弹道角度在联盟中如野火般蔓延,据MLB旗下网站Baseballsavant的数据,平均弹道角度(即击球后球的飞行角度)从2015年的10.1度上升至2016年的10.8度、2018年的11.7度、2019年的12.2度,以及2020年的12.7度。
自19世纪90年代“砍球”战术(即“巴尔的摩砍球”)问世以来,我们已经走过了很长一段路。
“绝不打滚地球,”三度入选全明星的三垒手乔什·唐纳森对《华盛顿邮报》说道,他的语气几乎与皮特笔下的人物谈论触击战术时的口吻如出一辙。“滚地球就是出局。如果你看到我打出滚地球,哪怕是安打,我也能告诉你:那纯属意外。”
“如果你观察棒球场,看看内场,那里有很多球员。再看看外场,那里的球员较少,草地更多。所以,如果你把球打到空中,哪怕力度不大,也有机会。”
球员们确实奉行这一理念,2020年的滚地球击球率仅为43.3%,这是自Stats Perform于1987年开始记录该数据以来的最低值。 不出所料,每打席击出一垒安打的比例也降至13.6%的历史最低点,而三垒安打——长期以来被视为棒球比赛中最具观赏性的击球之一——仍维持在0.4%的历史最低水平。
另一方面,本垒打占所有打席的3.5%。这一比例较2019年的3.6%仅略有下降,而2019年当年的本垒打总数达到了6,776支,创下了单赛季纪录。
加之各支球队在21世纪对速球型投手愈发青睐,这种以击球出棒角度为导向的打法,也导致在赛程缩短的2020赛季中,三振率创下历史新高的23.4%。这一比例如今已连续15个赛季攀升,令人略感忧虑。
| 赛季 | HRs | %PA/HR | Ks | %PA/K |
|---|---|---|---|---|
| 1915 | 635 | 0.5 | 14,115 | 10.2 |
| 1925 | 1,169 | 1.2 | 6,687 | 6.9 |
| 1935 | 1,325 | 1.4 | 8,016 | 8.3 |
| 1945 | 1,007 | 1.1 | 8,051 | 8.5 |
| 1955 | 2,224 | 2.3 | 10,825 | 11.4 |
| 1965 | 2,688 | 2.2 | 19,283 | 15.7 |
| 1975 | 2,698 | 1.8 | 19,280 | 13.0 |
| 1985 | 3,602 | 2.2 | 22,451 | 14.0 |
| 1995 | 4,081 | 2.6 | 25,425 | 16.2 |
| 2005 | 5,017 | 2.7 | 30,644 | 16.4 |
| 2015 | 4,909 | 2.7 | 37,446 | 20.4 |
| 2020* | 2,304 | 3.5 | 15,586 | 23.4 |
(*60场比赛的赛季)
坦帕湾光芒队——其数据分析方法曾在乔纳·凯里2011年出版的《那额外的2%:华尔街策略如何让一支大联盟球队从垫底跃居榜首》一书中有所记载——在击球出棒角度这一概念刚出现时,便开始思考如何应对。他们被视为这一潮流的先驱,坚信投出高速的高位快速球能够抑制击球手的进攻策略。
2019年,坦帕湾队似乎终于拥有了一支能够凭借这一战术大放异彩的投手阵容——其快速球平均时速达93.97英里,在全联盟排名第六——他们将45.7%的快速球投在好球带上方或好球带外侧,这一比例位居联盟之首。 这一策略成效显著:光芒队最终以1,621次三振位列联盟第三,453次保送位列联盟第四少,且仅被击出181支本垒打——这一数据为大联盟最少。
不过,总体而言,这项运动在持续演变过程中出现的最新趋势却产生了一种意想不到的副作用,这也是罗布·曼弗雷德(Rob Manfred)委员希望加以纠正的问题。三振次数的增加导致投球数增多,而投球数的增加又导致比赛时间延长。2020年,美国职棒大联盟(MLB)以每次击球机会3.96球的成绩,连续第五年刷新纪录。此外,由于三振次数创下历史新高、本垒打率达到历史水平,以及小型球场界外区缩小,导致进入比赛的球数减少。
2017年,一场九局比赛的平均耗时达到3小时8分钟——较2005年的2小时46分钟有所增加——曼弗雷德随后实施了多项改革。联盟对投手丘探访次数进行了限制,缩短了广告时段,并取消了故意保送时的投球。 2019年,美国职棒大联盟(MLB)规定, relief pitcher(中继投手)必须面对至少三名打者或完成一局比赛后方可被换下,并宣布将在2021年保留七局制的双重赛,以及在延长局中继续采用二垒有人开局规则。
至于在瞬息万变的分析领域,下一步会如何发展?嗯,就像防守阵型调整一样,一些高管认为,要应对创纪录的高飞球率,下一步就是更频繁地采用四外野手阵型。这种阵型在2017年仅使用过一次,但在过去的两个完整赛季中,其使用频率已大幅增加。
当然,光芒队一直是这一战术的引领者。据美国职棒大联盟(MLB)统计,他们在2020年常规赛期间共在60个对手打席中采用了四外野手阵容——这一数字超过了全联盟总数的半数。在美联分区系列赛的前两场比赛中,坦帕湾队也在四个打席中采用了四外野手阵容。
虽然像比恩这样的人传统上一直是棒球数据分析运动的推动者,但这种情况在最近发生了变化,数据和科技公司正助力这一运动迈入新阶段。随着越来越多的读者和观众渴望成为更懂行的球迷,先进的统计指标和历史数据不仅提升了棒球撰稿人的分析水平,还在帮助各大电视台将转播带入现代时代方面发挥了重要作用。
2015年,美国职业棒球大联盟高级媒体公司(Major League Baseball Advanced Media)在各大联盟棒球场安装了Statcast系统——该系统融合了雷达技术和追踪摄像头——从而正式进军球员追踪领域。Statcast能够捕捉诸如投手球速和旋转率、击球手出棒速度和击球角度、外野手的最高速度和跑位效率,以及击球被接杀概率等数据。
各支球队正利用这些数据来补充球员评估;记者们则借助这些数据来丰富对棒球运动员和赛事的描述;而解说员们则通过在回放和精彩集锦中叠加Statcast图表来充分利用这些数据。
萨里斯认为,下一项重大突破将体现在游戏技术从雷达转向光学技术。光学技术能够以雷达无法企及的方式分析球员的身体和四肢动作。
希望这项技术不仅能通过投球释放点的变化判断投手是否疲劳,或是否需要在比赛中即时调整投球动作,还能作为预防和/或预测伤病的手段。
“我正在学习生物力学,因为这能帮助我们了解如何最有效地运用身体,”他解释道,“这样一来,我们就能更确切地说明手臂应该处于什么位置,在挥棒的某个特定时刻球棒应该在哪里,而且在公共和私人领域,我们都会拥有更多与此相关的数据。 我们将更多地探讨身体在空间中的运动方式。”
《体育画报》通过描述各支球队正在展开的竞赛——即利用数据和生物力学来培养击球手——来支持萨里斯的理论;而这些技术正是投手们一直以来所采用的。
芝加哥小熊队在2020赛季开始前聘请贾斯汀·斯通担任击球总监,此前他已在该队担任了一年的生物力学击球顾问;如今,越来越多的技术型教练被聘为击球总监和战术顾问,其数量之多前所未有。 斯通拥有一处训练基地,配备了肌电图(EMG)设备——用于测量挥棒过程中肌肉的收缩情况——以及经过重新设计的击球架、地面力板和3D运动学传感器。
很明显,科技正在棒球界迅速普及——随之而来的,还有新一轮的数据分析浪潮。
喜欢这篇文章吗?订阅 《分析师》 ,每周五即可收到来自Stats Perform的五篇精选文章。完全免费。








