主要收获
- 英格兰队出色的击球阵容可与几支传奇的世界杯冠军队媲美。
- 与世界杯上的对手相比,英格兰队的保龄球队相对较弱。
- 从国内 50 回合板球比赛来看,詹姆斯-文斯(James Vince)是取代亚历克斯-黑尔斯(Alex Hales)成为后备上单击球手的最佳人选。
- 乔弗拉-阿彻在 T20 高射、IPL 和 Big Bash 联赛中的表现水平可与在这些联赛中打球的精英快速保龄球手媲美,尽管所需的技能组合与 50 回合制比赛不同。
今年夏天对于英格兰板球运动来说是一个重要的夏天,这已经是老生常谈了。早期的国内赛季是开端,由于顶级击球手在测试队中的潜在机会以及夏末即将举行的灰烬系列赛的甜点课程,人们对这个夏天的关注度有所提高。不过,最重要的还是将于5月30日至 7 月 14 日在英格兰和威尔士举行的世界杯单日国际赛(ODI)。
英格兰队不仅是国际板球理事会官方排名第一的球队,而且是通过积极进取、令人兴奋的板球品牌取得这一成绩的。2016 年,他们以 444 分创造了新的 ODI 最高单局总分纪录,随后在 2018 年对阵澳大利亚队时以 481 分刷新了自己的纪录。在本届世界杯周期之前,英格兰队曾两次突破 350 分;自 2015 年 5 月以来,他们已经 13 次突破 350 分。这是一支与以往不同的英格兰队。
以下文章介绍了 OptaPro 数据科学团队正在开发的模型得出的球队和球员表现评级。其目的是在英格兰队开始世界杯最后备战并确定阵容时,概述英格兰队的优势、劣势和选择方案。
量化团队实力
从建模和分析的角度来看,国际板球比赛是一个极具挑战性的环境。不均衡的赛程、五大洲的各种条件以及各种场地都会对成绩和状态产生重大影响。对规则的经常性修改,以及不断发展和更快得分的能力,都给历史视角带来了困难。此外,由于业余选手可以与年薪数百万的球星同场竞技,各队之间的相对能力可能存在差距。
比赛的表现和结果可能大起大落,例如,今年 2 月27日,英格兰队在 50 局比赛中打出 418 分,丢掉 6 个小门,最终以 29 分的优势击败西印度群岛队。仅仅三天后的 3 月2 日,英格兰队在 28.1 局比赛中以 113 分被淘汰出局,最终以 7 个小门之差落败,而当时西印度群岛队的比赛还剩下近 38 局。考虑到这些因素和变数,量化表现水平是一项艰巨的任务。
然而,板球是一项积累了丰富知识和智慧的运动;澳大利亚和孟加拉国的条件通常不同,英格兰和西印度群岛的条件也不同。某些场地以善待击球手而著称,而另一些场地则鼓励保龄球。虽然各队之间没有系统的赛程安排,但定期的对阵确实能让人了解各队的相对强项和弱项,尤其是在多场系列赛中。虽然较弱的 "准 "成员每年的比赛数量不多,但我们可以大致推测他们相对于老牌国家队的能力,从而为我们的方法提供参考。
这些信息非常适合制定贝叶斯建模方法,利用这些先验智慧来确定可能影响成绩的因素的影响。我们使用PyMC3定义了一个分层马尔可夫链蒙特卡洛(MCMC)模型,以确定国际板球队在各个世界杯周期中的实力;这些 3-4 年的周期是以牺牲实际较小规模的成绩变化为代价而增加样本量的折衷方案。以前的学术文献中也使用过类似的方法对测试赛击球手进行排名。
在模型的输入方面,我们使用了自 1979 年世界杯以来未因天气原因改变比赛条件的已结束的 ODI 比赛。在此之前的比赛在比赛条件方面不太统一,在很多情况下,每局比赛的场次和球数都不尽相同。在 20 世纪 70 年代,预测比赛胜负的最明显指标是第二棒的球队,因为设定目标的能力是一个重大障碍,对掷硬币的影响过大。下面的评级和分析只考虑世界杯之间的比赛(即不包括世界杯本身的比赛,因为我们的目的是量化参赛球队的实力)。
我们为每支球队分别确定击球实力和保龄球实力,因为从广义上讲,这两个项目是独立的。按照这里的定义,击球能力可以概括为一支球队的保龄球实力。
关于建模方法的更多详情,请参见文章末尾。
英格兰健康检查
就模型的结果而言,我们确定了球队的实力,并将其表示为在中立场地与 "平均 "球队的局数总和。为了进行跨时代比较,我们的评级是按照球队在当前世界杯周期的比赛情况给出的。
在分析考虑的 40 年和 10 届世界杯周期中,击球排名前五位的球队分别是 2003 年和 2007 年的澳大利亚队、2011 年的印度队和 1987 年的西印度群岛队。在保龄球方面,1983-1996 年的西印度群岛队以其强大而令人生畏的快速保龄球攻击占据了前五名,1996 年的南非队勉强排在第四位。
下图显示了英格兰队在不同时期的评分情况,总得分越高,表示击球队的实力越强,而总得分越低,则表示保龄球队的实力越强。细心的读者会注意到,只有四支球队被列入击球队前五名;被遗漏的球队是目前的英格兰队,他们在我们的历史评分中排名第二。印度队在击球方面的持续优异表现反映在他们占据了第六和第七位。
根据我们的历史评分,英格兰队的击球水平一般在平均水平上下。这些评级中的不确定性也说明了这一点,我们可以确信,这支英格兰队与他们的同龄人和之前的英格兰队相比,都是出类拔萃的。一段时间以来,这支英格兰队显然与他们的前辈截然不同,同时也是现代板球运动的先锋,我们的评级说明并量化了这一点。
另一方面,英格兰队的保龄球水平令人担忧,我们对他们过去四年的表现水平的最佳估计是一支普通球队。在获得 2019 年世界杯参赛资格的球队中,只有西印度群岛队和斯里兰卡队的保龄球实力明显较弱,英格兰队与孟加拉国队并驾齐驱。我们的最佳估计是,南非和印度拥有最强的保龄球队伍。
我们的评级明确量化了英格兰队的保龄球攻击力。根据这些评级,我们当然有理由考虑其他选择。
量化击球能力
为了衡量个人的表现水平,我们调整了团队实力模型,以研究击球手和保龄球手,重点关注 2015 年世界杯以来的比赛。
对于击球手,模型考虑的是一局比赛中的得分和击球率。ODI 球员的理想特质是能够快速大量地得分,这样的设置可以在考虑主场优势、对手和场地等因素的同时,将表现出这些技能的优秀击球手分离出来。我们没有明确规定得分率和打击率在确定击球能力模型中的相对重要性;研究击球手评级与得分率和打击率之间的关系发现,前者与总体评级的关系更为密切,尽管打击率显然是一个重要方面。
该模型的输出结果如下图所示,2015-2019 年间参加过 ODI 比赛的球员根据其在此期间最常出现的击球位置用标记表示。大体上说,击球手的评分会随着排名的下降而下降--该模型不考虑击球位置这一特征,因此对这一预期视而不见。
评分的一个有趣之处在于,由于同时考虑了得分和打击率,低阶击球手的评分可能会相对高于高阶击球手,这通常与他们的得分快于平均水平有关。这不应该被理解为这些球员一定比他们的高阶球员更有能力,只是他们在通常的比赛环境中表现出色。
该数据突出显示了英格兰队在此期间出场的球员,以及评分最高的维拉特-科利。从图中可以清楚地看出,英格兰队的高阶球员表现出色,而低阶球员也非常有能力。英格兰队的击球质量和深度推动了他们在上述团队实力模型中的表现评级。
确定黑尔斯的潜在替代者
亚历克斯-黑尔斯(Alex Hales)被排除在外,这意味着英格兰队中出现了一个意外的空缺,可以填补顶级击球手的空缺。黑尔斯的战绩一直非常出色,经常提供英格兰队所珍视的积极进攻。英格兰队击球阵容的稳定性意味着,现在被考虑取代他的球员的机会相对较少。詹姆斯-文斯(James Vince)和本-达基特(Ben Duckett)在 ODI 中分别只打了 5 局和 3 局比赛,因此很难对他们的表现做出评判。
根据国内 50 回合板球比赛模型的初步版本,文斯是过去 2-4 年中表现出色的候选球员,他的得分又多又快。海尔斯和达基特在诺丁汉郡的队友本-斯莱特(Ben Slater)以及沃里克郡的萨姆-海恩(Sam Hain)则是仅从国内表现来看的其他候选人。不过,需要注意的是,国内比赛的数量相对较少,这使得此类评级更具不确定性。
无论英格兰队接下来如何发展,他们都失去了一位经验丰富、能力出众的国际级球员黑尔斯,如果他的替补球员在世界杯期间被推上中场,他们将没有同样的国际比赛经验可以借鉴。
量化保龄球能力
对于保龄球手,该模型考虑了经济率和小门数,同时考虑了对手和场地。大体上,理想的 ODI 保龄球手应该是一个固定的小门手,并且经济率较低,该模型试图分离出这两点。与击球手评级类似,我们并没有规定这些因素在决定保龄球能力方面的相对重要性,但就评级而言,接球率和经济率似乎相对均衡。
该模型的输出结果如下图所示,按球员的保龄球动作分组。对于保龄球手来说,数值越低,表示球员越优秀,因此轴线反转以反映这一点。拉希德-汗(Rashid Khan)以其惊人的掷球能力和极低的经济率成为最出色的保龄球手。贾斯普里特-布姆拉(Jasprit Bumrah)被评为最优秀的速度型保龄球手。
除了可汗(Khan)和布姆拉(Bumrah)之外,英格兰队的保龄球手阿迪尔-拉希德(Adil Rashid)、克里斯-伍克斯(Chris Woakes)和利亚姆-普伦基特(Liam Plunkett)也是佼佼者,相对于其他外围投手,莫恩-阿里(Moeen Ali)的支持也很给力。其他保龄球手的表现则相对一般或较差,不过目前的评级并不考虑保龄球手通常在哪一局比赛中使用。不过,这样的评级确实表明,英格兰队考虑其他选择可能是明智之举。
乔弗拉-阿切尔的优点
世界杯赛前的大部分时间都在关注才华横溢的快速投手乔弗拉-阿彻(Jofra Archer)。阿彻已被列入英格兰队的扩充阵容,参加世界杯的最后备战,从明天对爱尔兰的一场 ODI 开始,然后是对巴基斯坦的一场 T20 比赛和五场 ODI。阿切尔没有入选英格兰队最初的 15 人参赛名单,但他们有机会在 5 月23日之前更改名单。
阿彻的声誉主要是在包括 IPL 和 Big Bash 在内的各种 20 回合比赛中建立起来的。根据对过去两年参加 T20 Blast、BBL 和 IPL 的保龄球手的初步模型,阿切尔在快速保龄球手中排名第六,这表明他的表现水平非常出色。他所参加的比赛数量意味着他的评分比许多同龄人都要高。布姆拉(Bumrah)再次成为排名最高的快速投手,阿彻与他相比毫不逊色,而卡吉索-拉巴达(Kagiso Rabada)在 ODI 评级中也名列前茅。在将 20 回合制保龄球技术转化为更长的单日制保龄球技术时,需要注意的一点是,由于单日制保龄球更难获得小门,因此该模型更重视经济率作为保龄球能力的标志。
如果他在 20 回合比赛中的表现能在 ODI 比赛中得到很好的体现,那么英格兰队的保龄球进攻将得到及时的提升。
结论
这里列出的球队和球员表现评级既让人对英格兰队在世界杯上的前景感到乐观,也让人担心英格兰队在世界杯上的表现。与其他竞争者相比,英格兰队的打击阵容非同一般,其深度也非同一般。从历史角度来看,英格兰队的打击能力可与几支传奇的世界杯冠军队相媲美,他们有能力主宰对手或追赶通常被视为强大的总比分。
英格兰队最令人担忧的无疑是他们的保龄球攻击。比赛的安排和时间长度很可能意味着,击球手的零星失误并不会对小组赛的出线造成致命影响。但是,如果击球手在关键比赛中的表现低于他们通常的水准,并将比分定格在 200-250 分之间,那么球队防守这一总分的能力就会受到严重质疑。在比赛前考虑他们的保龄球选择无疑是明智之举。
在我们的分析中,英格兰队在过去四年中的整体进步非常显著,他们大胆而精彩的板球加上主场优势,使他们比以往任何一支英格兰队都更有实力赢得世界杯。这是一支与以往不同的英格兰队。
*更多型号详情
通过 MCMC 方法求解的似然函数使用了一局中的得分和倒下的小门数,并考虑了主场优势、场地以及击球队和保龄球队的身份。第一局和第二局是分开的,这样目标得分率就可以作为一个变量包含在第二局的模型中;这为特定比赛提供了额外的背景,第一局的总得分越高,第二局的总得分也就越高。局数也被作为一个变量来考虑跑动率,这在第二局中尤为重要,因为在第二局中,一支球队的局数会因超过目标分数而结束。
一局总得分根据负二项分布建模,负二项分布是泊松分布的一种特殊情况,但具有更大的变化或 "离散性",以反映板球运动中普遍存在的显著变化。失球数则采用泊松分布建模。
实际上,考虑到对手和模型中包含的其他因素,模型设置将把击球能力更强的球队分离出来,即得分更高、失分更少的球队。反之,保龄球强队则是指那些失分较少,但失球较多的球队。
为了说明比赛随着时间的推移而发生的变化,我们定义了相对于全球平均总得分和小门数的变化,这些变化在每个世界杯周期都可能不同。这样做的目的是为了捕捉规则的变化,例如发球规则,以及基本战术和方法的变化,例如 "替补球员"、ODI 专家或 20 人制比赛的出现。我们观察到,1996 年世界杯之前的局总跑动数相对稳定,随后两个周期内跑动数有所上升,2000 年代末和本世纪初跑动数再次上升,2015 年世界杯之后跑动数达到顶峰。
除了这些变化之外,我们还试图分离出场馆条件在每个十年中随时间发生的变化;这种方法是在样本量和场馆实际短期变化之间的一种折衷。使用较长的时间跨度还能在一定程度上将场馆调整与世界杯周期调整分离开来,有助于分离这些可能高度相关的因素。对于大多数场地而言,变化幅度相对较小和/或不确定,但在希丁利等场地有明显的趋势,在 20 世纪 80 年代,希丁利对击球手而言是一个特别具有挑战性的环境,在最艰苦的 2.5%场地中排名第一。但自本世纪初以来,该球场变得更加适合击球,在考虑了模型中的所有其他因素后,该球场的总得分超过了平均值。


