主要收获
- 除了场地位置、距离和角度外,OptaPro 的踢球概率模型还考虑了其他因素,包括比赛场地和踢球者的技术。
- 在过去两个超级橄榄球赛季中,踢球成功率高达 92%,根据该模型,踢球成功率最高的球员是太阳狼队飞翼海登-帕克(Hayden Parker)。
- 与威尔士队友丹-比加尔(Dan Biggar)相比,利-哈夫彭尼尝试高难度踢球的比例更高。在所有入选世界杯的球员中,哈夫彭尼的高难度踢球转换率也是最高的。
顶级橄榄球联盟的比赛往往分出胜负--自 1999 年世界杯以来,当橄榄球锦标赛和六国赛的参赛者对决时,约有 18% 的比赛以 3 分或更少的比分决出胜负。整整三分之一的比赛以 6 分或更少的比分决出胜负,这说明很大一部分比赛都在 1-2 次成功射门的范围之内。
踢门的距离和角度会有很大差异,这显然会对难度产生影响。在俱乐部和国际比赛的 100,000 多次踢球中,平均成功率为 73.5%。最容易踢到立柱附近和正前方的球有 99% 的成功率,而踢过半场线的球有 38% 左右的成功率。
除了位置之外,另一个主要因素是踢球者;就原始百分比而言,在目前拥有 10 次以上国际比赛经历并在俱乐部和国际比赛生涯中踢球超过 500 次的球员中,成功率从 68.5%(澳大利亚的奎德-库珀(Quade Cooper))到 82.7%(苏格兰的格雷格-莱德劳(Greig Laidlaw))不等。这样的原始百分比很可能会掩盖踢球的难度--有些球员是众所周知的远射专家,他们会踢难度更大的球,而有些球员则可能会拒绝这样的机会。
此外,由于球员的大部分踢球都是在自己的主场进行的,当地因素也会起到一定的作用;在更开阔的球场或海拔更高的球场,成功率会分别下降或上升,并有可能体现在球员的踢球记录上。
踢出期望
因此,总的成功率可能会掩盖球员的技能水平,所以建立一个将踢球难度考虑在内的模型可以在很多方面有所启发。踢球能力、比赛能力和防守坚韧度之间往往需要权衡,因此这种模型可用于招募和选拔。量化单次踢球的难度可以扩大覆盖面,并说明球员在一场比赛或锦标赛中的表现。
以前的建模工作主要关注踢球成功率的空间位置,即 xy 坐标、距离和角度。除了这些特征外,我们还将踢球者的身份和场地明确纳入贝叶斯建模框架,使用PyMC3定义了分层马尔可夫链蒙特卡罗(MCMC)模型。下文将重点介绍我们模型中与球员相关的技能要素,更多有关场地调整的细节将在文章末尾列出。
量化踢球能力
该模型的核心是估计踢球的难度,同时考虑踢球者的技术;经常成功踢球的球员将获得更高的评分,特别是如果他们持续踢出更具挑战性的球。
在我们数据库中的 350 次踢球中,帕克的成功率为 85%,而在过去两个超级橄榄球赛季中的成功率更是达到了惊人的 92%,根据该模型,排名第一的踢球手是新西兰人海登-帕克(Hayden Parker)。帕克的评分为 2.2,这表明他的能力是 "平均 "踢球者(评分等于 1)的两倍多。为了说明帕克的能力,我们估计一名普通踢球者的踢球成功率为 72%;如果将他的能力考虑在内,他的预期成功率将达到 83%,与普通踢球者相比有了大幅提高。他的预期成功率和实际成功率之间的差异很可能反映了模型对他的记录略显谨慎,因为与我们数据集中的许多踢球者相比,他的样本量相对较小。他的踢球实力样本如下。
SharpShooter Hayden Parker 从远处将球打进!2019 年从未失手,看看这个!#WARvSUN #SSAction @太阳狼队大获全胜pic.twitter.com/aEkwXUfa7a
- 天空体育橄榄球队(@SkySportsRugby)2019 年 3 月 29 日
下表列出了入选 2019 年橄榄球世界杯(RWC)的顶级踢球手,以及尚未在高级别赛事中出场的帕克。苏格兰队的格里格-莱德劳(Greig Laidlaw)和威尔士队的利-哈夫彭尼(Leigh Halfpenny)表现突出,后者的踢球难度高于许多同龄人。
我们的球员评级取贝叶斯 MCMC 后验样本的平均值,这样做的额外好处是可以量化评级的不确定性。例如,乌拉圭球员费利佩-贝尔切西(Felipe Berchesi)仅踢了 100 脚,他的中心估计值的不确定性范围高达 1.3,而英格兰球员欧文-法瑞尔(Owen Farrell)的评级则要稳健得多,他的不确定性范围仅为 0.4,这是因为他有超过 1400 脚的踢球记录。
下图重点介绍了 RWC 阵容中的一些球员,每个标记代表过去十年中的常规国脚,以及自 1987 年以来参加过历届 RWC 的球员。帕克(Parker)也在其中,以作比较。
除意大利队外,其他六国球队都有出色的踢球手,而新西兰队和澳大利亚队的踢球手则表现平平。从纯粹的踢球角度来看,这代表着北半球主要国家队在比赛中的潜在优势,可能会在激烈的比赛中发挥作用。
威尔士问号
今年早些时候,威尔士队在六国赛中获胜,加雷斯-安斯科姆(Gareth Anscombe)是首选的飞翼和踢球手,而利亚姆-威廉姆斯(Liam Williams)的进攻能力则是后卫的首选。安斯科姆因伤无缘 RWC,但他的踢球记录非常出色,在比赛中的评分仅次于莱德劳(Laidlaw)和哈夫斯潘尼(Halfpenny)。安斯科姆的平均评分为 1.7 [1.4-2.0],略高于他的替补飞翼丹-比加尔(Dan Biggar)。
球员在踢球时会有一定程度的选择偏差,这是在长时间的训练和顶级比赛的压力下磨练出来的--球员通常只会尝试他们认为在自己 "射程 "内的踢球,因此会拒绝难度更大的射门,而选择重新开球。比格尔的踢球记录非常出色,与安斯科姆不相上下,但与安斯科姆,尤其是哈夫彭尼相比,他踢球的选择性更强。
为了说明这一点,在下表中,我们将重点放在最困难的罚球尝试上,将最困难的罚球尝试定义为期望值低于 60% 的罚球尝试,占所有罚球的 37%。
就比加尔而言,他踢出高难度球的比例略高于所有球员的平均比例,但低于安斯科姆。实际上,比格的踢球记录比安斯孔好很多。哈夫彭尼对远距离射门的偏好是理所应当的,因为他的远距离射门转化率达到了惊人的 70%,是我们数据库中射门超过 100 次的球员中转化率最高的。
基于上述情况,如果哈夫彭尼不在场上,比格尔有可能选择承担比现在更高难度的踢球任务。鉴于防守是威尔士队近期成功的基石,有效利用比格和哈夫彭尼的远距离射门能力可能是威尔士队在比赛中积累积分和晋级的谨慎手段。
结论
以上说明了对踢球尝试的基本难度进行量化以及对球员能力进行单独分析的作用。选拔和招募球员时显然需要对球员的技能组合有一个全面的认识,尽管精英橄榄球比赛中的差距很小,但一名踢球技术娴熟的球员却能决定比赛的成败。
就能力而言,海登-帕克(Hayden Parker)是一个极端的例子,但在过去两个超级橄榄球赛季中,他的 102 次射门得分达到了 230 分。如果踢球技术一般的球员,同样的踢球大约能得到 182 分,这说明了踢球技术在最终得分方面的价值。
附录:与场地有关的调整
影响成功率的另一个考虑因素是场地--体育场设计的多变性、主要天气条件以及某些情况下的海拔高度都会产生影响。例如,开放式体育场可能会受到明显的横风或湍急气流的影响,而这在现代大型碗状体育场中只是次要因素,从而增加了踢球的难度。为了部分考虑这种潜在影响,我们将场地作为一个变量纳入模型。虽然这种调整无法解释特定比赛日期间更细微的变化,但它确实提供了一些有关踢球难度的额外背景信息,以及常规踢球者在此类场地可能遇到的优势或劣势。
对于绝大多数场馆而言,这些调整可以忽略不计。不过,在进行样本外验证测试时,加入这些因素确实会提高模型的性能。
就增加踢球难度而言,最极端的场地是奥克兰伊甸园公园球场;该球场所有踢球的基准期望值是普通踢球者 70% 的成功率,考虑到场地因素,成功率降低到 66%,差异相对较小,但意义重大。奥克兰地处沿海,经常出现高空大风天气,再加上球场看台的不规则高度,使得比赛条件更具挑战性和不可预测性。
场地的反面通常与高海拔地区有关,那里的空气密度较低,阻力也因此降低,在其他因素相同的情况下,这将增加球的飞行距离。布隆方丹的丰塔体育场(又称自由州体育场)是对踢球者最友好的环境,普通踢球者的成功率从 71% 提高到 76%。近 1400 米的高海拔加上更加统一的球场设计,使其成为橄榄球联盟中丹佛一英里高球场的典范。


