Laurynas Raudonius 是首届 Garry Gelade 博士奖的获得者,该奖项旨在表彰在Stats Perform 专业Forum上提交优秀提案的本科生。
获奖后,Laurynas 在 "虚拟 2021 "活动上展示了一份海报,其中说明了一个项目的研究成果,该项目利用时空数据,采用沃罗诺伊单元和其他方法,量化单个球员如何为球队成功反击做出贡献。
评估反击时消除主观性
为什么必须客观量化每个球员对反击的贡献?
一个好的起点是挑战自己,仅用肉眼就能从一个孤立的反击场景中找出最重要的贡献,并为球员打分。
观看以下视频时,请思考哪些球员的贡献最具影响力,以及为什么。
看了这个片段,我相信你现在就会明白,客观地为足球运动员的动作赋予数值是多么大的挑战。毫无疑问,这是足球分析的巨大挑战之一。
创建一个模型来实现这一目标的好处显而易见--对任何两名球员进行无偏见的比较,对球探、球队选择和足球的许多其他领域都有极大的帮助。
我的模型结合了利用跟踪和事件数据计算出的四项指标,并将其应用于对球员在反击中的贡献进行估值。虽然现有的许多足球相关研究都侧重于为传球赋予价值,但本模型则更进一步,通过将所有动作合并为贡献来对其进行估值。已有一些类似的模型被开发出来,但它们都是作为机器学习模型进行训练的,并不包括许多单独的指标。
此外,本项目重点关注反攻击,这是攻击场景的一个子集,迄今为止很少受到数据科学家和研究人员的关注。
定义捐款
本项目使用的模型并不区分球员不同类型的进攻动作,而是将所有动作合并为贡献值。贡献本质上是一对比赛中的控球状态(在某一时刻所有球员和球在场上的位置),首先是球员第一次触球的时刻,其次是队友随后触球的时刻(反过来,他们也开始了自己的贡献)。这两种比赛中控球状态之间的差异回答了 "球员在控球时是如何影响场上局势的?
得出贡献的精确得分
除非我们有办法客观地为这两种占有状态赋予数值,否则它们之间的差异并不能说明什么问题。为此,我们设计并实施了四个独立的指标,这些指标来自跟踪和事件数据:
1.距离
这是四项指标中最直观的一项。很明显,如果一名球员将球从本方三区带至对方禁区,那么他就为增加进攻的威胁性做出了很大贡献。因此,他们的贡献应该得到很高的评价。为了准确衡量这一点,模型计算了球员第一次拿球时球与球门之间的欧氏距离,以及球员完成动作(即尝试传球)时球与球门之间的距离。两者之间的差值告诉我们,由于球员的参与,球与球门之间的距离缩短了多少,这就是指标值。由于球员有可能将球带到离球门更远的地方,因此也可以分配负值。
2.危险
在距离指标的基础上,我们可以考虑球员动作后球在球场上的具体位置,而不仅仅是球距离球门的远近。
丹尼尔-林克(Daniel Link)等人在研究足球进攻中的危险性时,对球场不同区域的危险性进行了深入探讨。他们的研究建议将进攻三分区划分为 2×2 米的方格,然后给每个方格分配 0 到 1 之间的危险分值(见下图 1)。
为了计算出准确的数值,他们遵循了五条关键规则:
a) 随着与目标距离的减小和中心度的增加,危险也随之增加。
b) 进入禁区会突然增加危险,因为防守方有可能罚丢点球。
c) 球门前有一个同质区域,在该区域内危险不会进一步增加。
d) 与球门成锐角可减少危险。
e) 禁区边上的区域很危险,因为有可能出现越位。
3.不敌对手的球员
虽然距离和危险度量指标很有参考价值,但它们从根本上说只是基于球的位置。
如果一名球员在中场线处有一条通往球门的清晰道路呢?仅根据前两项指标,该球员的贡献就会得到极大的评价,即使他们几乎没有受到对方球员的压力。因此,在评估球员的行为时,必须考虑到他们对对方防守的影响。
这正是第三个指标所衡量的。更具体地说,它计算的是球员动作期间有多少对方球员在球后。由于守门员大部分时间都在球后,因此这一指标中不包括他们。
4.空间控制
一项研究探讨了一支球队的成功与他们在对方半场距球门 30 米处控制的空间大小之间的关系。研究发现两者之间存在某种直接的关联:许多成功的球队,如 2010 年代初的巴塞罗那队和多特蒙德队,都控制了对手半场的大片空间,因此,如果球员的贡献增加了控制空间,那么给予他们更高的估价也就合情合理了。
本项目使用 Voronoi 单元测量受控空间。球员的 Voronoi 单元是球场上他们比其他球员更接近的点的集合。
计算整个球场的空间信息量并不大,因为增加本方半场空间的球员并不一定有助于反击。因此,我们在球场上选择了一个阈值(区域),决定何时考虑空间控制。
在球门前不同区域进行的实验表明,如果只在球场最后四分之一区域测量控制空间,那么所有球员的空间控制差异就会更大,这样我们就能更好地区分球员贡献的重要性。因此,这被设定为模型中的阈值。
综合衡量标准
为了得出每个球员贡献的单一得分,我们将四项指标进行了合并。第一步是将所有指标归一化为相同的范围:这里选择[-1;1]。然后将每项贡献的得分相加,再乘以 2.5,得出-10 到 10 之间的得分。这样就得出了一份材料的最终得分。
应用
在确定了方法论之后,我们现在需要演示如何将该模型应用于比赛中的任意比赛段落。
如果一个段落相对不复杂(如加雷斯-贝尔在 2014 年国王杯反击中的制胜球),那么分配得分贡献的挑战就会变得相当简单,但每有一名新球员加入比赛,难度就会成倍增加。
这种模式能够解决这个问题。
让我们回到本文开头展示的视频示例。在这个新版本的短片中,我们会在每个贡献结束时暂停播放,并显示模型是如何评估贡献的。
下面的柱形图概括了这次反击战中的会费分配值。
当你最初考虑哪些球员的贡献在这次特定的反击中最有影响力时,如果能知道你的价值观是否与这个模型得出的价值观相似,那将会很有意思。
既然我已经向你们解释了我的方法,为了好玩,让我们再做一次同样的练习,但这一次,在给每项贡献打分时,要尽量考虑到这四项指标。
观看完短片后,请单击下面的视频,查看模型得出的贡献值,并与自己的贡献值进行比较。
下面的柱状图再次概括了各反击贡献的数值。
在这个例子中,六号选手的贡献值得强调。根据模型,他的贡献最大,综合得分接近 5 分。然而,当我在职业Forum上向代表们展示这段视频时,人们往往说他们认为八号或九号选手的贡献最大。这就更加说明,仅凭肉眼来量化一名球员在反击阶段的贡献是非常主观的。
它还进一步强调了此类研究在评估重复出现的匹配情况时努力减少偏差的潜力,这有可能加强匹配分析过程并为招聘特征分析提供信息。
参考资料
Tavares, Ricardo.(2019).在足球中使用沃罗诺图。
Link, D., Lang S., and Seidenschwarz P. 2016.利用时空跟踪数据实时量化足球运动中的危险性》。
Rein, R., Raabe D., and Memmert D. (2017)."哪种传球更好?评估精英足球传球效果的新方法》。人体运动科学 55.
Perl, J. & Memmert, D. (2017)。基于空间和控球的足球进攻成功试点研究--关键绩效指标和了解比赛动态的关键。
Laurynas Raudonius 来自立陶宛,今年早些时候毕业于曼彻斯特大学计算机科学专业。他目前在瑞士工作,之前曾在立陶宛顶级联赛球队 FK Kauno Žalgiris 担任比赛分析师。


