跳至主要内容

发展我们的占有价值框架

 

Stats Perform的 "控球权价值"(PV)框架可衡量控球球队在接下来的 10 秒钟内得分的概率,并可根据球员在控球时的正负贡献对其进行信用分配。

作者: Jonny Whitmore乔尼-惠特莫尔

去年推出以来,Stat Perform 的占有率价值模型已成为我们创新AI 模型的重要工具,为我们的边缘分析平台提供了动力。

在 2019/20 赛季期间,在客户和用户反馈的帮助下,我们对模型框架中的一些功能进行了改进。新的 "控球率值"(PV)框架是针对现有版本在比赛层面上的聚合问题而开发的,在比赛层面上,球队的控球率值通常远大于实际进球数。最初的 "控球权价值 "框架衡量的是球队在控球时得分的概率,而新的 "控球权价值"(PV)框架则采用基于时间的方法,衡量控球球队在接下来的 10 秒内得分的概率。之所以采用这种方法,是因为与不同的方法和替代目标变量相比,这种方法的模型性能更优越,为我们提供了更多可解释的输出结果。

对框架的另一项重大改动是取消了球员失球时任意给予的负值。正如我们稍后将看到的,这使得进攻球员因丢球而受到的惩罚更少,再加上新的基于时间的方法,实际上使得球员在危险区域丢球的不成功行动得到了奖励。

对于那些对这一概念不了解的人来说,"控球率值 "可以让我们对球场上的每一个动作进行估值,并了解球员在球队中的效率如何。例如,假设凯文-德布劳内在中场线附近拿球,控球率为 1%(PV 开始值 = 0.01)。如果他将球带至底线,然后传给禁区内的拉希姆-斯特林,此时控球率为 13%(PV 结束 = 0.13),那么凯文-德布劳内将球队进球的可能性提高了 12%。这就是我们所说的控球率附加值(或 PV+),无论斯特林接下来选择如何处理球,凯文-德布劳内的贡献都会得到回报。曼城现在在接下来的 10 秒内进球的可能性增加了 12%(PV+ = 0.12)。

通过这种方式,我们可以将以前可能被进球和助攻等传统指标低估的球员归功于我们。我们可以查看单个球员的所有贡献,并评估他们的积极作用是否大于消极作用。计算球员对球队净贡献的基本要素仍然不变:

进步的行动(正 PV+)。
成功但退步行动(负 PV+)。
失去占有权(不成功的行动通常获得负 PV+)。
失去控球权导致对手直接威胁(相对于对手控球的危险性的负 PV+)。

为了了解新框架下的情况,让我们来看看上赛季利物浦的夺冠阵容:

我们不难看出,利物浦队中对提高球队进球潜力起关键作用的球员都来自大禁区。虽然前锋穆罕默德-萨拉赫(Mohamed Salah)和萨迪奥-马内(Sadio Mané)对利物浦的净贡献最大,但他们的后卫特伦特-亚历山大-阿诺德(Trent Alexander-Arnold)和安德鲁-罗伯逊(Andrew Robertson)也不甘落后。

我们可以看到新框架与上述原始模型的不同之处,最明显的是特伦特-亚历山大-阿诺德在净贡献排名中的显著上升。加上取消了任意的控球失利惩罚,新的基于时间的方法的另一个含义是,球员现在即使失去控球权也能获得正奖励。这种情况一般很少见,但如果一名攻击者在对方禁区内赢得了头球,那么在接下来的 10 秒钟内,无论球是否传给队友,仍有机会取得进球。

旧的框架可能会对像亚历山大-阿诺德这样的后卫因其冒险但循序渐进的传球而失去控球权进行更多的惩罚,但这些行为事实上仍可能增加球队进球的可能性。例如,让我们看看下面安德鲁-罗伯逊在对阵阿森纳时的传球:

安德鲁-罗伯逊(Andrew Robertson)从几乎没有危险的纵深位置传球(PV 开始 = 0.003),皮球稍稍高出队友菲尔米诺的头顶。基兰-蒂尔尼(Kieran Tierney)将传球解围到中央区域,利物浦实际上更有可能在接下来的 10 秒内取得进球(PV end = 0.013),因此罗伯逊现在在新的 "控球权价值 "框架中获得了正面评价(PV+ = 0.01)。安德鲁-罗伯逊(Andrew Robertson)的传球使利物浦在接下来 10 秒内进球的概率增加了 1%,尽管他未能成功传给队友。

利用这一框架,我们还可以按事件类型或比赛来细分球员的贡献。如果我们看看利物浦球员在 9 月 28 日对阵阿森纳时的表现,就能知道谁是全场的关键球员:

鉴于利物浦的优势,几乎所有利物浦首发球员都在本场比赛中取得了积极的整体影响,这一点也不足为奇。值得注意的是,我们可以看到维吉尔-范戴克在本场比赛中的净控球率附加值(0.36 PV+)排名第三,这是因为他在右路为特伦特-亚历山大-阿诺德和穆罕默德-萨拉赫送出了避开压迫的长传球。这些行为的价值通常难以用其他高级指标来衡量,但我们现在可以看到,范迪克在比赛中的行为组合产生了 0.36 的净 PV+,这表明利物浦有望在比赛中多进 0.36 球(与他没有采取这些行为相比)。

这里需要注意的是,提高球队得分概率并不一定是每个球员的初衷,因此净贡献排名靠后并不能直接说明球员的表现质量。与任何指标一样,关键在于在你试图衡量的背景下评估产出。

查看球员的净贡献只是控球率价值框架的众多应用之一。该框架是我们在Stats Perform边缘分析平台中建立的许多模型的关键输入。您可以在下文边缘分析中的运动链分析中看到其应用实例,它允许我们对球队比赛模式的危险程度进行估值:

我们将在接下来的文章中讨论这一概念以及其他许多概念,以说明基于时间的占有价值方法不仅是一个出色的单独工具,而且是我们许多创新型新AI 模型的基本特征。