采用不同的方法进行技术侦察
过去十年间,随着视频和数据等新技术的出现,球探部门识别、监控和评估招募候选球员的流程也在不断发展。
然而,这是否导致俱乐部在实际确定球员评估标准时发生任何明显变化?在各部门内部,位置关键绩效指标将根据比赛模型进行定义,并根据球员的表现产出进行衡量。这些关键绩效指标还可应用于特定位置的模板,以便球探对球员进行主观评估,从而增加了一层背景。
但是,与 10 年前相比,这些程序无疑更加专注和严格,但有一个重大问题尚未得到妥善解决:根据特定职位的关键绩效指标来评估球员有多可靠?
如今,球员及其位置仍被贴上与 25 年前相同的标签:后卫、中后卫、中前卫等等。然而,在比较同一 "位置 "上不同俱乐部的招募前景时,许多球员会拥有根本不同的素质,因此很难根据相同的关键绩效指标对他们进行客观评估。
这就是Stats Perform新的 "角色发现 "概念的由来。角色发现是一种评估球员的新方法,由我们的AI 团队首创,解决了根据位置评估球员的局限性。相反,它侧重于根据球员在球队中的角色来分析球员。
通过应用无监督学习过程,"角色发现 "让招聘分析师能够在更广泛的团队风格中对球员进行评估:根据在游戏模型中履行每个角色所需的关键倾向和特征,对潜在球员进行分组。
在这篇文章中,我们将介绍 "角色发现 "背后的一些关键要素,这将有助于俱乐部在明年考虑采用新的技术球探方法。
第 1 阶段:根据比赛风格确定每位球员的空间倾向
总的来说,"角色发现 "可以从 29 个不同的球员集群中检测出球场上 18 种不同类型的角色。角色检测的起点是识别球员传球最常见的起点和终点位置,从而生成空间热图。
下图显示了在 2018/19 赛季中,罗伯特-莱万多夫斯基和罗伯托-菲尔米诺这两名中锋在球场上最常传球的三个区域。
虽然两名球员都被贴上了中锋的标签,但从这些热图中可以清楚地看出,两名球员在各自的俱乐部都扮演着不同的角色。莱万多夫斯基最常传球的位置是边路和禁区内的中央区域。相比之下,菲尔米诺则更多地从右路半场传球。
然而,仅凭这些信息所能提供的洞察力是有限的--而且缺乏比赛情况的背景。因此,通过将 "Stats Perform 踢球风格"框架应用于球员的触球,我们可以开始了解每位球员是如何影响特定阶段的比赛的。
这凸显了莱万多夫斯基和菲尔米诺在风格上的进一步差异。下图显示了与五大联赛其他球员相比,每名球员在球队采用特定风格时的触球次数。
与平均水平相比,菲尔米诺的分组在反击阶段的参与度最高,在持续威胁阶段的参与度也很高。莱万多夫斯基在 "持续威胁 "阶段的分组低于平均水平,这表明与其他角色相比,他在球队进攻三区的控球序列中的参与度较低。
第 2 阶段:量化球员在控球时的贡献质量
在确定了球员在场上最常拿球的区域以及他们对特定比赛风格的贡献后,角色发现就会应用Stats Perform的控球价值(PV)框架来确定球员在控球过程中的参与如何增加球队在接下来的十秒钟内得分的可能性。
控球率价值根据球员的积极和消极贡献来分配得分,涵盖传球、带球和过人等关键的场上活动,以及擒抱和拦截等防守动作。
下表列出了 2018/19 英超赛季利物浦每 90 分钟 PV+ 输出最高的球员,突出了莫-萨拉赫、安德鲁-罗伯逊和菲尔米诺在增加进球概率方面的进步贡献。
另一个用于分析球员用球情况的新指标是预期传球完成率(xP)。该模型考虑了各种因素,包括传球的距离和角度以及控球动作的其他环境因素,以确定传球完成的概率。
通过应用这一指标,我们可以更好地了解球员在控球时的倾向--识别哪些球员尝试并完成了高比例的穿透性传球,而从概率的角度来看,这些传球更难完成。
为了将这些数据纳入 "角色发现 "模型,我们将球场划分为不同的区域,以突出显示球员在每个区域的位置和 xP 完成率,从而确定他们为球队做出关键贡献的位置。
结合 PV 和 xP,我们可以评估球员传球的潜在回报与潜在风险,并比较他们与其他球员的表现。
回到我们对莱万多夫斯基和菲尔米诺的对比,下图显示了2018/19赛季每位球员在向中场进攻区域传球时的表现。
菲尔米诺的 xP 完成率高于 0.75,这表明他在这一区域传球安全、概率高。与此同时,他还通过进入前 10% 百分位数的渐进 PV 增加了球队进球的概率。
莱万多夫斯基是另一种类型的前锋,他的 xP 完成率接近平均水平,而 PV 则处于倒数 10%的百分位数,这说明他参与的控球链条较少,更有可能大量射门,成为控球链条中的最后一名球员。然而,这并不能说明问题的全部,我们将在本文后面详细阐述。
第 3 阶段:确定球员如何参与控球序列
为了进一步确定球员与队友的互动方式,角色发现还加入了另一个新模型--运动链,它能确定球队最常见的传球模式,这些模式能在球场上产生最高的 PV 值。
运动链是根据由四次传球组成的传球图案来标注的,这有助于识别球队如何推进球以及参与其中的球员。
与 xP 一样,为了分析移动链,我们将球场划分为多个区域,这样我们就能通过聚类分析,找出球队如何将球从一个区域转移到另一个区域的最常见模式。如下图所示,起始区可以是防守三区的中心区域,而终结区则是对方禁区的边缘。
移动链也可应用于比赛风格,以确定球队在采用特定风格时如何移动球。下面的示例显示了利物浦队在 2018/19 赛季中最有威胁的移动链,这些移动链在利物浦队进行 "Build-Up "战术时以对方禁区为终点,突出了利物浦队是如何通过右内道和左内道来渗透禁区的。
第 4 阶段:应用每个模型创建角色
为了识别球员个人在球队控球链中的参与情况,我们应用了受Word2Vec启发的Chain2Vec模型,以识别球员经常出现的控球链集群、其上下文以及球员在单次传球中的互动情况。这种通过深度学习技术进行的高级建模提供了球员和球队参与的紧凑表征。
与此同时,还应用了球员触摸地图,以提供每位球员的空间背景信息,以及比赛风格、xP 和 PV 模型。此外,还包括球员开球类型及其位置的细分。
然后,所有这些输出都会应用到最终的角色发现模型中,使用聚类算法--高斯混合模型--来学习分组,并将球员分成不同的组别。 从这些群组中,我们能够使用数据驱动的描述,将 400 多个球员个人描述浓缩为球场上的 18 个独立角色。
这些角色标记如下(点击放大):
回到莱万多夫斯基和菲尔米诺身上,在确定了他们各自适合不同的角色后,我们现在可以将他们与各自角色的球员进行比较,而不是直接进行比较。
下图显示的是我们之前使用过的传球对比,但这次我们将球员各自的角色分离出来,并用橙色标出。
就菲尔米诺而言,如果与五大联赛的所有球员相比,他的 xP 完成率排在前十位,但如果只与其他 "进攻型创造性威胁 "球员相比,他的 xP 完成率则更接近平均水平。
就莱万多夫斯基而言,如果只与其他 "高级前锋 "相比,我们可以看到他的传球比平均水平要安全得多,虽然他的累积 PV 值仍然低于平均水平,但与所有球员相比,数字并没有那么极端。
结论:让球员比较更客观
通过定义角色,招聘分析师可以应用 "角色发现 "功能,更客观地直接比较符合每个角色参数的球员。这可以简化球探流程,确保在场上踢相同位置的球员不会被进行同类评估,而是根据他们所扮演的角色进行分析。
构成该模式的要素包括四个关键的招聘考虑因素:
- 球员在球场上的位置?- 空间足迹
- 他们何时做出关键贡献?- 游戏风格参与
- 与担任相同职务的其他人相比,他们的主要贡献的风险回报情况和质量如何?- xP 和渐进式 PV 产出
- 球员参与哪些类型的传球动作?- 动作链参与
此外,"角色发现 "还可作为一种辅助工具,用于识别那些拥有不同于其目前在俱乐部所扮演的角色或位置的关键属性的球员。这将有助于分析师识别年轻的加雷斯-贝尔或菲利普-拉姆等人,他们都是从职业生涯初期的后卫发展到在更高位置踢球的球员。
今年晚些时候,将在Stats Perform 网站上发布案例研究,举例说明如何应用 "角色发现 "来确定特定角色的替代人选,同时还将发布一些从支持这一概念的模型(包括 xP 和运动链)中得出的分析实例。
如果您想了解更多有关角色发现的信息,或对我们迄今为止开发的产品有任何疑问,请与我们联系。











