利用网络科学量化足球队的可识别性 -Stats Perform

哈维尔-布尔杜（Javier Buldú）和大卫-加里多（David Garrido）在2020 年 OptaProForum上进行了海报展示，介绍了一种网络科学方法，即利用Opta 数据，根据传球模式的持续性，量化球队在一个赛季中如何保持比赛风格。

在这篇特约博客中，他们简要介绍了其演示文稿背后的方法，并对主要研究结果进行了总结。

点击 点击这里查看他们的海报。

介绍作为复杂系统的足球队

"复杂系统是由许多可能相互影响的组成部分组成的系统。复杂系统是指由于各部分之间或特定系统与其环境之间的依赖、竞争、关系或其他类型的相互作用，其行为本质上难以建模的系统"。

大脑、地球气候和生态系统都是复杂系统的明显例子。我们还认为，足球也有充分的理由被归入这一类别。

为什么？

在一场足球比赛中，有 22 个被称为球员的组成部分以复杂的方式相互影响、相互依赖、相互竞争，更重要的是，它们会产生新的属性，如"比赛模式"。因此，复杂性科学是分析足球数据集的一个可行选择，它为分析美丽的比赛引入了新的视角。

其原因在于足球的复杂性，套用复杂性科学的基本范式，"不能通过单独分析其组成部分（即球员）来进行分析，而是要将整个系统作为一个整体来考虑"。即使是比赛中最成功的球员也会认识到，"这不仅仅是我一个人的问题，而是整个团队的问题"。

将团队活动转化为复杂网络是基于复杂性科学的众多方法之一。考虑到球员之间通过传球进行的互动，可以对球队的组织进行分析。我们可以构建传球网络，其中包含整场比赛中球如何在球员之间移动的信息。

通行网络之所以是 "复杂网络"，主要有两个原因：

1.它们由节点（球员）和它们之间的链接（通道）组成；

2.节点之间的相互作用遵循一定的 "复杂 "规则。

此外，由于这些网络是有向（即球员之间的链接有一定的方向）、加权（链接的权重是球员之间的传球次数）、空间嵌入（即球和球员的欧几里得位置非常重要）和时间演化（即网络结构不断变化）的，因此不容易分析。

下图 1 显示了 2017/18 赛季皇马对阵巴塞罗那比赛中传球网络的一个示例。在图中，球员的大小与其在传球网络中的重要性成正比。球员被放置在他们传球时的平均位置。链接的宽度与两名球员之间的传球次数成正比。最后，替换球员用绿色标出。

从这幅图中，我们可以迅速了解皇马是如何踢球的，他们是如何占据球场的，他们的球员之间是如何互动的，以及换人后的组织是如何变化的。

图 1：传球网络示意图，2017/2018 赛季皇家马德里对阵巴塞罗那。

这只是将团队活动转化为网络如何帮助我们理解团队组织的一个缩影。我们可以从不同空间和时间尺度的网络结构中提取多种指标，从而更好地理解一支球队是如何组织起来的，以及球员是如何为球队的表现做出贡献的（Buldú 等人，2018 年）。

网络科学是复杂性科学的一个分支，主要分析网络结构和动态。网络科学尚未完全适用于足球数据分析，但有可能在未来几年为足球表现提供新的视角。

传球网络

还有其他创建传球网络的方法。如果我们更关注球队的空间组织，而不是球员的角色，我们可以构建并分析球场传球网络。在这种情况下，网络的节点不是球员，而是球场的特定区域，通过占据这些区域的球员的传球连接起来。

图 2 显示了巴萨对阵皇马时的球场传球网络示例。

图 2：从左至右分别为巴塞罗那队的 3×3、5×6 和 10×10 传球网络图，其中节点为球场区域，链接为节点之间的传球次数。

为什么我们要绘制三个而不是一个网络呢？原因是球场可以划分为不同大小的区域，从而形成不同规模的球场网络。因此，图 2 中的三个网络对应的是同一场比赛中的同一支球队，唯一不同的是分区的大小。不过，需要注意的是，网络结构因分区数量的不同而不同，这表明需要对不同规模的网络特性进行分析。

足球队的可识别性

现在，我们已经确定了框架，是时候提出问题了：

是否可以量化一支球队在多大程度上有明确的比赛风格？
哪些球队适应对手，哪些球队忠于自己的风格？
我们能否量化哪些球队在比赛中将自己的风格强加给对手？
哪些球队在客场比赛时表现不同？

为了回答所有这些问题，我们运用网络科学分析了球场传递网络的组织结构。

利用一场比赛的赛事数据，我们构建了与每支球队相关的多尺度传球网络，并采用网络科学的不同方法对其结构进行了分析。

通过这种方式，我们能够确定

哪些球队将自己的比赛风格强加于对手？
赛前对对手的期待；
如何评估一个团队的表现是否符合预期。

我们唯一的信息来源是每支球队的传球方式，而不考虑射门、进球、拦截、运球或其他动作的次数。然而，正如我们将看到的，传球方式仍能捕捉到球队组织的精髓。

我们将球场划分为n x m 个区域（n=1,2,3,...10，m=1,2,3,...10），并构建了球场通过网络，其中节点对应于球场的N=(nxm)个区域， _aij代表从区域i 到 区域j 的通过次数。

我们分析了整个赛季在不同空间尺度上产生的连通性矩阵_A{aij}的特性。连通性矩阵的元素是球场区域之间的传球次数，即每支球队传球模式的数学抽象。我们通过量化特定球队在赛季中的连通性矩阵的相似程度，计算出每支球队的一致性参数（C）。

简而言之，一致性高的球队在整个赛季中都能保持其传球网络的结构，而一致性低的球队则在每场比赛中都会改变其组织结构。

接下来，我们量化了每支球队球场传球网络的独特性。这可以通过比较特定球队与其他参赛球队的传球网络结构来实现。最后，我们将一支球队的可识别性参数（I）定义为一致性参数 C 减去对手 相似度 R，即I=C-R。

可识别性参数较高的团队是那些始终如一，同时又与众不同的团队。

我们的方法既可用于描述，也可用于展望。一方面，我们能够确定哪些球队在整个赛季中保持了自己的比赛风格（"高可识别性"），哪些球队则没有保持一致的比赛风格（"低可识别性"）。

我们与西甲联赛合作，计算了 2017/18 赛季西班牙顶级联赛球队的可识别性参数。

图 3 显示了巴塞罗那队和马拉加队的可识别性值，这两支球队分别在积分榜上排名第一和第二。在横轴上，我们绘制了髓部所划分的节点数量，因为正如我们所解释的，必须对所有尺度进行分析。有趣的是，我们观察到，大约 50 个区域（节点）的球场划分可以更好地识别巴塞罗那的比赛风格。至于马拉加，我们可以看到他们在所有尺度上的可识别性都很低。

图 3：左边的图表根据球场的分区（节点）数绘制了巴塞罗那的可识别性参数。右图显示了马拉加的相同分析。

应用

最重要的是，这些信息可以帮助教练团队通过确定对手的预期方法为比赛做好准备。

例如，一支球队可以评估其下一个对手的可识别性，并决定是否根据对手的打法调整自己的打法（当对手的可识别性较高时），或尝试将自己的打法强加给对手（在面对可识别性较低的球队时）。

我们还可以利用可识别性来量化每场比赛中哪支球队的打法最接近自己的风格。

表 1 显示了 2017/2018 赛季西甲联赛中主客场球队之间每场比赛的可识别性差异。

纵轴上列出的主队强加了自己的比赛风格（即可识别性更高）的比赛用黄色标出，而绿色单元格对应的是强加了自己风格的客队。这些球队是根据联赛最终排名排序的，目的是显示可识别性与球队表现之间的联系。黄色单元格主要出现在矩阵对角线的上方，表明当两支球队比赛时，排名靠前的球队更有可能采用自己的打法。

如果我们强调个别球队，我们可以看到巴塞罗那在更多的比赛中赢得了 "可识别性竞赛"，无论是主场还是客场，紧随其后的是皇家马德里。不过，值得强调的是，可识别性的差异并不总是比赛结果的指标，因为在有些比赛中，输球球队的可识别性更高。这就是足球的本质，按照自己的方式踢球并不总能保证成功。

表 1：主队列在纵轴上，按最终联赛排名排列。客队在横轴上，排列方式相同。比赛结果显示在每个单元格内。黄色代表主队，绿色代表客队。蓝色单元格对应的是两队可识别性无明显差异的比赛。

最后，还值得强调的是，在比赛进行过程中，有可能获得可识别性参数的实时估计值，从而突出显示一支球队或其对手何时按照预期进行比赛。这是非常有价值的信息，有可能为替补席上的关键比赛决策提供参考。

这种方法的进一步应用还能让分析人员有机会评估哪些球队在主场或客场比赛时表现不同，或确定在比赛中出现偏离球队预期传球模式的球场区域。

参考资料

Buldú, J. M., Busquets, J., Martínez, J. H., Herrera-Diestra, J. L., Echegoyen, I., Galeano, J., & Luque, J. (2018).使用网络科学分析足球传球网络：动态、空间、时间和比赛的多层性质。心理学前沿》，9, 1900。

Buldú, J. M., Busquets, J., & Echegoyen, I., & F. Seirul.lo (2019)。定义一支历史悠久的足球队：使用网络科学分析瓜迪奥拉的巴塞罗那队。自然科学报告》，9（1），1-14。

哈维尔-布尔杜拥有应用物理学博士学位，是马德里胡安-卡洛斯国王大学复杂系统小组的协调员，也是生物医学技术中心生物网络实验室的首席研究员。

您可以通过电子邮件与他联系：javier.buldu@urjc.es

大卫-加里多是一名博士生，就读于西班牙马德里胡安-卡洛斯国王大学生物医学技术中心。

利用网络科学量化足球队的可识别性

介绍作为复杂系统的足球队

传球网络

足球队的可识别性

应用

注册《记分牌