在过去一年的足球分析工作中,人们已经从应用围绕单个控球事件的指标,广泛转向通过分析构成控球时间段的事件序列来采取更全面的方法。
这种方法通常可以提供单一事件指标有时缺乏的额外背景。考虑预期进球(xG)。它承认过去的射门以及射门位置和射门角度等特征,并估计射门导致进球的可能性。在 xG 模型中加入助攻类型也很常见。
将助攻包括在内是对什么是好机会的思考的合理延伸,您还可以通过考虑第二次助攻或射门前的其他类型的事件(运球)来进一步延伸。像这样的单一事件指标往往需要一个上下文框架,这正是控球率模型的用武之地。
请观看下面的讲解视频:
活动串联
我们过去曾写过关于将事件串联起来以重新定义控球权的文章,但后来已将这一框架正式转化为一个模型,从中可以得出球员、球队和事件层面的大量有用的新颖统计数据。许多足球分析从业者也展示了类似的想法和算法。
Opta 持球模型的细节与上述 2012 年的文章所描述的类似,但事件被组织成序列和持球。
序列的定义是属于一队的比赛段落,以防守动作、比赛中断或射门结束。
控球定义为属于同一支球队的一个或多个连续传球。一连串传球导致射门被扑出并形成角球,将构成一次控球,因为同一支球队仍保持控制权,但由于球已出界,则构成不止一次控球。对方控球结束。
值得注意的是该机型的一些重要特点:
- 并非每个事件都属于一个序列或控球
- 与此相关的是,并不是比赛中每一秒钟的控球都会被标记为属于某个特定的球队
- 一个序列开始于一名球员对球做出受控动作。这包括传球,但不包括防守事件,如拦截和拦截,除非这些事件之后有一个受控动作,如传球或运球。
- 在某场比赛中,属于每队的控球次数只能相差一次。这似乎与传统的控球率概念相悖,但在计算个人控球时,如果一队结束控球,另一队就开始控球,这在逻辑上是一致的。
- 然而,每队的控球时间和某队控球的序列数不一定相等
请看这个序列示例(在本例中也是控球),利物浦队从乔尔-马蒂普(Joel Matip)的头球传中(绿色)开始,到射门击中木板(绿色箭头)结束。
上述序列告诉我们利物浦队在射门之前是在什么位置和什么类型的事件中赢回了球。我们还知道,从得球到射门之间大约有 14.5 秒的时间,所有事件之间的序列追踪距离为 126.44 米,如果只考虑直接向前推进的距离,则为 55.96 米。
在这一序列中,我们还可以确定在这一镜头之前的传球次数。
财产倾向
下面的柱状图显示了每场比赛控球次数的基本分布,以及不同控球次数出现的频率。每场比赛的控球次数通常略少于 200 次,即每队 90-100 次。
下图显示了 2016-17 赛季英超联赛中所有序列长度的分布情况。正如您所看到的,许多序列都很短,还没覆盖多少内容就被打断了,总的趋势是总长度越来越长,频率也就越来越低。
直接速度
直接速度是可以通过序列计算出的统计量的一个例子。我们将其定义为球飞行的米数(直接在前场测量时)除以序列的总时间。
参照之前的利物浦序列,直接速度为每秒 3.85 米(55.96 米除以 14.5 秒)。如果与其他序列进行比较,就会发现这是一个相对较快的序列。同样,这在序列层面上比在控球层面上更有意义,因为控球中断会使速度指标的意义降低。
下面您可以看到 2016/17 赛季英超球队在开放比赛中的直接速度中位数。值得注意的是,这捕捉到了一些与成功结果并不一定相关的风格元素,阿森纳出现在斯托克城和莱斯特城之间,而曼联则更接近赫尔城和伯恩茅斯就是证明。
战术应用介绍
控球框架可以回答分析师或教练可能提出的许多问题,而单一事件指标往往难以概括这些问题。具体来说,它可以回答有关模式和行动如何连续发生的问题。
举个更详细的例子,考虑一下一支球队的直接性是如何根据两个因素发生变化的:他们在哪里赢回球,以及他们是打边路还是打中路。
要回答这个问题,有必要将起始位置和宽度概念作为序列的特征。根据起始位置(己方半场与对方半场)对序列进行分组可以达到第一个目的。为了对宽度进行分类,我将序列定义为宽通道或中央通道,具体做法是考虑大部分上场过程是在中央通道内还是在下图所示的宽通道内。
切尔西最初在直接速度方面并不突出。不过,考虑到根据起始位置和控球宽度进行的具体划分,我们可以强调,在本方半场得球后向中路推进时,他们的这一指标在2016-17赛季英超联赛中排名前三(2.47米/秒,而从本方半场向中路推进时为1.93米/秒)。
当然,这是一个有些特殊的例子,但它很好地展示了多个事件提供的背景如何使统计方法能够回答有时难以用单一事件指标回答的问题。Will Gürpinar-Morgan在2017 OptaPro分析Forum的演讲中也采用了类似的例子。
在应用赛事数据分析比赛时,这种 "控球率 "式的框架--现在已经变得很普遍--可以极大地帮助这种工作方式,提供一个平台,让我们对球员、球队或联赛的整体风格有更深入的了解。
我谨代表 OptaPro 借此机会感谢 Michael Caley、Garry Gelade、Sam Green 和 Ian Graham 对本模型的意见和反馈。




