跳至主要内容

重新审视整理技能

由Stats Perform

招聘和球员评估中的一个常见问题是比较处于不同职业生涯阶段或经历不同职业生涯的球员。 

这显然是一个极端的例子,但考虑一下本赛季初的马库斯-拉什福德和韦恩-鲁尼。一个是仅在联赛中出场 11 次的 18 岁前锋,另一个是在联赛中出场超过 400 次的 30 岁前锋。

在这篇博客中,我用一个相对简单的统计数据--转换率--作为模板,来了解我们如何改变假设,从而更好地理解球员评估。

我们的方法不仅要考虑球员过去的表现,还要考虑我们对未来表现预测的不同程度的不确定性。

我们现在正处于足球分析的一个阶段,在评估前锋球员时,应该采用预期进球等更先进的指标,但转换率可以作为一个很好的起点,因为我们知道有些球员的转换率一直高于平均水平。

那么,我们如何将这些球员从中挑选出来呢?

重新开始:返璞归真

我决定沿用大卫-罗宾逊(David Robinson)估算棒球平均打击率的方法。我将从头至尾概述这一点,随着文章的进展,这种经过调整的思维方式背后的基本过程将逐渐清晰。

首先,我查看了 2005-06 年至 2015-16 年期间英超、西甲、德甲、意甲和法甲每名球员的所有转换率。一个简单的表格揭示了这一时期的最佳转化率。

尽管马塞尔-齐默(Marcel Ziemer)和门将蒂姆-霍华德(Tim Howard)在德甲联赛中的出场时间都只有 37 分钟,但他们的转换率似乎都很高,我们可以有把握地说,他们在这些比赛中可能都不是最好的终结者。

这里的问题显而易见:这些球员的出手次数都不够多,因此他们的转换率会因为样本太少而有所偏差。那么,如果我们在表格中加入射门次数过滤器,只看射门次数超过 30 次的球员,会出现什么情况呢?

现在这份名单看起来好了一些,但所有球员中转换率最高的仍然是右后卫保罗-维尔海格(Paul Verhaegh),虽然前锋巴斯-多斯特(Bas Dost)和达里奥-奇维塔尼奇(Dario Cvitanich)等几个名字开始变得更有意义,但仍然让人感觉完全不能令人满意。

新的诊断...

退一步说,我们可以开始诊断问题,并采用更明智的方法。一般来说,大约每 11 次射门就有一次得分,因此我们可以先假设每个球员的平均转化率都是如此。在这个样本中,射门 30 次或以上的球员的平均转化率为 9.12%。

转换率和职业生涯投篮命中率

很明显,平均而言,一名球员的射门次数越多,其转换率就越接近平均值(以红线表示),而射门次数较少的球员之间的差异则要大得多。这种被称为 "向平均值回归 "的统计现象表明,即使一名球员在小样本中拥有超高的转换率(如保罗-维尔海格),我们也会期望他的转换率随着时间的推移恢复到更接近平均值的水平。

然而,这似乎过于简化了事件和结果,因为我们知道其他因素也会发挥作用。为了调整这种现象,我们可以使用所谓的经验贝叶斯方法。康斯坦丁诺斯-查帕斯(Constantinos Chappas)在 OptaPro AnalyticsForum 上使用了类似的方法,用类似的综合指标来研究逐年的不确定性

调整起始位置

我们从一个先验信念开始--在本例中,每个球员开始时的转换率都是 9.12%--每一个新的数据点(在本例中是投篮及其结果)都会使我们的估计偏离起点。

因此,如果一名球员射门得分,他的估计转换率就不会像之前的情况那样立即达到 100%。现在,他们的估计转换率只会有很小的变化,这取决于我们之前认为他的转换率是 9.12% 的看法有多大的改变(数学附录中有更详细的说明)。

通过这种方法,我们可以得到一个新的排行榜。

特色球员现在看起来更合理了。在前五名中,哈维尔-埃尔南德斯(Javier Hernandez)在曼联(Manchester United)和拜耳勒沃库森(Bayer Leverkusen)的进球率都令人印象深刻,卡洛斯-巴卡(Carlos Bacca)在塞维利亚(Sevilla)和 AC 米兰(AC Milan)也有类似的表现。不过,我们仍有理由持怀疑态度:右后卫保罗-维尔海格(Paul Verhaegh)虽然只有 51 次射门,但仍位列前五。

这就引出了图表中的第二个趋势。这与其说是一种传统的统计趋势,不如说是基于对比赛本身的理解:射门次数多的球员,其转换率往往高于平均水平。

转换率和职业生涯投篮命中率:上升趋势

蓝色趋势线清楚地表明了这一点,但即使只看职业生涯中投篮超过 500 次的球员,几乎所有球员的转化率都高于样本平均值 9.12%。

那么,为什么会出现这种趋势呢?从本质上讲,优秀射手的投篮命中率更高。这可能是由于优秀的射手获得了更多的上场时间,优秀的射手相信自己能更频繁地投篮,优秀的射手试图更频繁地创造投篮机会,队友希望更频繁地把球传给优秀的射手,或者其他各种因素。

转变我们的信念

从估算的角度来看,这意味着假设所有球员在投篮前的转换率都是 9.12%是有缺陷的,因为优秀的射手投篮次数越多,转换率就越高,从而夸大了这一平均值。

通过确认球员在职业生涯中的投篮次数,我们可以解决这个问题(称为贝塔-二项式回归)。在这种新方法中,我们认为优秀射手的投篮次数会更多。

最后,排行榜上的前五名都是过去十年中表现最出色的前锋。

这只是考察终结能力的众多方法之一。这也可以应用于其他统计和指标,并能更好地指导我们如何衡量和评估球员。

不过,这个特殊的例子说明了我们如何利用相当简单的综合数据--在本例中基本上只有进球数和射门数--来获得有意义的见解,并从大量不同的球员样本中找出关键的球员技能组合。

最后,我们再来看看拉什福德-鲁尼的例子。使用这种方法,拉什福德的估计转换率为 11.31%,鲁尼的预期转换率为 13.24%(与他在这段时间内的实际转换率相同)。 因此,尽管拉什福德在他的第一个英超赛季中16次射门打进5球,转换率为31.25%,但这一估计转换率考虑到了他的射门次数远少于鲁尼这一事实,并没有让我们得出拉什福德已经是比鲁尼更好的终结者这一也许是不明智的结论。

 

单击此处查看数学附录