跳至主要内容
职业俱乐部和学院

研究论文--从大量大学篮球跟踪数据中预测 NBA 人才

由于没有 NCAA 球员的详细跟踪数据,NBA 球队的选秀决策能力受到了限制。为了规避这一问题,我们利用最先进的计算机vision 技术,直接从转播视频中捕获了数千场 NCAA D-I 男子篮球比赛的历史跟踪数据。

由Stats Perform

2010 年,SportVU 光学球员和球追踪系统首次被希望在球员和球队分析方面获得优势的球队部署在部分 NBA 赛场。由于追踪数据的价值,NBA 随后在 2013-14 赛季之前在全联盟范围内采用了 SportVU。从那时起,NBA 球队的几乎所有分析和决策都以数据为导向,不仅利用原始位置数据,还利用机器学习算法自动检测到的标记(如挡拆、隔离、驱动等)得出战术见解。

然而,在为即将到来的选秀大会分析 NCAA 球员时,NBA 球队的决策能力受到严重限制,因为他们没有 NCAA 球员的详细跟踪数据。对于 NCAA 来说,场内硬件解决方案是不切实际的,因为仅 I 级学校就有 300 多所,此外还有许多不在 NCAA 场馆进行的表演赛/锦标赛和季后赛。此外,NBA 前方办公室若要对大学球员的未来潜力产出进行建模,则需要现役 NBA 球员的历史跟踪数据来建立建模训练集,而这是场内解决方案无法实现的。

为了解决这个问题,我们利用最先进的计算机vision 技术,直接从转播视频中捕捉了数千场历史上的 NCAA D-I 男子篮球赛的球员和球跟踪数据。这些数据量相当于超过 650,000 次控球和超过 3 亿帧的转播视频。从跟踪数据中,我们使用演员-动作注意力神经网络系统自动检测事件,如控球、驱动、隔离、上篮、球外拦截和防守对抗,召回率和精确率分别达到 0.8 和 0.7。

尽管从转播中生成大学篮球比赛的跟踪数据本身就是篮球分析领域的一项重大突破,但这还远远不够。要展示生成数据的价值,最好通过预测任务来衡量其价值。在本文中,我们的重点是预测未来 NBA 球员的天赋。为此,我们直接从大学数据中预测球员进入 NBA 的概率。我们的研究表明,与目前的数据来源相比,使用追踪数据能让我们获得更准确的预测结果(追踪对数损失率:0.30 vs 逐场对数损失率:0.40)。我们的方法还有一个好处,那就是我们应用了 "可解释的机器学习 "技术(即 Shapley 值),不仅能做出准确的预测,还能识别特定球员的优缺点。

查看研究论文全文