



对于体育分析活动来说,年初总是一个繁忙的时刻,因此我的日程表也是如此。
从一月份到三月份,每个月都会在不同的国家举办一次 OptaPro 活动。这是我对许多业内人士所面临的 "周六-周二 "繁忙工作的真实写照,我为那些不慌不忙地完成工作的人喝彩。
2019年的开端略有不同。麻省理工学院的斯隆体育分析大会是一个受欢迎的多体育分析大型活动的配菜,帮助我正确解构和消化我的足球分析大会主菜。
直到几年前,足球还只是斯隆大学辩论的一小部分。然而今年,我们看到了多个专门针对足球的小组讨论和讲座,几张关于足球的海报,研究论文竞赛的优胜者也以足球为主题。美丽的比赛已经不再是无法分析的了。挤一挤篮球,洗一洗棒球,在受分析技术影响的主要体育项目中,我们还有一席之地。
以下是我对几场演讲的感想,以及将我在斯隆大学的经历与足球分析现状进行比较时的三个问题。
塑造足球的未来
我参加的第一场会议是 OptaPro 赞助的 "塑造比赛的未来 "小组讨论。讨论范围很广,涉及的话题包括年轻球员取得成功所需的特点、哪些指标可以用来预测球员是否会成为高级职业球员以及 VR 对帮助球员学习和提高的未来影响。
围绕球员发展的讨论既影响到英国足球(因为英国脱欧和工作签证难的小问题),也影响到美国足球(越来越少的球队从 MLS 超级选秀中获得价值,更多的球队投资于自己的学院)。
几年后,随着青少年数据样本的增加,以及新一代教练对这项运动的掌舵,从球探的角度来看流程发生了怎样的变化,这将是一件非常有趣的事情。与美国的传统体育项目相比,足球的发展道路如此不同,这是一个足球可以塑造自己分析未来的领域。
未来五年,各俱乐部无疑将以不同的速度取得进步(正如我们在过去五年中所看到的一样),但在数据和分析为球员进步provision 依据的背景下,成为规范的关键领域很可能是围绕租借管理和提供适当的比赛经验。虽然这在一定程度上正在进行,但目前还停留在为球员确认球队,而不是探索租借如何影响他们的未来发展。
这将扩展到在俱乐部成为职业球员的人数,而不是被出售或退出比赛的人数。了解现代足球运动员现在和五年左右后在其所在联赛中的表现的俱乐部,将能够量身定制一项学院计划,培养出具备相应技能的球员,以实现这一目标。
狩猎独角兽
接下来,我参加了篮球分析小组讨论 "寻找独角兽"。小组讨论一开始就讨论了什么是 "独角兽"(基本上是指在技能组合/配置方面完全离群的球员)。我一眼就看出这与我们在足球领域的讨论有相似之处,既有涉及神兽的讨论("没有超级巨星/独角兽,你能赢吗?"),也有不涉及神兽的讨论("如果把前伟大球员x放到现在的联盟中,会发生什么?")。
人们经常争论 x 队是如何赢得 y 冠军的,这是因为他们有独特的 z 打球风格。然后,我们会看到其他球队复制 z 风格,而这种风格不会改变,直到另一支球队冲出他们的轨道,开始 zag,而其他人则 zigs。
正如保罗-皮尔斯在小组讨论中指出的,NBA 是一个 "山寨联盟"。虽然我们在足球比赛中看不到像篮球比赛那样极端的球队风格,但这是一次很好的讨论,探讨了如何找到优势,以及跳出框框思考(但不是投篮!)如何能带来收益--只要你继续与惰性作斗争。
我觉得在我们的体育运动中,有一种媒体的说法是球队如何寻求采用当日球队的风格(莱斯特城赢得联赛,控球已死!曼城队赢得联赛,控球万岁!),而问题在于,人们对足球比赛可以通过多种不同方式获胜这一事实视而不见。独角兽 "小组一致认为,虽然密尔沃基雄鹿队、休斯敦火箭队和金州勇士队的数据相差无几,但他们都打出了截然不同、无与伦比的篮球品牌。
波士顿凯尔特人队助理总经理迈克-扎伦(Mike Zarren)也提出了一个很好的建议,即分析师在不知道的时候应该什么都不说。几年前,迪恩-奥利弗在 OptaProForum 的主题演讲中也提出了类似的观点,我当然记得在过去的一些情况下,我也希望自己能接受这种思路。
我之前简要提到过海报,但我对展出的两幅足球海报印象深刻--部分原因是这两幅海报都只使用了事件数据。在我看来,这是对 "我们已经从这个数据集中榨取了最后一滴效用 "这一观点的有力反驳。Statsbomb 的德里克-任(Derrick Yam)的海报确定了一个分析守门员表现的框架,而 SciSports 的四人小组则分析了在不同压力下的比赛表现(压力是指比赛的重要性,而不是罗伯托-菲尔米诺(Roberto Firmino)对你的压迫)。
未来的挑战
计算机vision 是今年整个会议的一个重要主题,会上展示了大量由这种方法生成的数据驱动的成果。会议传达的基本信息似乎是,我们需要更多有关身体姿势的细粒度信息来回答教练提出的问题。我觉得,虽然这对分析能力更强的运动来说可能是正确的,但对足球来说可能是太快了。我并不反对这种观点,即更高质量的数据可以为更高质量的分析提供依据,但这也为我们这个行业的未来发展带来了一些挑战。
首先是考虑如何最好地从跟踪数据中获取价值。在我看来,跟踪数据的真正价值在于为我们提供更好的分母。例如,通过前场传球的总数,我们就能了解这些传球是来自球员受到压力的情况,还是来自突破防线的情况,抑或是传给空位队友的情况。在中短期内,能够利用分析师没有能力现场跟踪或赛后跟踪过于耗费人力的限定词来丰富赛事数据,将是最有价值的地方。
其次,要考虑如何填补那些能够从事件数据中获取价值的分析师与那些能够从跟踪数据中获取价值的分析师之间的技能差距。对于事件数据,罗布-卡罗尔(Rob Carroll)等人已经为视频分析师提供了工具,让他们只需使用 Excel 就能从事件数据中获得有意义的见解。跟踪数据无法复制这种方法。在我看来,这些数据集之间复杂程度的飞跃将责任推给了产品的构建者,或迫使团队聘请具备使用这些数据技能的人员。虽然有些公司展示了一些从视频中获取数据的真正创新方法,但我们面临的挑战将是如何扩大这种方法的规模,并以易于消化和分析的格式提供数据。
最后,我预见到这个行业缺少我称之为 "翻译 "的人才。现在可能只有极少数人能胜任这样的工作,即在俱乐部内围绕数据的使用设计和实施战略,并对比赛有相关的战术理解。这个人负责选择使用何种技术、数据和产品,聘用哪些人员,并善于了解学院、招聘和分析部门的需求。他们(并不总是)从事技术性更强的工作,但他们对技术有全面的了解。当团队开始聘用更多的技术人员时,有一个非技术人员将这一切整合在一起,似乎是获得认同和实际参与决策过程的重要一步。
对于那些希望进入这一行业的人来说,我认为这是一本必读书。我认为,那些充分了解俱乐部如何在分析和招聘方面开展工作、市场上提供的产品以及俱乐部成功的数据分析师或科学家所需的技能组合的人才供不应求。虽然足球分析是一个以技术为主的领域,但肯定需要那些能编写剧本,并将剧本的执行留给他人的人。