跳至主要内容
广播公司和联网电视、联合会和版权持有者、职业俱乐部和学院

生成式人工智能在体育领域的应用:第一季度最新情况

作者:Patrick Lucey帕特里克-卢西

欢迎阅读Stats Perform最新一期的《人工智能在体育领域的最新趋势 》系列报道,我们的首席科学家帕特里克-卢西(Patrick Lucey)将在本期报道中讨论生成式人工智能的最新发展及其在体育产业中的应用。

对于人工智能和体育界的人士来说,二月份的超级碗比赛在赛场内外都让他们大饱眼福。

在球场上和我们的屏幕上,我们看到球员们使用他们的团队分析师在机器学习的帮助下设计的战术,我们听到解说员为我们提供人工智能驱动的见解,帮助我们理解上下文和含义。

在赛场外,超级碗的特色广告是将人工智能作为主流消费产品的一项功能,如微软的 Copilot 广告,以及谷歌利用人工智能展示其 Pixel 手机的强大功能。

在 "超级碗 "前后的短短时间内,我们看到了谷歌的双子座、苹果发布的完整 Vision Pro 以及 OpenAI 最近发布的多模态文本视频工具 "Sora "等头条新闻,还有关于发布人工智能代理和提高检索-增强生成(RAG)利用率的传言。

在本文中,我们将介绍生成式人工智能领域的一些发展,并解释 RAG 和多模态 LLM。我们将概述它们与我们在体育领域的关系(包括对球迷和专业队伍的应用),并讨论尽管发生了新的变化,但有一点是不变的:为 GenAI 模型提供动力的基础数据的价值。

总结:ChatGPT 12 个多月以来的情况

在 ChatGPT 推出一年多之后,我们看到的是,生成式人工智能技术并没有像某些人担心的那样取代人类的工作,而是让人类能够做得更多。

ChatGPT 和随后的基于 LLM 的技术为我们提供了一系列 "人工智能辅助 "工具,可以帮助我们更好更快地完成一些任务。

例如,客户服务、语言翻译、搜索和查询文档(无论是公共文档还是私人文档)都开始比以前更高效、更大规模地进行。它还可以创建新的内容,无论是文字、音频还是图像和视频(或其组合)。

归根结底,这些领域的进步(以及推动 Copilot、Gemini 和 Sora 的动力)是因为 GenAI 最大限度地提高了我们从数据中提取价值的能力。基础数据仍然是 GenAI 生态系统中最重要的元素。

生成式人工智能的第三次浪潮:差异化数据

Vista Equity Partners 董事长兼首席执行官罗伯特-史密斯(Robert Smith)最近对他眼中的 "生成式人工智能的 3 个浪潮"进行了精彩的总结。.

在第一波浪潮中,他认为硬件供应商(如英伟达)将获得持久价值。

他说,在第二波浪潮中,持久价值将属于超级扩展者(如云服务提供商)。

而在第三波浪潮中,他说,那些能够在其产品销售的特定市场中利用这种能力的人,将受益于其持久价值。换句话说,如果你在某个特定领域拥有关键的差异化优势(如体育领域独一无二的深度和广度数据),生成式人工智能就能 "超级推动 "该领域的产品和服务。

目前,前两波浪潮正在上演。

第一波浪潮使芯片制造商受益匪浅,他们对可用于 GenAI 的芯片的渴求似乎无止境。这已经流入第二波浪潮,云提供商拥有必要的存储和计算能力来扩展 GenAI 解决方案,并将其捆绑到他们的通用解决方案中,这也正在发生。

但是,第三波浪潮才具有长期持久的价值,因为特定市场需要针对其特定用途量身定制的解决方案。

为什么数据对于体育领域的基因人工智能应用仍然如此重要?

值得记住的是,要获得最准确的输出,生成式人工智能系统需要最准确、可靠和统一的数据输入。没有高质量的输入,错误的输出或错误的信息就会传播,或者人工智能的应用受到严重限制,尤其是在特定领域的应用。

因此,尽管事情看似在不断发展和变化,但从本质上来说,一切都还是一样的,因为所有的信息和见解都是以可靠和准确的数据为基础的。

在体育或医学等特定领域,在球员分析和成绩预测或症状诊断和治疗评估等特定用例中,不能弄错事实。否则,下游分析、预测和诊断也会出错。

此外,数据越详细、越一致,产出和回应就越具体、相关和有用。

例如,在足球领域,Stats Perform 拥有 13500 多支职业男子和女子球队的详细Opta 数据,我们确保在所有比赛中(而不仅仅是少数几个联赛)生成相同的数据和测量结果。

因此,在所有足球联赛中,传球和射门都有相同的统一定义和集合。每个事件的元数据(如名称、时间戳和位置坐标)都使用相同的协议。

实时收集的数据具有统一的分类和结构,这意味着生成式人工智能模型可以在海量数据(包括历史数据和比赛中的统计数据)上进行训练。

这不仅提高了它们的功效,还增强了搜索能力,更容易识别数据集中的相关性和模式。

如果不统一收集和分配这些数据,统计结果和衍生输出对人类和 GenAI 模型都毫无意义。

生成式人工智能可以帮助我们发现以前仅靠肉眼无法发现或埋没的宝贵见解。它有助于将基础数据的价值最大化。如果数据详细、统一和客观,其价值就会进一步提高。

源数据集越深入,GenAI 得出的模式就越有洞察力,预测就越准确,对体育等特定应用和领域的实用性就越大。

数据的质量、深度、广度和一致性是人工智能系统(特别是 GenAI 系统)蓬勃发展的关键要素。

另一方面,媒体对深度伪造视频可能影响选举的报道越来越多,这让我也开始考虑独立、可信的体育数据的价值,以打击或应对可能威胁体育完整性的恶意使用深度伪造视频的行为。

有些人可能还记得,几年前有人在社交媒体上发布了迈克尔-乔丹战胜克雷格-埃洛的著名投篮的 "另类历史"。s几年前.它显示乔丹错失了制胜一球,而实际上他却投进了,这让许多观察者大跌眼镜。随着文本转换视频 LLM 越来越有效,深度伪造渗透到体育运动中的可能性也越来越大。

这也是我们非常重视Stats Perform作为值得信赖的体育记录保存者角色的另一个原因,我们非常感谢我们出色的数据运营团队,他们夜以继日地关注我们数据的完整性,因为像 Opta 这样值得信赖、独立且可验证的数据来源在造假泛滥的未来可能会变得更加重要。

什么是 RAG?

检索-增强生成(又称 RAG)是生成式人工智能领域的另一项相对较新的发展,它使 "非技术专家 "能够检索和查询知识库。,检索-增强生成(RAG)是生成式人工智能领域的另一个相对较新的发展,它使 "非技术专家 "能够检索和查询知识库,而无需依赖工程师或数据库专家来获取数据,否则这将是一大障碍。

如果有了坚实准确的数据基础,RAG 就可以将这些信息与当前基于 LLM 的技术结合起来。

这种 GenAI 技术可以让人们做更多的事情,实现更快的迭代,更快地获取知识。在某些方面,它是终极助手--就像有一位专家永远站在你的肩膀上,为你提供答案(......)。i如果系统能够获取最准确的最新数据)。

无论您在哪里拥有广泛的信息知识库,使用 GenAI 都可以实现体育信息的检索和查询,而 RAG 可以让需要访问特定领域知识的系统更轻松地实现这一目标。

但是,由于幻觉和过时信息可能会传播,因此仍需十分谨慎,这意味着 因此,必须确保基础源数据的质量和可信度。

但是,如果使用得当,并辅以防护措施和监督,RAG 可以在体育界个性化内容和治疗方面发挥巨大作用。

在今后的文章中,我们将深入探讨这一主题。

使用视频、图像和多模态 LLM 的发展情况

体育语言既包括球上数据,也包括收集到的球外运动数据。我们称之为多模态,因为它能捕捉到两种互补的信息模式--如图像或视频,并配有文字说明来描述所发生的事情(这就是 GPT-4、Gemini 和 Sora 能够生成文本2图像和文本2视频的原因)。

在体育运动 LLM 中有效利用视频的一种方法是捕捉并结合球外和球内球员及球的数据,因为这样可以全面重建完整的测量表现,并建立互动应用。

最近的一项进展是,我们能够利用庞大的 Opta 数据库和多模态 LLM 来估计视频中无法看到(部分或全部)的缺失球员位置,从而能够根据其他球员的位置和他们正在做的事情来全面分析每一次传球和决策。

我们刚刚在 2024 麻省理工学院斯隆体育分析大会.但这仅仅是个开始--在这个基础模型上还会有更多的应用。期待我们在这一领域的更多更新。

最近的生成式人工智能进展还能如何与职业体育分析联系起来?

针对特定体育项目的 LLM 还可用于创建以前无法准确建模的预测,为球队分析师和教练提供了非常强大的助手。

例如,足球运动员的个人统计数据建模是出了名的困难,因为这取决于他或她与哪些队友、哪些对手一起踢球,以及实时预测的比赛状态(如球队是否获胜/输球、是否有球员被罚下场等)。

然而,用于训练为 ChatGPT 和 Gemini 提供动力的模型的相同生成式人工智能方法(即变压器神经网络)可用于从同一模型中生成对每位球员(和球队)的预测,这是对体育预测方式的范式转变

这种方法的威力不仅在于提供更准确的预测,而且还能实现新的应用,例如 "虚拟助理教练",用户可以问 "如果我让 X 球员下场,让 Y 球员上场--这会如何改变比赛结果,或导致更多或更少的射门? 或者,另一个问题可以是 "在这种情况下,后卫应该在哪里拦截射门?",或者"球员下一步将在哪里击球"。

这可能是与体育运动互动的一种新方式,而这种互动方式曾经只局限于视频游戏。最后一个例子是,在 2024 年 1 月举行的上届澳大利亚网球公开赛期间,我们与澳大利亚网球协会的伟大合作伙伴共同完成了这项工作。您可以在这里看到它的实际效果。

与其他人工智能助手一样,体育分析师和教练将有能力制定更加复杂的战略和战术,从而为现场球迷带来更多的 "精彩瞬间"。

体育数据和 LLM 在混合现实技术(即 Apple Vision Pro)的发展中发挥着怎样的作用?

在 Apple Vision Pro 发布视频中,观看体育比赛并与之互动占据了重要位置。

除了多角度观看比赛外,用户还可以通过音频查询或手势,在观看生态系统中获得他们想要的所有数据和见解。他们还可以与模块互动,以获取相邻内容,如集锦、其他比赛、与朋友聊天或观看评论(或上下文广告)。

其目标似乎是创造一种 360 度的体验,最终使比赛的每个细节都更有趣、更有娱乐性,使球迷与球员、球队、"主播 "和赞助商之间的关系更加紧密。

优质的体育数据以显而易见和幕后的方式为这些体验提供了支持。

这些幕后方法包括 LLM 为预测提供动力;策划最佳内容和广告,在最佳时间播放,包括集锦;根据比赛状态和偏好,个性化用户看到、听到和感受到的内容;提供游戏化机会;增加令人难以置信的背景层次,使运动员的技能更令人难忘,并全面深化赛事的故事性,从而提高其对球迷和赞助商的价值。

更不用说它还能为分析师和教练提供战术见解,将现场娱乐提升到更高水平!

斯隆体育分析会议 2024

在本次更新的最后,我刚刚从斯隆体育分析会议(Sloan Sports Analytics Conference)上回来。如前所述,我们在会上发表了一篇论文,介绍了在高质量源数据的条件下,如何将生成式人工智能用于体育领域的特定应用,即预测转播中无法直观感知的足球运动员的准确位置(链接如下)。其他小组讨论和演讲讨论了 GenAI 在体育组织任务中的广泛应用,如客户服务和搜索。我们将在今后的文章中讨论这些应用和其他具体应用。


帕特里克-卢西 是Stats Perform 的首席科学家。您可以阅读他对ChatGPT大型语言模型在体育中的作用以及下一步发展的看法和见解。

帕特里克的文章即将发表:他将讨论 Stats Perform的 2024 论文斯隆体育分析会议上发表的 2024 年论文、生成式人工智能能否改善 VAR(视频助理裁判)在体育中的应用、人工智能代理在体育中是否有用,以及生成式人工智能在增强体育转播和赞助方面的应用他还将重新审视 RoboCup 的最初目标,即到 2050 年,让完全自主的仿人机器人在真正的室外场地上击败世界上最好的人类足球队!