跳至主要内容
2018 年世界杯期间,俄罗斯与沙特阿拉伯的比赛中,卢日尼基体育场的球迷欢呼雀跃
俱乐部媒体、高校媒体、联合会和版权持有者、出版商

体育报道的未来:第 1 部分

Stats Perform首席科学家 Patrick Lucey 谈论体育领域的 ChatGPT、深度学习和AI 技术。

作者:Patrick Lucey帕特里克-卢西

OpenAI 的 ChatGPT 于 2022 年底推出。这个 "会话式聊天机器人 "经过大量互联网文本的训练,迅速积累了数百万用户,他们热衷于体验AI 技术在日常应用中的新突破。

但 ChatGPT 是否与体育相关?它是对Stats Perform自己的机器学习模型的补充,还是与之竞争?

剧透ChatGPT 采用了一些与Stats Perform的AI 团队相同的深度学习方法,但输入不同,目标也不同。事实上,这些相同的AI 技术在科技界随处可见,解决了无数问题。在这里,我们将用 ChatGPT 来解释这些底层AI 技术,以及 ChatGPT 的价值、局限性和它在体育产业中的相关性。

在后续文章中,我们还将讨论Stats Perform 当前和未来使用类似深度学习方法解决体育问题的一些情况。 

什么是 ChatGPT?

ChatGPT 是一个阅读了互联网上大部分文本的模型,能够理解单词、句子和段落的结构,因此它可以接受作为文本输入的问题,并以对话式文本输出的形式生成听起来连贯的答案。

它使用 "生成式AI"来生成 预测序列中的下一个单词 从统计学角度看,这些词很可能是一系列给定输入提示的后续词、 根据前面词语的上下文。其输出以流畅、自然的文本回复形式出现。

从技术角度讲,ChatGPT 是生成式预训练转换器(GPT)大型语言模型(LLM)的一种变体,它使用提示工程来诱导模型产生类似对话的行为。

语言模型并不新鲜,但 ChatGPT 所使用的 GPT-3 LLM 的神奇之处在于它是 大:不仅是它所训练的数据(即互联网上的所有文本数据),还有它所使用的参数数量(1750 亿)。它采用变压器网络方法,在这个庞大的文本库中学习相关性和模式,这似乎是超人所能做到的。

通过巧妙地设计输入问题来描述所需的回答内容和风格,这被称为 提示工程ChatGPT 能够选择少量显示所需风格和内容的文本样本进行训练,并合成这些样本,以模仿人类语言的方式为文本、文章和问题答案生成类似散文的输出。

生成式AI 还能做什么?

大型语言模型是生成式AI 模型的一种。这些模型还可以接收文本输入并生成其他输出,例如图像(例如 OpenAI 的 DALL-E-2)和视频(例如 Meta 的 MakeAVideo).甚至机器人技术也在利用这种技术,随着 RT-1是一种转换器,可将自然语言文本指令和图像作为输入,并在提示下直接生成现实世界中的机器人任务作为输出。

LLM 还可用于特定领域的内容理解/翻译/问题解答(如提取、总结和编码临床记录)。 对临床记录进行编码法律文件)和 客户服务.法律硕士为编码辅助工具提供动力,例如 Github 的 Copliot,它可以标记错误并生成或自动完成 代码、该工具可根据正在使用的特定 API 的上下文标记错误并生成或自动完成代码。.

ChatGPT 的局限性

生成式AI 就像标签上写的那样--生成预测。

ChatGPT 知道单词,知道哪些单词有可能在句子中一起出现,以及出现的顺序。它最终选择的实际单词并不重要,只要整个句子中的单词听起来靠谱就行,但这是个问题,因为它经常会 "幻化 "出一些事实单词--而事实是无法改变的。

除了幻觉问题外,ChatGPT 在编写答案时还会采用一种权威的方式,使错误的答案听起来仍然可信,尤其是对非专业人士而言。

这不仅是 ChatGPT 的问题,也是整个生成式AI 工具的问题。它非常擅长伪造真实内容(例如,在图像、视频和音频中进行深度伪造)。像所有工具一样,你必须知道技术能做什么,但最重要的是它不能做什么。

ChatGPT 在体育运动中能做什么(不能做什么)?

首先,ChatGPT 只对截至 2021 年 9 月的单词进行过训练,因此无法提供任何最新答案。其次,GPT-3 要求输入文本。体育语言与文本不同,而在Stats Perform,我们创造了 "体育语言",为我们的AI提供动力。最后,也是最重要的一点,ChatGPT 并没有进行优化,以确保其预测的 "答案 "与事实相符。

ChatGPT 对橄榄球或板球、篮球或足球、国家、杯赛、球棒、球或世界上任何其他东西都一无所知。 它没有接受过关于事实和统计数据的训练,也不知道如何识别准确的信息来生成预测。 它只知道单词的顺序。

这就限制了它在新闻和体育等领域的应用,因为在这些领域,结果就是结果,统计就是统计,尤其是 ChatGPT 可以生成看似可信但并非基于实际情况的精心撰写的文章。

您可以通过向它提出非常具体的问题来了解这一点,比如关于 2019 年世界杯橄榄球运动员的问题:

这份精心撰写的答案的前两句与事实不符--切斯林-科尔比在小组赛中对阵意大利队时两次得分,在决赛中对阵英格兰队时一次得分。

ChatGPT 在体育运动中能发挥作用吗?

P有了结构化、准确和最新的数据和内容馈送,理论上,未来版本的 ChatGPT 可以通过 "为我写一份明天所有比赛的预告 "这样的文本问题触发,快速生成文本文章,为球迷提供最新信息。

不过,类似的机器自动撰写的文章已经存在。它们没有使用 ChatGPT 所提供的 "对话 "流程,但它们与事实相符。

这是一个细微差别,但 ChatGPT 既能生成叙事,也能生成叙事中的信息。这就使得生成式AI 在合成新闻报道(包括体育报道)时出现问题。

相反,像Stats Perform的 "自动游戏预览 "这样以事实为基础的具体产品,首先使用我们体育数据源中的统计数据和事实作为故事的种子,然后围绕这些具体信息展开叙述。

由于我们的工具以我们的数据源为起点,而这些数据源是结构化的、准确的,这就意味着所撰写的文章不会改变,也不是 "生成 "的预测,而是真实发生的。

其他以我们的数据源为基础的自动体育报告式服务包括 "Pressbox Live"(为电视评论员生成实时见解)和 "PressboxGraphics"(每当有进球、达阵或上篮得分时,为社交媒体或博客自动生成图像)。

下一步是什么?

第二部分中,我们将了解ChatGPT 背后的AI ,并回顾它是如何被用于提升运动体验的,尤其是在高性能领域。

第 3 部分中,我们将讨论最新 ChatGPT-4 模型的影响及其对体育运动的改变。