埃诺-萨里斯是棒球界最顶尖的分析作家之一。我不是。
但我是体育新闻出身,我花了大量时间与世界各地的数据应用者讨论数据在体育运动中的应用--无论是从媒体角度还是从团队表现角度。
埃诺和我见面讨论了他的职业生涯、分析技术如何改变了棒球写作,以及随着技术越来越多地融入棒球比赛,他认为棒球行业的发展方向。
以下是对话全文:
凯文-克鲁斯特棒球分析 "这个短语就出现在你的邮件签名中。你是如何成为一名棒球作家的?你是如何开始关注棒球比赛中的一些更先进的东西的?
伊诺-萨理斯:我其实是个移民。我的父母是德国人,我于 1986 年来到这个国家,其中一件让我很头疼的事情就是如何结识孩子,结识新朋友。我所做的事情之一就是通过棒球结识新朋友。事实上,我真的通过其他孩子建立了联系。这真的很重要。我想对其他人来说,棒球有时会(联系)孩子们,但对我来说,这就像是与国家、人民和文化的联系--这对我来说真的很重要。
我的继父也是一位棒球爱好者。在他的影响下,我们一起去看棒球比赛,然后进行棒球卡交易,我开始真正接触棒球运动员的评估。这不仅仅是假装加里-谢菲尔德(Gary Sheffield)的摇摆和玩威夫球之类的东西。还包括我怎样才能得到最好的棒球卡? 我怎样才能从我的朋友那里得到最好的棒球卡,然后给他们最差的棒球卡?所以从一开始,我就对棒球进行了一些分析。我想我并没有想到自己会成为一名职业棒球运动员。所以从一开始,分析对我来说就更重要一些。
KC:你还记得自己真正开始接受棒球先进分析技术并将其作为写作一部分的特定时间点吗?
ES:我想,我第一次凝结分析是我做的一次棒球卡交易。当时我大概八岁,有一张巴里-邦兹的新秀卡我非常想要。另一个家伙是勇士队的铁杆粉丝 我们住在亚特兰大 所以我就想,"好吧,我该怎么办?"我给了他一张马克-莱姆克的新秀卡,一张杰夫-布劳瑟的新秀卡,还有一张史蒂夫-艾弗里,就是一张普通的史蒂夫-艾弗里卡。我说:"听着,伙计,我并不想放弃这些新秀卡。马克-莱姆克,我喜欢这家伙,但我知道你不喜欢巴里-邦德。他很花哨,你讨厌他,我明白。把巴里・邦兹的新秀卡给我吧"我给你三张好卡"
我想,也许就是那一刻,我突然明白了分析是我喜欢棒球的原因之一。在写作之前,我玩了很长时间的梦幻棒球。为了赢得梦幻联赛,我想做的一件事就是阅读所有的分析报告。为了赢得所有的梦幻联赛,我阅读了《棒球前瞻》(Baseball Prospectus)。我读《FanGraphs》,我读《Rob Neyer》,虽然我读的是棒球,但我真的想知道如何赢得我的梦幻联赛。有一件小事有些人并不知道 FanGraphs 其实是大卫-阿佩尔曼为了赢得他的梦幻联赛而创建的。
所以我认为,有时你在棒球杂志上读到的东西,背后有一个合理的驱动因素。你所看到的分析,只是人们想赢得他们的幻想联赛。
KC: 我们偶尔会听说所有的数据都在毁掉棒球。你对此有何反应?
ES:我很同情那些不想读数据的人的想法,他们觉得数据太多了,而且我也看到数据变得越来越普遍。越来越多的人在写作中使用数据。对于这种人,我想说的是,仍然有伟大的分析,仍然有伟大的观点写作。仍然有优秀的专栏作家在做着出色的工作,他们可以阅读这些人的文章。
对我来说,以我欣赏棒球的方式,我认为数据只是锦上添花。(你可以说)"哦,迈克-特劳特,他是个了不起的球员,他是所有这些东西的完美结合"。这很好,但如果我能拼凑出一个数字,说他在(27 岁)之前是史上最佳,我觉得这更有说服力。你可以说,"哦,昨晚比赛中,有人接球接得非常棒,他跑到了墙边,这是我见过的最好的接球"。那只是你的一面之词你只是告诉我 "哦 那是我见过的最棒的接球之一"
如果你可以说,他跑得比今年任何人接球时都快,而且接球概率最低,而他跳得最高呢?我们现在就能做到我们可以告诉你,他跳得最高,接住了那个球。我觉得这更有说服力。我认为这给了你一种情境感和历史归属感,我认为这增加了故事性。这并没有减损。这是讲述整个故事的一部分。我认为数字是讲述整个故事的一部分。
KC:体育新闻--乃至整个新闻业--一段时间以来一直处于重新发现期。你个人是如何看待这一现象的?
ES:实际上,我在成长过程中并没有想过自己会成为一名体育记者。因此,我不确定自己是否能代表所有记者,以及新闻业的过去和未来。但对我来说,新闻就是发现问题并回答问题。如果你不使用数据,你在做什么?那你就只能依靠口口相传。这就是数据的好处。它给了你另一种声音。我认为一个有说服力的问题是任何好作品的主要特征。为什么这名球员如此出色?这名球员会一直这么优秀吗?这在棒球比赛中重要吗?我认为,这些问题是一个好故事的关键。
为了回答这些问题,我并不认为数据是唯一的东西。我认为你必须与球员交谈,因为球员对此有自己的看法,有时数据必须跟上球员的看法。我觉得你应该和管理层谈谈。我认为你想从万丈高空了解发生了什么,但如果你不询问数据,你就会错过一种更客观的分析和回答问题的方式。是的,我认为你仍然需要人物,你仍然需要深入了解是什么让这些人成为这样的人。
KC:新闻报道中的 "获取 "一直指的是现场报道,主要是为了获取信息来源。而对数据的持续获取则为其增加了一层含义。您如何权衡获取数据的重要性?
ES:我觉得有一件事对我来说很困难,那就是我知道与我交谈的球队可以获得我无法获得的数据。这有时让我很纠结,因为我知道他们对比赛的看法略有不同。他们在这方面有更多的分析师,他们有更多的数据,而且数据与我所掌握的不同,所以有时这也是让我感到沮丧的部分原因。
KC:我回想起在从事体育写作之前的数据查询时代,那个写作过程或细节水平现在看来是如此的简陋。这让我体会到相关数据对于写作过程是多么重要。你如何描述你前后学习这些东西的优势?
ES:我很幸运。这些年来,我看待棒球的方式、消化棒球的方式变得越来越流行。我是个数字至上的人。我是个喜欢幻想的人。幻想越来越流行,所以数字也越来越有趣。我认为,早期的数据只是棒球卡背面的东西,也许并不那么引人注目。只有 RBI 和跑分--还有多少其他数据?现在,我们用 Statcast 打开了这扇门,人们可以在比赛现场,像在Stats Perform 一样,将他们在比赛中看到的数据转换成数字。我们现在可以用它回答更多的问题。我们现在可以利用数据做更多的事情,而将数据纳入写作也变得更加重要。
第一个重大进步是 "替代胜场"。这是一个有趣的东西,因为它允许我们将球员在场上所做的不同事情汇总到一个数字中,但我不喜欢的一点是,这变成了一个数字的事情。
我认为,并不是所有的人都能用一个数字来概括,就像你不能用我上一篇文章的点击量来概括我一样。我也不想被一个数字来评判。我认为,一个数字的统计结果并不能说明全部问题。这就是为什么我们不再把 WAR 当作一个分析性社区,而是开始把它分解成更小的问题,用更小的答案和不同的统计数据来告诉你一些不同的东西。现在,我们更关注的是他的冲刺速度有多快,这有多重要?他接球时的起跳速度有多快,这有多重要?
KC: 让我们讨论一下你最近做的一些更有趣的事情。你想到了什么,有哪些更有意义的指标?
ES:最近我最喜欢用的一种统计方法是由Stats Perform 创建的,名为 command+。它回答了一个传统指标无法回答的问题。它需要各种各样的分析师观看比赛。它需要有能力对每场比赛中发生的事情进行编码,并通过对比赛背后的大量研究来告诉你:"那个投手是否完全按照他的意愿投出了那个球?"这是一个很难回答的问题
这是大多数分析师都避而远之的事情,因为他们可以说,"我无法进入投手的内心世界"。我认为有一点值得称赞,那就是Stats Perform 认为没有人能回答这个问题,于是他们尝试了一种不同的方法,真正试图进入投手的大脑,并试图为他们塑造出的曲球点赞。这可能是一个球,但可能是他们想要的形状,而且在他们想要的大致位置上--我认为这才是指挥的真正定义。
KC: 你写过一篇关于马林鱼队扎克-加伦的深度报道。还有一些关于衡量滑球效果的文章。这样的想法从何而来?
ES:当我观看比赛时,我会产生疑问。我不知道这是不是因为我来到这个国家的方式,我对这个国家有疑问。我当时想"这是什么新地方?这个新游戏是什么?这是个很棒的新游戏我爱死它了"所以当我看比赛的时候 播音员经常会说 "(这个投手的)变化球是好是坏" 我就会说 "为什么?我会说:"为什么?这个变化球为什么不好?我们能用数字来说明吗?我们能对球员的好坏进行分类吗?
我想,这就是我写作的动力。我看数据的方式就是试图回答关于比赛的问题。对于扎克-加伦,我只是说,他是一个过来的球员。他被交易换来了一个顶尖的击球手。他是被一支需要年轻球员的球队交易走的。Why did he get traded away, and what does Arizona see about this player that's different than what maybe Miami sees about this player? 为什么他被交易走了,亚利桑那州对这个球员的看法和迈阿密对这个球员的看法有什么不同?我试图把不同的片段放在一起,回答这个问题。
KC:从一开始,观点和个性就是棒球写作的一部分。在体育写作中,观点和个性可能始终占据一席之地,但现在媒体是否有必要更进一步,更好地支持他们的工作?
ES:我认为,一般来说,读者更喜欢以他们认可的方式来回答问题,或者他们在学校里看到过有人在类似的情况下用论文或数据来证明他们的答案,或者在他们的工作环境中。如果你在工作环境中做演讲,却没有数据,你会怎么做?你没有回答你想要回答的问题。你无法说服任何人。
当我试图说服别人时,我通常会从数据入手。如果我要写的是曼尼-马查多的合同是好是坏,而我只是说我认为他总体上是个糟糕的球员,因此合同是糟糕的,我想这就会让现在的读者感到不足。他们会说这是一种观点写作,并不像我们希望的那样客观。这是人们对新闻业的要求之一,也是我们长期以来一直在追求的--客观性。我认为数据确实给了你成为客观记者的机会,因为你在文章中使用数据作为客观来源。
KC: 你认为在文章中适当使用数据对读者的参与度有什么影响?你认为这对读者的可信度也有影响吗?
ES:这很有趣。有时我会因为是数字作家而被骂。我认为,在大多数情况下,这让他们有时也能参与进来。有读者会对我说:"你漏掉了,你没看这个数字。你没看这个数字"。我觉得这比 "你讨厌曼尼-马查多,他是我最喜欢的球员,走开 "更高层次的对话。我认为让我们的对话更加客观 - 这也是棒球界正在发生的事情。
你会发现,如今的球员对数据统计更加开放。部分原因是他们想要变得更好,而他们现在可以看到数据可以让他们变得更好。所以现在的对话不只是:"嘿,伙计,你的滑球很差,要改进一下"。现在的对话是:"嘿,拿着那个滑球,你能改变它的旋转轴吗?你能把手指放在这边吗?让我们看看机器是怎么说的。机器会告诉我们它是好是坏,我们就不用对骂了"。我认为,在体育写作和一般阅读中,都会有一点这样的情况--数字让你给我们一些可以争论的东西,这些东西更客观,但也不像我们之间那么主观。
KC:我们在镜头外谈过,至少在某种程度上,我们都喜欢足球。在正确使用数据方面,足球历来远远落后于美国体育,因为与棒球等运动相比,足球更难进行有意义的客观细分。随着机器学习的发展,以及人工智能在分析人类无法独立构建的海量数据集方面的应用,这种情况开始发生转变。它所产生的 "预期指标 "比之前的任何指标都更具预测性。您认为AI 未来会对棒球产生类似的影响吗?
ES因为棒球是一项非常细分的运动 你可以在任何时刻停止比赛 然后说 "现在有多少人出局 跑垒员在哪里 在一垒吗 在二垒吗"这让很多半专业研究成为可能这让那些只需下载数据集的人 可以进行一些自己的研究 这实际上激发了人们对棒球阅读的兴趣赛博计量学正是基于这一理念。SABR 是美国棒球研究协会。这些都是半职业的研究人员,他们只是自己做研究,其中很多人现在已经进入私人领域,为棒球队工作。
我认为,当计算能力超过你自己的能力时,就会出现转变。这可能与足球领域发生的情况有点类似,因为不可能有那么多足球爱好者来做足球分析,因为他们可能没有足够的计算能力。你需要的是一个能为你提供帮助的供应商,它能帮你进行分析并提供给你,而不仅仅是提供给前台。我们需要这些专业的数据源,同时也提供给读者。我们需要这些专业的数据来源,而不仅仅是在背后为团队工作的半专业研究人员。
现在棒球界非常有趣的一件事是,我们正在从使用雷达技术转向使用光学技术......来向你描述肢体发生了什么。雷达技术无法区分球、球棒和手臂。现在,我们将拥有光学技术;它可以告诉你手臂在做什么,腿在做什么,身体在做什么。我认为我们现在需要了解的是更多的生物力学。
我正在尝试这样做。我已经在尝试阅读生物力学方面的书籍,努力学习生物力学方面的知识,因为你将会了解到身体的最佳利用方式。然后,我们就能更明确地说出手臂应该在哪里,球棒应该在挥棒的某一瞬间在哪里,我们就能在公共领域和私人领域获得更多与之相关的数据。我认为,我们将更多地讨论身体如何在空间中移动。

