メインコンテンツへスキップ

数字で表せるか」:ベースボール・アナリティクスのエキスパート、イーノ・サリスへのインタビュー

By:ケビン・クロウスト

エノ・サリスは野球界を代表するアナリティクス・ライターの一人である。私は違う。

しかし、私はスポーツジャーナリズムの出身であり、スポーツにおけるデータの活用について、メディアの立場からもチームのパフォーマンスの観点からも、世界中のデータを活用する人たちと多くの時間を費やして議論している。

イーノと私は、彼のキャリア、アナリティクスが野球記者をどのように変えたか、そしてテクノロジーが野球の一部となるにつれ、野球業界がどうなっていくのかについて話し合った。

以下はその会話の全文である:

ケビン・クロウストあなたのEメールの署名には「野球分析」という言葉が出てきます。どのような経緯で野球ライターになったのですか?また、野球から派生したより高度なものに焦点を当てるようになるまでの道のりはどのようなものでしたか? 

イーノ・サリス:実は私は移民なんだ。両親はドイツ人で、1986年にこの国に来たのですが、苦労したことのひとつは、子供たちや新しい人との出会いでした。私がしたことのひとつは、野球を通じて新しい人と出会うことだった。他の子供たちを通じて、本当につながりができたんだ。それは本当に重要なことだった。他の人たちにとっては、野球が子供たちをつなぐこともあると思いますが、私にとっては、国や人々、文化とのつながりのようなものでした。

義父も野球に夢中な人の代表だった。彼と一緒に試合を観に行ったり、野球カードの売買をしたりしているうちに、私は野球選手の評価にのめり込むようになった。ゲーリー・シェフィールドになりきってワッグルをしたり、ウィッフルボールで遊んだりするだけじゃない。それはまたどうすれば最高の野球カードを手に入れられるか、どうすれば友人から最高の野球カードを手に入れられるか、どうすれば最悪の野球カードを贈れるか。だから最初から、野球に対する分析も少しは含まれていたんだ。まさか自分がプロ野球選手になるとは思っていなかったと思う。だから最初から、分析することのほうが僕にとっては少し重要だったんだ。

KC:あなたが野球の高度な分析を本当に受け入れ始め、それを一貫して書くようになった特定の時点を覚えていますか? 

ES:私の中で初めて分析が固まったのは、ある野球カードのトレードだったと思う。私は8歳で、バリー・ボンズのルーキーカードがどうしても欲しかったんだ。相手はブレーブスのファンで、僕たちはアトランタに住んでいる。マーク・レムキーのルーキーカードとジェフ・ブラウザーのルーキーカード、そしてスティーブ・エイブリーの普通のカードをあげたんだ。私は「いいか、これらのルーキーカードは手放したくないんだ。マーク・レムキーは大好きだけど、バリー・ボンズが嫌いなのは知ってる。彼は派手だし、嫌いなのはわかる。バリー・ボンズのルーキーカードをくれ。その代わりにこの3枚の素晴らしいカードをあげよう」。

分析が野球を好きな理由の一部であるという点で、それが私にとってピンときた瞬間だったのかもしれない。それがファンタジー・ベースボールに発展し、私は執筆する前から長い間ファンタジー・ベースボールをプレーしていた。ファンタジー・リーグで勝つためにやりたかったことのひとつは、世の中にあるすべての分析を読むことだった。ファンタジーリーグで勝つために、私はBaseball Prospectusを読んだ。FanGraphsを読み、Rob Neyerを読み、野球の本を読みながらも、自分のファンタジーリーグで勝つためにはどうすればいいかを考えていた。FanGraphsはデビッド・アッペルマンがファンタジーリーグで勝つために作ったものだということを知らない人もいる。

だから、野球で書かれていることの裏には、正当な原動力があると思う。あなたが目にする分析は、ファンタジーリーグで勝とうとしている人たちのものです。

KC:私たちは時折、世の中のあらゆるデータが野球をダメにしていると聞きます。それに対してどう反応しますか? 

ES:データについて読みたくないという人が、データが多すぎるのではないかと感じるという考えには共感するし、それがより浸透していることも分かる。文章にデータを使う人がどんどん増えている。そのような人たちに対して私は、素晴らしい分析、素晴らしいオピニオンライティングはまだあると言いたい。良い仕事をしている偉大なコラムニストはまだいるし、そういう人たちを読むこともできる。

僕にとって、野球を評価する方法は、数字がそれに拍車をかけるだけだと思う。(マイク・トラウトは素晴らしい選手で、これらすべてを兼ね備えている。それは素晴らしいことだけど、もし私が数字を並べて、彼が(27歳まで)歴代最高だと言えるなら、もっと説得力があるように感じる。昨夜の試合で、誰かが壁際まで走る素晴らしいキャッチをした。まあ、それはあなたの言葉に過ぎない。あなたは私に、"ああ、あれは今まで見た中で最高のキャッチだ "と言っているに過ぎない。

もし彼が今年のキャッチボールで誰よりも速く走り、キャッチボールの確率が最も低く、最も高くジャンプしたとしたら?今ならそれができる。あのボールを捕るために最も高くジャンプしたと言える。その方が説得力がある。そうすることで、文脈を理解することができ、それが歴史の中でどのような位置づけにあるのかを知ることができる。それはストーリーを語る上でプラスになると思う。全体のストーリーを語る一部なんだ。今、数字が全体のストーリーを語る一部になっていると思います。

KC:スポーツジャーナリズム、そしてジャーナリズム全般は、ここしばらくの間、ちょっとした再発見期にあります。あなたは個人としてそれをどのように受け止めていますか? 

ES:スポーツジャーナリストになるとは考えていませんでした。ですから、すべてのジャーナリスト、ジャーナリズムのこれまでとこれからについて語れるかどうかはわかりません。しかし、私にとってジャーナリズムとは、疑問を見つけてそれに答えることだ。データを使わないのであれば、何をしているのか?口コミに頼るしかない。それがデータのいいところだ。もう一つの声を与えてくれる。説得力のある質問は、良い作品の最大の特徴だと思う。なぜこの選手はそんなにいいのか?この選手はこれからもいい選手であり続けるのか?この野球の試合で重要なのか?このような疑問が、良い物語の鍵だと思う。

そのような疑問に答えるためには、実はデータだけがすべてだとは思っていません。選手には選手なりの視点があり、データが選手の見るものに追いつかなければならないこともあるからだ。経営陣とも話すべきだと思う。しかし、データを聞かなければ、より客観的な方法で分析し、質問に答えることができません。そうですね、やはり人柄は必要ですし、何がその人たちをその人たらしめているのかを深く掘り下げる必要があると思います。

KC:ジャーナリズムにおける "アクセス "とは、常に現場での取材、主に情報源へのアクセスを指してきた。データへの一貫したアクセスは、そのレイヤーに加わります。アクセスの重要性をどのように考えていますか?

ES:私にとって難しいことのひとつは、私が話をするチームは、私がアクセスできないデータにアクセスできることを知っていることです。彼らは少し違った見方で試合を見ていることを知っているからだ。彼らは私より多くのアナリストを抱え、私とは異なるデータやより多くのデータを持っている。

KC: データクエリ以前のスポーツライター時代を思い出すと、その執筆プロセスや詳細レベルは、今となってはとても初歩的なものに思えます。今となっては、その執筆プロセスや詳細レベルがとても初歩的なものに思えます。あなたがこのようなことを学んだことの利点は何ですか? 

ES:私はラッキーだった。私の野球の見方、野球の消化の仕方は、この数年でより一般的になったと思う。私は数字第一主義者だった。ファンタジーが好きだった。ファンタジーの人気が高まったことで、数字がより面白くなった。初期のころは、数字といえば野球カードの裏のようなもので、それほど説得力のあるものではなかったと思う。RBIと打点だけだった。今、私たちはStatcastを使い、人々が試合会場にいて、Stats Performいるように、試合で見たことを数字に変換できるようになりました。これで、より多くの質問に答えることができるようになりました。データを使ってより多くのことができるようになり、それを文章に盛り込むことがより重要になりました。

最初の大きな進歩のひとつが、Wins Above Replacement(代替選手を上回る勝率)だった。これは、選手がフィールドで行うさまざまなことをまとめて1つの数字にすることを可能にするもので、興味深いものでしたが、私が好まないことの1つは、それが1つの数字になってしまうことです。

前回の記事が何クリックされたかを正確に示すことができないように、人を1つの数字に集約する方法は常にあるわけではないと思う。私も1つの数字で判断されたくない。1つの数字による統計は、必ずしもすべてを語るものではないことを示していると思う。だから私たちは、WARのような分析的なコミュニティから脱却し、より小さな質問と、より小さな答え、そして異なる何かを教えてくれる異なる統計に分けるようになりました。今では、もう少し詳しくなっている:彼のスプリントスピードはどれくらい速く、それがどれくらい重要なのか?捕球時のジャンプの速さはどれくらいで、それはどれくらい重要なのか?

KC:あなたが最近手掛けた興味深い仕事について話しましょう。思い浮かぶもの、また、あなたが取り組んだ中で、より意味のある指標は何ですか? 

ES:最近扱った統計の中で気に入っているのは、Stats Perform 社が作ったcommand+というものです。これは、従来の指標では決して答えられなかったような質問に答えてくれます。そのためには、試合を見ているさまざまなアナリストが必要です。すべての試合で起きていることをコード化する能力が必要であり、基本的に試合の背後にある多くのリサーチを回して、"あの投手はあのボールで彼が望んだとおりのことをしたのか?"ということを教えてくれる。これは非常に難しい質問だ。

ほとんどのアナリストは、"投手の頭の中には入れない "と言うことができるので、このようなことから遠ざかっている。Stats Perform 賛辞を送りたい。彼らは、誰も答えられないと思っていた質問を取り上げ、異なるアプローチを試みた。それはボールかもしれないが、彼らが望んだ形かもしれないし、彼らが望んだ一般的な位置かもしれない。

KC:マーリンズのザック・ギャレンについて深く掘り下げて書いていますね。また、スライダーの有効性を測定することについても。そのようなアイデアはどこから来るのですか? 

ES:試合を見ていると、どうしても疑問が湧いてくる。この国に来て、この国について疑問を持ったからかもしれない。私はこうだった:「この新しい場所は何?この新しい試合は何?これはすごい新しい試合だ。大好きだ。だから試合を見ていると、よくアナウンサーが(この投手の)チェンジアップはいいとか悪いとか言うんだけど、僕はこう言うんだ:「なぜそのチェンジアップが良いのか?何がこのチェンジアップを悪くしているのか?それを数字に表せないだろうか?何が選手を良くし、悪くしているのか、いくつかのカテゴリーを観察できないだろうか?"

それが私の執筆の原動力になっていると思う。私がスタッツを見る方法は、ゲームに関する疑問に答えようとしている。ザック・ギャレンの場合、私が言ったのは、彼はこれからやって来る選手だということだ。彼は一流の打者候補とトレードされた。彼は若い選手を必要としていたチームからトレードされた。なぜ彼はトレードされたのか、そしてアリゾナはこの選手のどこを見ているのか。私はさまざまなピースを組み合わせて、その疑問に答えようとしている。

KC:オピニオンやパーソナリティは、当初から野球記事の一部でした。しかし、今、メディアがさらに一歩進んで、彼らの仕事をよりよくサポートすることがどれほど必要なのでしょうか? 

ES:一般的に読者は、学校で誰かが自分の答えを論文やデータで証明するのを見たことがあるか、あるいは職場で同じような状況に置かれたことがあるか、どちらかだと思います。もしあなたが職場でプレゼンをするとき、データがなかったらどうしますか?答えようとしている質問に答えていないことになる。誰も納得させることができない。

誰かに何かを納得してもらおうとするとき、私はたいていデータから始める。もし私がマニー・マチャドの契約の良し悪しについて書こうとしていて、彼は一般的に悪い選手だと思う、だから契約も悪いと言うだけでは、今日の読者には物足りないと思う。これは意見文のようなもので、私たちが望むほど客観的ではないと言われるでしょう。客観性というのは、私たちが長い間追い求めてきた、人々がジャーナリズムに求めるもののひとつです。データを客観的な情報源として使うことで、客観的なジャーナリストとなる機会が得られるのです。

KC:あなたが書いた記事の中でデータを適切に使用することは、読者の関心度にどのような影響を与えると思いますか?また、読者からの信頼性にも違いがあると言えますか? 

ES:面白いですね。数字に強いライターだと怒鳴られることもある。でも、そのおかげで読者が私に関心を持ってくれることもある。読者から「あなたはこの数字を見落とした。あなたはこの数字を見ていない"。それは、"あなたはマニー・マチャドが嫌いなだけで、彼は私の好きな選手だ、消えてくれ "と言うよりも、レベルの高い会話だと私は思う。より客観的な会話ができるようになる - それは野球界でも起こっていることだと思う。

今日の選手たちは、スタッツに対してよりオープンになっていることがわかるだろう。その理由のひとつは、彼らがより良くなりたいと思っていて、スタッツが彼らをより良くすることができるということを理解できるようになったからだ。だから今、会話は「おい、おまえ、スライダーがすごく悪いから、もっとよくしてくれ」だけではないのだ。そのスライダーでスピン軸を変えられるか?指をこうやって置けるか?機械が何を言っているか読んでみよう。機械が良し悪しを教えてくれるから、お互いに怒鳴る必要はないんだ"。スポーツライターや読書全般に言えることだが、数字があることで、より客観的でありながら、お互いの主観を排除した議論をすることができる。

KC:私たち2人は、少なくともある程度はサッカーにのめり込んでいるということは、カメラの前で話したことがあります。サッカーは、野球のようなスポーツに比べ、意味のある客観的なセグメント化が難しいため、データを適切に活用するという点で、伝統的にアメリカのスポーツに大きく遅れをとってきた。しかし、機械学習や人工知能の導入により、人間だけでは構造化できない膨大なデータセットを分析できるようになった。その結果、以前のどんなものよりも予測性の高い『期待される指標』が生まれた。将来、AI 野球界に同じような影響を与えると思いますか? 

ES:野球は細分化されたスポーツなので、いつでも中断して、"アウトはいくつあるのか、走者はどこにいるのか、一塁にいるのか、二塁にいるのか "といったことを調べることができる。これによって、多くのセミプロの研究が可能になる。データセットをダウンロードするだけで、自分なりの研究ができるようになり、それが読書という点で、野球への関心を高めている。セイバーメトリクスはこの考えに基づいている。SABRとはアメリカ野球研究協会のことである。このようなセミプロの研究者たちは、自分たちだけで研究を行っており、今ではその多くが民間の領域に足を踏み入れ、球団で働いている。

計算能力が自分ひとりでできることを超えていけば、シフトしていくと思います。サッカーで起きていることと少し似ているかもしれませんが、サッカーの分析をするような熱狂的なファンはそれほど多くないでしょう。必要なのは、フロントオフィスに提供するだけでなく、あなたの代わりに分析し、あなたに提供してくれるプロバイダーです。読者も利用できる専門的なデータソースが必要なのだ。かつてのようなセミプロの研究者ではなく、チームのために働くプロのデータソースが必要なのだ。

今、野球界で非常に興味深いことのひとつは、レーダー技術から光学技術へと移行しつつあることだ。レーダー技術では、ボールとバットと腕の違いを見分けることができなかった。今、私たちは光学技術を手に入れようとしている。それは、腕が何をしているのか、脚が何をしているのか、身体が何をしているのかを教えてくれる。今、私たちが理解しなければならないのは、もう少しバイオメカニクスだと思う。

私はこうしようとしている。すでにバイオメカニクスについて読もうとしているし、バイオメカニクスについて学ぼうとしている。そうすれば、スイングのある瞬間に腕がどこにあるべきか、バットがどこにあるべきかについて、より明確に言えるようになるだろうし、公的な領域でも私的な領域でも、そういうことに関連するデータが増えるだろう。私たちは、身体が空間の中でどのように動くかについて、もっと話すようになると思う。