メインコンテンツへスキップ
放送局&コネクテッドTV、連盟&放映権所有者、プロクラブ&大学

スポーツにおけるジェネレーティブAIの応用第1四半期アップデート

By:パトリック・ルーシー

Stats Perform「スポーツにおけるAIの最新動向 」シリーズの最新版へようこそ!このシリーズでは、弊社のチーフ・サイエンティストであるパトリック・ルーシーが、ジェネレーティブAIの最新動向とスポーツ業界におけるその応用について語ります。

AIとスポーツの世界に携わる人々にとって、2月のスーパーボウルはフィールドの内外で楽しませてくれた。

フィールドやスクリーンでは、選手たちがチームアナリストの機械学習によって考案されたプレーを駆使しているのを目にし、アナウンサーがAIを駆使して文脈や意味を理解する手助けをしているのを耳にした。

スーパーボウルでは、マイクロソフトのCopilot広告や、グーグルのPixel携帯にAIが搭載されていることをアピールする広告など、メインストリームの消費者向け製品にAIが搭載されていることに焦点を当てた広告が展開された。

スーパーボウルの前後の短い期間に、GoogleのGemini、AppleのVision Proの発表、そしてOpenAIのマルチモーダルtext2videoツール "Sora "のリリース、さらにはAIエージェントのリリースやRAG(Retrieval-Augmented Generation)の利用拡大に関する噂など、主要なリリースがあった。

この記事では、Generative AI(ジェネレーティブAI)の世界におけるこれらの進展のいくつかを処理し、RAGとマルチモーダルLLMについて説明します。また、スポーツ(ファンやプロチームのアプリケーションの両方)において、これらが私たちにどのように関係するかを概説し、新しい変化にもかかわらず、1つのことは変わらないということを議論します。

まとめ:ChatGPTから12ヶ月以上

ChatGPTの立ち上げから1年あまりが経過した今、私たちが目にしているのは、一部で危惧されていたように、ジェネレーティブAI技術が人間の仕事を代替しているのではなく、人間がより多くの仕事をできるようにしているということだ。

ChatGPTとそれに続くLLMベースのテクノロジーは、私たちにさまざまな「AIアシスト」ツールを提供してくれた。

例えば、顧客サービス、言語翻訳、文書の検索や照会(それが公的なものであれ私的なものであれ)はすべて、以前よりもはるかに効率的かつ大規模に行われるようになってきている。また、テキスト、音声、画像、動画(またはその組み合わせ)を問わず、新しいコンテンツを作成することもできる。

結局のところ、これらの分野での進歩(そしてCopilot、Gemini、Soraの原動力となったもの)は、GenAIがデータから価値を引き出す能力を最大化するからである。基礎となるデータは、GenAIのエコシステムにおいて依然として最も重要な要素である。

ジェネレーティブAIの第3の波:差別化データ

Vista エクイティ・パートナー会長兼CEOのロバート・スミスは、最近、「ジェネレーティブAIの3つの波」について優れた要約を発表した。.

最初の波では、永続的な価値はハードウェア・プロバイダー(エヌビディアなど)にもたらされると説明した。

第二の波では、永続的な価値はスーパースケーラー(クラウドプロバイダーなど)に行くだろうと述べた。

そして第3の波では、自社製品を販売する特定の市場でその能力を活用できる企業に、永続的な価値がもたらされると述べた。言い換えれば、特定の領域(スポーツにおける独自の深く幅広いデータなど)で重要な差別化を図ることができれば、ジェネレーティブAIはその分野の製品やサービスを「超ブースト」することができる。

私たちは現在、最初の2つの波を目の当たりにしている。

最初の波はチップメーカーに恩恵をもたらし、GenAIに使えるチップへの渇望はとどまるところを知らないようだ。クラウドプロバイダーは、GenAIソリューションをスケールアウトし、一般的なソリューションにバンドルするために必要なストレージとコンピュートを持っている。

しかし、長期的に持続する価値は、特定の市場が特定のユースケースに合わせたソリューションを必要とする第3の波にある。

スポーツにおけるジェネレーティブAIの可能性にとって、なぜデータが重要なのか?

最も正確な出力を得るためには、ジェネレーティブAIシステムは、最も正確で信頼性が高く、均一なデータ入力を必要とすることを覚えておく価値がある。質の高い入力がなければ、誤った出力や誤った情報が伝播されたり、AIの用途が著しく制限されたりする可能性がある。

つまり、物事が進化し、変化しているように見えても、その根底にあるものはすべて同じなのだ。すべての情報と洞察は、信頼できる正確なデータに基づいている。

スポーツや医療のような特殊な分野では、選手分析やパフォーマンス予測、症状診断や治療評価といった特定のユースケースにおいて、事実を見誤ることは許されない。もしそうなら、下流の分析、予測、診断も間違ってしまう。

さらに、データが詳細で一貫性があればあるほど、アウトプットや回答はより具体的で、適切で、有用なものになる。

例えば、Stats Perform 13,500以上の男女プロチームの詳細なOptaデータを持っているサッカーでは、(一部のリーグだけでなく)すべての試合で同じデータと測定値が生成されるようにしています。

このように、パスとシュートはそれぞれ、サッカーのすべてのリーグで同じ統一された定義とコレクションを持っている。すべてのイベントは、名前、タイムスタンプ、位置座標のようなメタデータに同じプロトコルを使用します。

リアルタイムで収集されたデータの均一な分類と構造により、ジェネレーティブAIモデルは、過去のデータとインプレー統計の両方を含む膨大な量のデータに対して学習させることができる。

これにより、有効性が向上するだけでなく、検索機能が強化され、データセット内の相関関係やパターンの特定が容易になる。

もしそれらが一様に収集され分布していなければ、統計と導き出されたアウトプットは人間にとってもGenAIモデルにとっても無意味だ。

ジェネレーティブAIは、人間の目だけでは埋もれていた、あるいは見ることのできなかった貴重な洞察を発見するのに役立ちます。基礎となるデータの価値を最大化するのに役立つ。そのデータが詳細で均一で客観的であれば、その価値はさらに高まる。

ソースデータセットが深ければ深いほど、GenAIが生み出すパターンはより洞察に富み、予測はより正確になり、スポーツのような特定のアプリケーションや分野での有用性が高まる。

データの質、深さ、広さ、一貫性は、AIシステム(特にGenAIシステム)が繁栄するための重要な要素である。

もうひとつ、ディープフェイクが選挙に影響を与える可能性があるという報道が増えたことで、私は、スポーツの完全性を脅かす可能性のあるディープフェイク映像の悪用に対抗、あるいは対抗するための、独立した信頼できるスポーツデータの価値についても考えるようになった。

数年前、マイケル・ジョーダンがクレイグ・エヒロをかわした有名なショットの「代替史」がソーシャルメディアに投稿された。s年前.それは、ジョーダンが実際に決めた勝負を決めるショットを見逃すというもので、多くのオブザーバーを欺いた。text2videoのLLMがますます効果的になるにつれて、ディープフェイクがスポーツに浸透する可能性は高まっている。

私たちがStats Performスポーツ界の信頼できる記録係としての役割を信じられないほど真剣に受け止めているもう一つの理由であり、Optaのデータのような信頼できる、独立した検証可能な情報源は、ディープフェイクの未来においてさらに重要になると思われるため、私たちのデータの完全性に日夜集中している素晴らしいデータ・オペレーション・チームに感謝している。

RAGとは?

検索拡張生成(別名RAG)は、「非技術的専門家」が知識ベースを検索し、照会できるようにする、生成AI分野のもう一つの比較的新しい開発である。,技術者やデータベースの専門家に頼ることなく、知識ベースを検索し、照会することができる。

しっかりとした正確なデータの基盤があれば、RAGはその情報を現在のLLMベースの技術に巻き付けることができる。

このGenAIテクノロジーは、人々がより多くのことをできるようにし、より迅速な反復を可能にし、より早く知識を得ることを可能にする。ある意味では究極のアシスタントであり、専門家があなたの肩の上に常駐して答えを教えてくれるようなものだ(iシステムが最も正確で最新のデータにアクセスできる場合)。

広範な知識ベースがある場合、GenAIを使用することで、スポーツ情報の検索と照会が可能になり、RAGは、ドメイン固有の知識にアクセスする必要があるシステムにとって、これを容易にすることができる。

しかし、幻覚や古い情報が伝播する可能性があるため、十分な注意が必要である。 つまり、ソースとなるデータの品質と信頼が不可欠なのである。

しかし、ガードレールと監視の下で正しく使用されれば、RAGはスポーツの世界におけるコンテンツと治療のパーソナライゼーションにおいて、非常に大きな価値を持つことになる。

今後の記事では、このトピックについてさらに深く掘り下げていく予定だ。

ビデオ、画像、マルチモーダルLLMを用いた開発

スポーツの言語とは、収集されたボール上のデータとボール外の動きのデータの両方である。私たちはこれをマルチモーダルと呼んでいます。これは、画像やビデオに何が起こっているかを説明するテキストキャプションを付けたような、相補的な2つの情報モードをキャプチャするものです(GPT-4、Gemini、Soraはこのようにしてテキスト2画像やテキスト2ビデオを生成することができます)。

スポーツのLLMでビデオを効果的に活用する1つの方法は、オフボールとオンボールの両方の選手とボールのデータをキャプチャして組み合わせることである。

最近の進歩では、私たちの膨大なOptaデータベースとマルチモーダルLLMを使って、映像では(部分的または完全に)見ることができない選手の位置を推定することができるようになりました。これにより、すべてのパスと判定を、他の選手がどこにいて何をしているのかという完全な文脈で分析することが可能になりました。

我々は、スポーツにおけるジェネレーティブAIの高度なアプリケーションを、2024年のMIT Sloan Sports Analytics Conferenceで紹介した。 2024 MITスローン・スポーツ・アナリティクス会議.しかし、これはほんの始まりにすぎません。この基礎モデルから、さらに多くの応用が考えられます。この分野における私たちのさらなるアップデートにご期待ください。

最近のジェネレーティブAIの進歩は、プロスポーツの分析にどのように関係するのでしょうか?

スポーツに特化したLLMは、これまで正確にモデル化できなかった予測を作成するのにも使えるので、チームアナリストやコーチは非常に強力なアシスタントになる。

例えば、サッカー選手の個人統計のモデリングは、どのチームメイトとプレーしているか、どの対戦相手とプレーしているか、またライブ予測のためのゲーム状態(例えば、チームが勝っているか負けているか、選手が退場したか、など)に左右されるため、難しいことで知られている。

ChatGPTとGeminiに搭載されているモデルのトレーニングに使用されているのと同じジェネレーティブAIの手法(すなわち、トランスフォーマー・ニューラル・ネットワーク)は、同じモデルからすべての選手(およびチーム)の予測を生成するために使用することができる。

このアプローチの威力は、より正確な予測を提供するだけでなく、「バーチャル・アシスタント・コーチ」のような新しいアプリケーションを可能にする ことである。 あるいは 、"あの場面でディフェンダーはどこでシュートを止めるべきだったか?"とか、"あの選手は次にどこでボールを打とうとしているのか?"といった 質問もできる。

そして最後の例として、2024年1月に開催された全豪オープンで、私たちはテニス・オーストラリアの偉大なパートナーとともに、まさにそれを実現した。その様子はこちらでご覧いただけます。

他のAIアシスタントと同様に、スポーツアナリストやコーチはこれまで以上に洗練された戦略や戦術を開発する力を与えられ、その結果、観戦するファンにとってフィールド上での「感動的な瞬間」がさらに増えるだろう。

スポーツデータとLLMは、複合現実(Apple Vision Proなど)の進歩にどのように関わってくるのだろうか?

Apple Vision Proのリリースビデオでは、スポーツ観戦やスポーツとの触れ合いが重要な役割を果たしている。

複数のアングルから試合を観戦するだけでなく、ユーザーは音声クエリーやジェスチャーなど、視聴エコシステム内で必要なデータや洞察を得ることができる。また、モジュールとインタラクションすることで、ハイライトや他の試合、友人とのチャット、解説(または文脈に沿った広告)など、隣接するコンテンツを消費することもできる。

その野望は、最終的に試合のあらゆるディテールをより興味深く、面白くし、ファンと選手、チーム、「放送局」、スポンサーとの距離を縮める360度の体験を作り出すことにあるようだ。

質の高いスポーツデータは、目に見える形でも舞台裏の形でも、こうした経験の多くを支えている。

これらの舞台裏の方法には次のようなものがある。 LLMによる予測、ハイライトを含む最適なコンテンツと広告を最適なタイミングで表示するためのキュレーション、ゲームの状態や好みに基づいてユーザーが見たり聞いたり感じたりすることをパーソナライズすること、ゲーミフィケーションの機会を提供すること、アスリートのスキルをより印象深いものにするために信じられないようなコンテキストのレイヤーを追加すること、そして全体的にイベントのストーリーテリングの力を深め、それゆえにファンやスポンサーにとっての価値を高めること。

アナリストやコーチに戦術的な洞察を与えることは言うまでもない!

スローン・スポーツ・アナリティクス会議2024

このアップデートの締めくくりとして、スローン・スポーツ・アナリティクス・カンファレンスでの興味深い数日間から戻ってきたところだ。前述したように、私たちはそこで、質の高いソースデータがあれば、スポーツの特定のアプリケーションにGenerative AIをどのように活用できるか、つまり、放送では視覚的に認識されないサッカー選手の正確な位置を予測することについての論文を発表しました(下記リンク)。他のパネルやプレゼンテーションでは、カスタマーサービスや検索のようなスポーツ組織のタスクにおける幅広いGenAIアプリケーションについて議論されました。これらやその他の具体的な用途については、今後の記事で触れる予定です。


パトリック・ルーシー Stats Performチーフ・サイエンティスト。ChatGPTや 大規模言語モデルがスポーツに果たす役割や、今後の注目点など、彼の意見や洞察を読むことができます。

パトリックの記事で近日中に紹介される予定。 Stats Perform2024年論文ジェネレーティブAIがスポーツにおけるVAR(ビデオ・アシスタント・レフェリー)の適用を改善できるかどうか、AIエージェントがスポーツで役に立つかどうか、スポーツ中継やスポンサーシップを強化するためのジェネレーティブAIの応用などであるまた、2050年までに、完全自律型のヒューマノイドロボットが、屋外の実際のフィールドで、世界最高の人間のサッカーチームを倒すというロボカップの当初の目標についても、あらためて考察する!