チーフ・サイエンティストのパトリック・ルーシーが、スポーツにおけるAI 最新動向の 最終回に登場する。2024.今回の更新では、ルシー博士がスペシャライズド・エンタープライズのGenAIについて、そして最新のゲームチェンジャー・イノベーションがスポーツの世界でどのように応用されているかについて語ります。
このタイミングでStats Perform 、以下の調査を開始する。 2025年スポーツファンのエンゲージメント、マネタイズ、AI トレンド調査というのも、ChatGPTがリリースされてから2周年にあたるからだ。AI 、特定のタスクにのみ使われるニッチなツールから、毎週何億人もの人々に使われる汎用的なユーティリティになりました(ChatGPTは、世界中で毎週3億人のユーザーを獲得したと発表したばかりです)。
一般的な質問・回答、校正、翻訳、ブレーンストーミング、コーディングなどの作業にAIを使用している世界中のほとんどの知識労働者にとって、AIは究極の支援ツールであり、労働者は以前よりもはるかに多くのことができるようになる。実際、我々の調査で明らかになった多くの調査結果のひとつに、放送局、チーム、リーグ、連盟、スポンサー、スポーツブックなど、さまざまな方法でAI 導入し、視聴者の拡大やコンテンツの商業化に役立てているスポーツメディアの幹部が増えており、遅れている人たちよりもAIを導入しやすいと感じていることがある。
もちろん、AI 革新はChatGPTの最初のリリースにとどまりません。毎週のように新しいイノベーションが起きています。例えば、ここ2、3ヶ月の間に、驚くような新しいイノベーションがありました。AI パイオニアであるジェフ・ヒントンと デミス・ハサビスがそれぞれ物理学と化学でノーベル賞を受賞したことに加え、最近のアップル・インテリジェンスの製品発表、メタのレイバン・スマートグラスへの改良。複雑なタスクに対するOpenAI o1の推論モデルには驚かされ、最近ではグーグルのGemini 2.0がリリースされた。
しかし、OpenAIのGPT-5(またはOrion)の最新モデルのリリースを期待している間にも、イノベーションが枯渇し、壁にぶつかっているという噂が高まっている。グーグルの最高経営責任者(CEO)は、現在のLLMではAI 進歩のための「坂はさらに険しくなっている」と述べている。
しかし、これはGenAI分野におけるイノベーションの終焉を意味するものではない。そうではない!
むしろ、GenAIのイノベーションの新たな段階の到来を告げるものだと考えています。エンタープライズGenAIと私たちは呼んでいます。この記事では、これが何を意味するのか、そしてスポーツの世界で私たちにどのように適用されるのかを紹介します。
現在のLLMは壁にぶつかっている?なぜ?
ある程度、現在のテキストベースのLLMユースケース(例えばChatGPT)では、ある種の閾値に達しつつある。理由は簡単で、モデルが学習するための新しいデータが不足しているからです。
今日、一般的なGenAI アプリケーションで使用されている大規模言語モデル(LLM)は、膨大な量のデータで学習される。ほとんどはテキストだが、音声、画像、ビデオも追加され、そのほとんどはインターネットから取得される。
基本的に、これらのモデルはこれらの公開データソースから得られるものを最大限に活用している。
しかし、インターネット上にあるテキストや画像データ以外にも、多くの情報がある。
モデル・アプリケーションとパフォーマンスの拡張
企業は現在、より大規模なモデルをトレーニングする代わりに、現在のモデルをより効率的かつ迅速にすること(MetaのLlama 3.3リリースを参照)と、新しい、補足的な、ドメイン固有のデータソースを使用して、これらのモデルができるタスクの種類を拡張することの両方を求めている。これらの新しいデータソースによって、新しいタスクやソリューションを生み出すことができる。
これは、例えばオープンAIが最近「o1」モデルで行ったように、LLMがより複雑な数学/幾何学や物理学の領域にも進出できるようになったことを意味する。o1モデルは、物理学、生物学、化学の問題のベンチマークで博士号レベルの精度を超え、またアメリカの数学オリンピックの予選で全米トップ500の学生の中に入った。グーグルの新モデル「ジェミニ2.0」は、AI アシスタントが「ディープ・リサーチ」ツールを使ってウェブ検索や詳細なレポート作成などのタスクを遂行することも可能にしている。
このような新しいタスクは、他のタスクよりもはるかに複雑であるため、モデルが解決できるように現在のアプローチを進化させる必要がある。数学/幾何学/物理学の問題を解いたり、複雑なトピックを研究したりする場合、モデルは答えを出す前に一連のステップ(「思考の連鎖」と呼ばれるもの)をマッピングする必要がある。
この種のモデルは、人間が答えを出す前にどのように「考える」かを模倣しているように見えるため、「推論」モデルと呼ばれている(ただし、最近ニューヨークのコロンビア大学で行われたヤン・ルクンの講演で強調されたように、このようなモデルはまだ効果的な計画を立てる能力に欠けており、近似的なものである)。
しかし、上記のように、推論モデルは、より賢くなる(つまり、同じデータから新しいタスクを学習する)のではなく、それらのタスク(つまり、数学/物理学/化学)に特化した 新しいデータセットを最初に含めることによって、新しいタスクに拡張されているだけなのだ。
そして、一連のベンチマークテストで最高のパフォーマンスを発揮できるように最適化される。
つまり、モデルが認識できる性能やタスクの種類を向上させるには、新しいデータセットで既存のモデルを訓練し、新しいタスクに最適化することが重要なのだ。
コンピュータ・vision 領域では、詳細なセグメンテーション・マップを必要とする様々なセグメンテーション・モデル(すなわち、トレーニング・セットでラベル付けされた各ピクセルが、どのオブジェクト/セグメントに割り当てられるかを示すラベル)、次に何をすべきかを提案できるビデオ・ゲーム・エージェント、あるいはクリック/タイピングをキャプチャするモデルが追加される具現化コンピューティングの開始など、このような現象が見られる。
そして、今日の大規模な言語モデルの能力を向上させ、拡張する唯一の本当の方法は、差別化されたデータを使用することである。
しかし、これらの新しい差別化されたデータセットはどこに存在するのだろうか?
1つの領域は「主権AI」であり、各国が独自のデータ(医療、交通、防衛を考える)にアクセスし、そのデータを燃料として、その国特有の問題に対処できるモデルを構築することができる。もう一つの領域はビジネスの世界で、企業や「エンタープライズ」が独自のデータを持っており、企業特有の質問に対応できる。
エンタープライズGenAI
IBMによると、エンタープライズで利用可能なデータ(企業が日常的に収集しているデータ)のうち、インターネット上で利用可能なものは1%未満である。(すなわち、企業が日常業務の一環として収集するデータ)で利用可能なデータのうち、インターネット上で利用可能なものは1%に満たない。
残りの99%のエンタープライズ・データは、もちろん膨大な情報プールであり、膨大で豊かなパターンと洞察を含んでいる。
したがって、エンタープライズ・データは肥沃な土地であり、エンタープライズ・データをジェネレーティブAI 利用することは、この分野の成長を継続させる最も可能性の高いルートのように思われる。
エンタープライズGenAIアプリケーションに関しては、データの種類によって2つの主要なユースケースがある:
- 一般的な企業データ:一般的なテキストデータ、音声データ、画像・映像データのことで、企業にとってはプライベートなデータです。テキストデータには、社内コミュニケーション、顧客とのやり取り、業務文書、営業・マーケティング資料、製品・技術文書、法務・財務記録、人事データ、社外コミュニケーションなどが含まれます。 現在のテキストベースのLLMは、RAG(Retrieval-Augmented Generation)技術で強化されており、これらの文書の照会、アクセス、検索、翻訳のための優れた出発点を提供する。これらの能力は、モデルの微調整によってさらに向上させることができる。同様に、現在のLLMは音声の書き起こしや要約に使用でき、視覚言語モデル(VLM)はこのデータカテゴリー内の一般的なオブジェクト検出などのタスクを処理できる。
- 専門企業データ:これは、センサーによって生成されたデータ、時空間データ(GPS座標やイベントトラッキングなど)、機械、エンジン、その他の設備からのデータなど、ビジネスやそのオペレーションに固有のデータタイプを含みます。以下に、これらのいくつかを詳しく説明する。これらのデータセットは、しばしば特殊な処理や分析技術を必要とする。一般的なデータとは異なり、専門的なデータは、その企業の業務や産業の状況に合わせた高度にドメイン固有のものであり、多くの場合、その企業のより価値のある知的財産を表している。このようなデータを活用するためのステップは、i) データ収集、ii) 言語への変換、iii) その言語の活用、で構成される。
この記事の残りの部分では、特殊化されたエンタープライズ・データを利用するGenAIアプリケーションに焦点を当てる。
スポーツと特殊な企業データとの関係は?
スポーツには汎用的なデータが存在するが、フィールドやコートでの選手のライブでダイナミックなパフォーマンスをキャプチャするスポーツデータは、世の中に存在するデータセットの中で最も興味深く、ユニークで「特殊」なもののひとつである。ダイナミックで、ライブでアクセスできれば大きな価値を持つが、モデリングに効率的かつ効果的に利用するためには、幅広く、深く、均一で、一貫性がなければならない。このデータの背後にある価値は、パフォーマンスのストーリーを客観的に再構築することである。別のレンズを通すと、このデータはスポーツの世界共通言語と見ることができます。
多くの洗練された言語がそうであるように、スポーツの言語もマルチモーダルである。その代表的なものが、「イベントデータ」と「ボール/選手のトラッキングモーション」のデータです。).
スポーツは毎日インターネット検索の10%以上を占めているが、現在ウェブ上に存在し、モデルの学習に利用できるデータは、古く、断片的で、浅く狭いものであることが多い。
一方、Stats Perform巨大なOpta データベースのような独自の "エンタープライズ "データセットは、最新で、完全で、広さと深さの点で包括的で、一貫して収集されており、非常に詳細なイベントデータやオフ・ザ・ボールの位置や動きのデータなど、他では入手できないスケールの情報を含んでいる。
こうした特徴から、我々の "特化した "スポーツデータセットは、物流、製造、輸送、自律走行車、気象、生物学の領域で収集されたデータと類似しており、将来のAI アプリケーションの次の波の燃料となる。
スポーツ以外の特殊な企業GenAIの例とは?
ジェネレーティブAI 最初の波(ChatGPTなど)において、この波の原動力となったのは大量の汎用テキストデータだった。テキストデータは、LLMが成功するための2つの重要な属性である、膨大な量のデータが公開されており、データが本質的にシーケンシャルであるため、手始めとして最適な場所です。スポーツ以外でも、LLMが活躍するのに最適な、膨大な量の逐次データを持つ領域は数多く存在し、それらは世界を変える可能性を秘めています(あるいは、すでに世界を変えています)。以下に4つを紹介する。
最初の例では、自律走行車の利用がある。これは現在、アメリカのいくつかの都市で運転手のいないタクシーとして利用されており、最近では先月ロサンゼルスで運行が開始され、マイアミでも間もなく運行が開始される予定だ。.第6世代のウェイモ・ドライバーには、13台のカメラ、4台のライダー、6台のレーダー、外部オーディオ・レシーバー、そして高解像度の地図が搭載され、環境を監視し、自律的に安全にナビゲートする。これらの豊富な入力データソースから、これらの情報ソースを1つのモデルにマッピングし、自律走行車の世界に特有の行動を測定・予測する自律走行車固有の基盤モデルを使用する。.
つ目の例は、気象予測に関するものだ。正確な気象予測は、運輸、農業、治安、日常生活など、あらゆる産業にとって不可欠である。現在の気象予測の方法には、複雑な物理方程式を計算するスーパーコンピューターが必要で、時間と計算がかかる。さらに、最も正確な予測を行うには、高解像度の画像が必要だが、これを大規模に入手するのは難しい。しかし、最近の研究では、より少ない計算量で、低解像度の入力を利用し、同じ精度を達成することができる基礎モデルを使用して、正確な予測を行うことができることが示されている。.今週、グーグルのディープマインドはGenCastと呼ばれるモデルを発表した。このモデルは、現在使用されている最高のシステムよりも正確に天気を予測することができる。.
これは、ロボティクスにまつわる3つ目の例とうまくつながっている。ロボットアームが荷物を識別し、仕分けし、ハンドリングする。あるいは、農場を監視し、果物や野菜を識別し、最適な収量で収穫するロボットであれ正確な天候予測など他のインプットに加え、センサーがドメイン固有の属性を測定する能力によって、重要なブレークスルーが起こっている。この研究のインパクトは、荷物がタイムリーに正確に届けられるようになること(つまり、より安く、よりタイムリーに受け取れるようになること)、食品が最適なタイミングで収穫されるだけでなく、より多くの食品が無駄なく生成されるようになることである。
4つ目の例は、化学と生物学に関するものだ。冒頭で述べたように、ディープマインド・チームのリード・サイエンティストは、アルファフォールドの研究でノーベル化学賞を受賞した。タンパク質の立体構造を数年ではなく数時間で正確に予測する。この方法が重要なのは、病気の治療薬の開発や、人の様々な背景因子を利用した標的薬治療に利用できるからである。.これらの方法の可能性は、クリーンで再生可能な方法でエネルギー不足に対処するための新しいクリーンなバイオ燃料の生産や、現在地球上で問題となっているプラスチックなどの廃棄物の分解にも応用できる。
これら4つの例に共通しているのは、膨大な量の逐次データに依存しているということだ。 自律走行車の場合、入力はテキストではなく、LIDARからの点群、RGBカメラからの画像、細かい地図、そして車内からの情報である。天候については、様々な場所からの様々なセンサー入力が入力となる。 ロボティクスの場合は、深度センサー、ロボットセンサー、可能性のある製品の辞書であり、生物学の例では、言葉の代わりにタンパク質の構造、および/またはDNA、RNAである。 それぞれのドメインには独自の言語があり、その言語が確立されれば、言語モデリング(できれば大規模言語モデリング(LLM))を行うことができる。そしてこれらのモデルは、特定の「専門企業」の世界で起こることを正確に表現し、記述し、予測することができる。
トランスフォーマー - ユニバーサル・ラーナー:"連続データを追加するだけ"
大量の逐次データが得られたら、このデータから学習するために適切な機械を使う必要がある。その鍵となる機械が「トランスフォーマー・ニューラル・ネットワーク」であり、これはこれまでの機械学習手法よりもはるかにうまく情報を文脈化することができる。ChatGPTや他のLLMは、トランスフォーマーが一般的なシーケンシャルデータ(テキスト、画像/動画、音声など)の優れた学習者であることを示してきた。しかし、見逃されがちなのは、これらのモデルがスポーツデータなど、他の形式のシーケンシャルデータでも機能することです。
しかし、これらの変換器がどのように機能するかを直感的に理解するために、テキストデータを使った2つの例文を使ってみよう(この例文は、論文の原文「Attention All Need Paper」を紹介したブログ記事から引用している)。論文オリジナル "Attention is All You Need Paper"を紹介したブログ記事から引用したものである。)
- "その男は銀行にお金を預けた"
- "その男は川の土手に座っていた"
コンピュータに文章を理解させるには、まず文章をトークン化する。変換器が登場する前は、これらの単語をそれぞれ独立に表現していた。
しかし、文中の "bank "の周りにある単語を見ると、次のようになる。",しかし、"bank "の周辺にある単語を見ると、私たち人間はこの単語が別の意味を持っていることを理解する。変圧器を使って モデル変換モデルを使えば を効果的に学習することができる。を効果的に学習することができる。.そうなると、モデルはこれらの単語が異なる意味を持っていることを学習する。 を表すを表す数値は異なるものになる。 以下).
スポーツに特化した企業GenAI:スポーツデータの連続性を活用する
さて、上記の例はスポーツにおいてどのように重要なのだろうか?まず第一に、私たちの専門であるスポーツデータセットは逐次的である。マンチェスター・シティのようなチームのスタメンを見てみると、チームは基本的に1つの文章である。各選手は単語であり、ゴールキーパーからストライカーまで単語を並べることができる。ある選手(つまり単語)は他の選手よりも強い影響力を持っている。彼がプレーしているとき、彼は他の選手のプレーに影響を与え(つまり、選手たちは彼をゴールチャンスにはめようとする)、対戦相手のプレーにも影響を与える。しかし、もしハーランドが休んだり負傷したりして、ジャック・グリーリッシュが登場すれば(後述)、彼は選手たちのプレーに影響を与えるだろう(つまり、その「単語」ひとつを変えるだけで、文の意味、つまりそのチームがどのようにプレーするかに大きな影響を与える)。先に取り上げた天気の例のように、選手のパフォーマンスを逐次的に表現する変換器を使うことで、選手をそれぞれ独立して予測する現在のアプローチに比べて、将来の選手のパフォーマンスについてはるかに優れた予測パフォーマンスを得ることができる。
さらに ボールの上で何が起こったかをとらえるイベントデータは、文章のようなものだが、言葉の代わりに、プレーヤーがとった行動(例えば、プレーヤーAによるパス、X,Yの位置で A, at location X,Yで T)があり、ハーフタイムまたは試合が終了するまで、これらのイベントの連続があります。選手とボールの位置と動きをフレームごとにとらえたトラッキングデータも、空間的にも時間的にも連続的です。 空間的にも時間的にも連続的である。変換器を使うことで、データのシーケンシャルな性質をより効果的にモデル化できるだけでなく さらにまた、両方の情報ストリームを同じ参照フレームで取得できるため、次のようなことが可能になります。 軌道生成第II部で取り上げた 参照 以下).
このような "基礎 "モデルが設定されれば、他の情報源やモードをこれらのモデルに追加することができます。私たちがスポーツの分野で行っていることは、専門化されたエンタープライズ・データを活用する方法の素晴らしい例であり、それは専門化されたエンタープライズ言語モデルにつながります。
スリリングな2024年でしたが、2025年にはさらにエキサイティングな進化が待っています。お読みいただきありがとうございました。また、初めての方は、スポーツにおけるAI 以前の最新情報のパートIと パートIIをご覧ください。



