前編はこちらをご覧いただきたい。
ChatGPTを支える言語モデルとトランスフォーマーはスポーツで何ができるのか?
チャットボットを超えて、スポーツ界に言語モデルと生成人工知能の居場所はあるのか?
答えは「イエス」であり、私たちの考えでは、スポーツ分析における次の革命であり、特にサッカーにおいて、チームとファンにこれまで以上に深いゲーム理解を提供するものである。
まず、スポーツの言語を指定します。ChatGPTの必須入力であるテキストには、次の言語を指定します。 はすでに存在しています。これまで見てきたように、ChatGPT言語モデルは、固有の構造(文字、単語、文、段落)を持つ生のテキストデータを利用する。トランスフォーマーアーキテクチャは、文、段落、全体的なストーリーの物語内の文脈を利用することで、欠落している単語を予測し、統計と相関関係を学習します。
スポーツデータは、固有の言語構造が異なる。例えばサッカーでは、11対11(または10人のフィールドプレーヤー対10人のフィールドプレーヤー)である。これらの選手にはそれぞれ役割があり、試合中に進化したり変化したりすることがある。
チーム内での試合中の選手情報の表現は非常に重要である。 各選手は文字であり(名前やジャージナンバーを使う代わりに、試合中の位置や統計、最近のプレーや長期的なプレーの統計を利用する)、フィールド上の各イベントは単語として記述することができ、その単語を理解するためには、これらの文字が正しく並んでいなければならない。
ひとつひとつのプレーは文章になり、ひとつひとつのポゼッションは段落になる。 章は試合であり、シーズンは本である。正しい構造(文法)を作ることに加え、スポーツデータの入力は時空間的(選手のポジションのXとO)であり、イベントベース(イベントの種類とポゼッションの結果)である。つまり、スポーツデータは本というより映画と考えた方がいいかもしれない。
サッカーの入力言語が定義された今、私たちは「サッカー言語モデル」の学習を始めることができる。AI チャットボットが「事実を幻覚化する」という本質的な問題を抱えていることを考えると、どんな質問に対してもアウトプットを生成することを目指すのではなく、「スマート・プロンプト・エンジニアリング」を使って、以前は答えられなかった質問に答えることができる。 スマート・プロンプト・エンジニアリングについては、本連載の第1回をご参照ください。
以下に多くの例を挙げる。
Opta Vision
Opta Vision 、vision 人間のイベントデータの両方を利用するAIデータフィードです。このデータは、当社のグラフィカル・ニューラル・ネットワークを通じて処理され、チームと選手個人の意思決定と実行能力を表す、あらゆるイベントの予測を提供します。
例えば、私たちの基礎となるフォーメーション表現(または言語)を使えば、チームがどのフォーメーション(例えば4-4-2、3-4-3、4-3-3など)をプレーしているのか、またポゼッションの有無でどのように変化するのかを検出することができる。
また、すべてのフレームで選手の役割を割り当てることができるので、選手がオーバーラップしたときや、試合中に戦術的な変更があったときを確認することができる。
同じ基礎的な表現を使って、プレーヤーがパスを出す可能性、そのパスが次の10秒間に得点チャンスを生み出す確率、あるいはそのパスが正しい選択肢であったかどうかの評価も予測できる。
私たちのサッカー言語モデルを使用することで、可能性のあるすべての選択肢を同時に予測することができる。これは、すべての選手の位置、ダイナミクス、イベントを入力シーケンスとして使用し、パスの難易度や可用性などに対応する出力シーケンスにマッピングすることで行います。
これまでは、各選手のオプションを個別に分析していましたが、私たちの大規模なサッカー言語モデリングアプローチを使用することで、すべての選手を一度に分析することができるようになりました。これは、各イベントに対する各選手の意思決定能力を理解する上で価値があることは言うまでもありませんが、同様のアプローチを使って、試合終了時の各選手の統計を予測することができます。
トランスフォーマーに基づく選手のパフォーマンス予測
あなたがサッカーの監督で、試合中にどの選手が結果を変えるのに最も大きな影響を与えるかを知りたいとします。これまでの選手のパフォーマンス予測は、他の選手や対戦相手とは無関係に行われていました。私たちは、サッカーデータの膨大なデータベースと私たちの変換アプローチを使用することで、すべての選手とチームの出力を同時に予測できるモデルを作成しました。
再び機械翻訳に例えて言えば、試合開始時(または試合中)の選手とチーム情報の入力シーケンスを入力シーケンスとしてマッピングすることである。次に、変換ネットワークを使用して、これを最も可能性の高い出力シーケンス(この場合は最終的な試合統計)にマッピングします。トランスフォーマー・ネットワークを使うことの利点は、見たこともないような状況にも素早く汎化できることだ。サッカーでは、レギュラーシーズンのチームはホームとアウェーで試合をするため、これはよくあることで、ラインナップは(監督だけでなく)しばしば異なり、また最近の調子も異なる。
これは新機軸であり、2023年にはこのテクノロジーの威力を披露する予定だ。 このモデルを学習させるために、私たちは1.5TBを超えるサイズのイベント・データからなる独自の深いOpta データベースを利用しました(これには私たちの膨大なトラッキング・データ・アーカイブは含まれていません)。
ゴースト
同じようなテクニックを使って、ゴースト(選手がプレーのどこにいるべきかをシミュレートすること。 サッカーや バスケットボール).
これまでのアプローチでは、決定論的な方法でチームの行動を予測するために、教師ありのポリシー・ネットワークを学習していたが、言語モデリングの進歩により、より創造的なアウトプット(以前には見られなかったようなものもある)を生成できるようになった。しかし、コーチやアナリストが、決定論的な予測(つまり、何が起こったか)と、そのプレーが実行された可能性のあるさまざまな方法とを比較することを好む場合があることは注目に値する。
データ収集
言語モデリングを使用するもう1つの利点は、スポーツデータ収集プロセス(前述のコーディングアシスタントと同様)において、vision選手およびボール追跡システム内で使用したり、人間のオペレーションチームやインテグリティチームが評価するために、誤りの可能性があるデータポイントを強調したりする補助として使用できることです。
結論
ChatGPTは素晴らしい野心的なツールで、信じられないほどよく実行されている。スポーツやニュース報道において、他の分野ほど直接的な用途はないかもしれないが、その根底にあるジェネレーティブAI アプローチはStats Performすでに使われている。チームパフォーマンスの分野ではすでに多くのアプリケーションを動かしており、将来的にはスポーツコンテンツや分析の多くの側面を補強することになるだろう。
パトリック・ルーシー博士は、スポーツデータ大手のStats Perform社のチーフ・サイエンティストで、同社が保有する深い宝の山であるスポーツデータの価値を最大化することを目標に、AI チームを率いている。AI ・リサーチやカーネギーメロン大学ロボティクス研究所で研究職を務めたほか、IBMのT.J.ワトソン・リサーチ・センターで博士号を取得。オーストラリア出身で、サザン・クイーンズランド大学でBEng(EE)、クイーンズランド工科大学で博士号を取得。100本以上の査読付き論文を執筆し、MIT Sloan Best Research Paper Trackの論文の共著者として、2016年に最優秀論文賞、2017年と2018年に準優勝を受賞している。