メインコンテンツへスキップ
フェデレーション&ライツホルダー

GPT-4:これでスポーツは何か変わるか?

Stats Performチーフ・サイエンティスト、パトリック・ルーシーがChatGPT、LLMへの進出と今後の展望について語る。

By:パトリック・ルーシー

2022年11月、人工知能研究所のオープンAI、超人気AI アプリケーション「ChatGPT」をリリースし、一世を風靡した。GPT-3(正確にはGPT-3.5)と呼ばれる大規模言語モデル(LLM)は、ChatGPTテクノロジーを駆動するテクノロジーである。パート1& パート2).数週間前、OpenAIは新しい大規模言語モデル(LLM)GPT-4をリリースしました。OpenAIによると、新しいモデルは以前のLLMよりもより多くのことができ、より正確だという。しかし、人々の度肝を抜いたのは、画像理解機能の導入だった。特に、OpenAIの共同創設者が、ジョークサイトのデザイン画をアップロードしたとき[LINK]。それに続いて、数日後、グーグルはリサーチモードのチャットボット「バルド」をリリースした。 最近リリースされたこの2つの機能がどのようなものかを知ることができる良い概要記事がたくさんありますが、この記事では、GPT-4モデルがスポーツにどのような影響を与えるかについて議論します。ここで共有する考えは、私が先月MITスローン(要約はこちら)会議と私たちのForum発表した内容の要約である。

GPT-4はスポーツにおける「Facts幻覚」問題を解決したか?

以前の記事で、ChatGPTをスポーツで使用する際の主な問題点を強調した:1)事実を幻視する、2)学習させたデータセットのカットオフが2021年9月である。最初の問題について説明しよう。すでに述べたように、GPT-4はより正確なはずだ。では、前回の記事で使った例を見てみよう(思い出として、2019年のラグビーワールドカップでチェスリン・コルベは何トライを決めたか? 答えは2トライ(1つは対NZ戦、もう1つは対日本戦)だった(これは誤りで、彼はグループステージの対イタリア戦で2トライ、決勝の対イングランド戦で1トライの計3トライを決めた)。

上記からわかるように、チャットボットが同じ質問をされた場合、その回答はより制約されたものになります。このように、ラグビーワールドカップで3トライを取ったという回答は正しいのですが、前の回答で提供された詳細なレベルに欠けています。より詳細な情報を求めると、このようになった:

結果から言うと、いくつかの問題(対イタリア戦で2トライ)には正解したが、それ以外の部分は間違っていた(カナダ戦では得点せず、イングランドとの決勝戦でトライ)。つまり、GPT-4が幻覚の問題を解くことに関しては、人工知能モデルの自己回帰的な性質(つまり、モデルは前の単語が与えられたときに次の単語を予測するものであり、現実の知識とは結びついていない)のために、まだ問題であり、長い間そうである可能性が高い。

先週ニューヨーク大学で行われたプレゼンテーションで、AI界で最も著名な人物の一人であるヤン・ルカンはこの問題を取り上げ、LLMに対する現在のアプローチは、この幻覚の問題を解決することができないため、失敗する運命にあると述べた。これらのモデルは、何らかの方法で現実と結びつける必要がある (スライドデッキはこちらスポーツにおける真実の源は、Stats Performような信頼できるスポーツデータプロバイダーから提供されることが不可欠なのだ。 このような問題や、害や誤報の可能性についての懸念は、1000人以上の技術リーダーから、これらのLLMは「社会と人類に重大なリスク」をもたらすとして、開発を一時停止するよう求める公開書簡が出されている。リンク].詳しくは最後に。

最新のデータセットとは?その点で何か変わったことはありますか?

イエスでもありノーでもある。幻覚の問題は残るだろうが、前述したように、OpenAIは先週、ChatGPT用のプラグインを多数リリースした。第3APIと対話できるようになります。リンク].これらのプラグインの進歩により、ChatGPTの機能を既存のコードスタックに組み込むことが可能になり、開発者はリアルタイムの情報コールを取得できるようになります。このスペースに注目してください。

さらに、これはChatGPTのような人工知能技術をライブ環境でどのように使用できるかという問題を提起している。一般的に、人々が抱く質問のほとんどは、変化しない静的な知識ベースに基づいています。しかし、スポーツ、特にライブゲームの場合は違います。もちろん、"誰が勝っているのか?"や "誰が得点したのか?"といった単純な質問をすることは可能だが、それらの答えは現在、"ChatGPT以前 "のチャットボットですでに入手可能だ。なぜなら、ゲームの特定の要素に関するクエリを入力するのに時間がかかると、他のことがすでに発生している可能性があり、そのクエリの価値や面白みが薄れてしまうからです。そのため、自動クエリーや「ハイライト検出」が必要なのです。私たちのPressBoxLiveプラットフォームにはこの機能があり、ゴールのような興味深いことが発生すると、それに関する興味深い洞察を即座に自動的に生成することができます。この優れた点は、拡張性があることです。例えば、最近のブンデスリーガ2部のアルミニア・ビーレフェルト対ニュルンベルクの試合では、ゴールが決まると、トップリーグと同じようにその試合のインサイトを生成することができます。 これは、スポーツにおけるAIの価値、つまりスケールの大きさ(しかもライブで行える)を強調している。これは、テキストによるインサイトだけでなく、ビデオに自動オーバーレイを生成することもできる。

ChatGPTにスポーツの画像や絵を入力して出力することはできますか?

前回の記事で述べたように、Stats Perform社ではインタラクティブなスポーツアナリティクスの領域を開拓してきた。リンクまた、私たちのゴースト機能を使って、ある状況において選手がどこにいるべきだったかを予測することもできます。リンク].しかし、GPT-4のデモに関しては、この機能は少し異なります。テキストから画像、または画像からテキストへの変換ネットワークは、膨大な量のテキストから画像へのペア(つまり、各画像にキャプションのようなテキスト説明がある)から学習します。この学習セットに対して、変換器はテキスト記述と画像の一部の間の相関を学習する。これらの非常に大規模なニューラルネットワークの創発的な動作により、画像の特定の要素に関する推論を行うことができる(例えば、ある画像が面白いのはなぜか?)

スポーツの場合、私たちはプレーのキャプションともいえるイベントの語彙をまだ増やしているところです。イベント・ストリームがあるだけでは十分ではありません。私たちのメトリクスと機械学習モデルを使えば、アクションの質を検出することができます(xGを使ったシュートや、サッカーのポゼッション値を使ったパスなど)。ボキャブラリーを増やすことも一つですが、データ量をスケールアウトすることも必要なことです。

だからこそ Opta Visiona)サッカーのイベント・ボキャブラリーを拡大し、b)この豊富なボキャブラリーを持つ試合数を拡大する。

さらに、拡張されたイベントストリーム(キャプションとして見ることができる)をトラッキングデータとペアリングすることで、このペアリングされたデータセット(すなわち、拡張された語彙とトラッキングデータ)を通じて、各プレーの推論を行う機能を追加することができる。私たちは現在、スポーツ分析の次のレベルにつながる転換点にいる。

LLM:信頼、混乱、社会への影響

前述のように、LLM技術のあまりの素晴らしさと急速な改良のため、世界中の多くの著名人が、このような技術が社会に与える影響や害の可能性を非常に警戒しており、そのためこの技術の一時停止を呼びかけている。これは非常に重要なトピックだが、スポーツに関しては、以下のように考えている。 私個人の見解としては私が現在この問題をどのように見ているかということである:

  • 学習支援ツールとして、LLMベースのAI チャットボットは、学習支援と効率性の点で画期的だ。他のテクノロジーと同様、何ができて何ができないかを知る必要がある。私の見解では、これらのAI ツールは究極の支援ツールであり、初心者がより高いレベルの効率性を得るのを助けることができる。リンク].別の研究では、GitHub Copilotを使用した開発者は、対照群よりも55.8%早くタスクを完了したことが示されている [ リンク ]。リンク]. ナレッジベースが静的で、信頼性が高く、最新のものである場合、質問して特定の知識を掘り下げることができるのは素晴らしいことだ(しかし、重要なのは、適切な質問をし、その答えが解決したい問題に関連しているかどうかを理解できることだ)。
  • しかし、ガードレールは必要だ。データが信頼できるものであれば(Stats Performデータのように)、そのような目的のためにデータを利用してもほとんど問題はない。事実と虚構が混在するスポーツ以外の分野では、誤った情報が伝播する可能性があるため、より問題となる。さらに、個人情報や機密情報を保護することも重要である。いったんこの情報がLLMの中に入ってしまうと、それが広まるのを止めるのはほとんど不可能だからだ。
  • スポーツの世界では、このような自然なガードレールが存在する。例えば、Stats Perform、試合データという公的な記録の管理者ではあるが、選手の医療、心理、トレーニング、契約情報といったプライベートな情報は持っていない(持つとは思っていない)。この自然なガードレールは保護になる。また、選手/クラブ/クライアントが、私たちの試合レベルの分析/モデルをインプットの1つとして使用し、彼らが持っているプライベートなデータと融合させることもできます。
  • また、人間が最終的な意思決定者である必要がある(そして、テクノロジーがいつ誤りを犯し、いつ信頼できるかを知ることができる必要がある)。これは飛行機のパイロットに置き換えて考えることができる。この100年間、民間航空機のパイロットの数は変わっていない。しかし、飛行機のテクノロジーは劇的に改善され、意思決定、安全性、効率性が向上した。にもかかわらず、パイロットの数は変わらない。基本的に、私たちのスポーツ分野でAI テクノロジーが行っていることは、可能な限り効率的であるだけでなく、領域の専門家が最良の意思決定を行うのを助ける支援技術を生み出すことである。
  • また、世界は自然言語やスポーツデータだけで存在しているわけではない。例えば、選手が前夜ぐっすり眠れたかどうか、大切な人と喧嘩をしたかどうか、子供が病気かどうか、選手の性格間の相互作用など、まだデジタル化できないことがたくさんある(前述したパブリックデータとプライベートデータの関係上、おそらく今後もデジタル化されることはないだろう)。意思決定者は、彼らが持っている多くのセンサーのインプットを通してそれを自分でデジタル化することができ、その結果、最良の決断を下すために最も関連性の高い情報を手元に置くことができる。私たちの仕事は、利用可能なデータから最善のインプットを与えることだ。 

人工知能の領域は日々変化しており、私たちはこの分野の進歩や、それが私たちにどのように関係しているのかについて、皆さんに最新情報をお届けできるよう最善を尽くします。次回は、Vision さらに深く掘り下げ、それが自律走行車の領域で起きていることとどのように類似しているかを紹介する予定だ。続報をお待ちください。

パトリック・ルーシー博士は、スポーツデータ大手のStats Perform社のチーフ・サイエンティストで、同社が保有するスポーツデータの宝庫の価値を最大化することを目標にAI チームを率いている。AI ・リサーチやカーネギーメロン大学ロボティクス研究所で研究職を務め、IBMのT.J.ワトソン・リサーチ・センターで博士号を取得。オーストラリア出身で、サザン・クイーンズランド大学でBEng(EE)、クイーンズランド工科大学で博士号を取得。これまでに100本以上の査読付き論文を執筆し、MIT Sloan Best Research Paper Trackの論文では共著者として2016年に最優秀論文賞、2017年と2018年に準優勝を受賞している。