OpenAIのChatGPTは2022年末にローンチされた。インターネット上の膨大な量のテキストで訓練された「会話型チャットボット」は、AI 技術の日常的な活用における新たなブレークスルーを体験することに熱心な数百万人のユーザーを瞬く間に集めた。
しかし、ChatGPTはスポーツと関係があるのだろうか?Stats Perform膨大なスポーツデータで学習させた機械学習モデルを補完するのか、それとも競合するのか?
ネタバレChatGPTは、Stats Perform AI チームが使っているのと同じディープラーニング・アプローチのいくつかを利用しているが、入力も目的も異なる。このような同じAI テクニックは、実は技術界全体で見られ、数多くの問題を解決しています。ここではChatGPTを使って、これらの基礎となるAI 技術、ChatGPTの価値、限界、そしてスポーツ業界における関連性を説明します。
次の記事では、Stats Perform スポーツの問題を解決するために、同様のディープラーニング手法を現在および将来的に使用する場合についてもいくつか取り上げる。
ChatGPTとは?
ChatGPTは、インターネット上のほとんどのテキストを読んで、単語、文章、段落がどのように構成されているかを理解し、質問をテキスト入力として受け入れ、対話形式のテキスト出力として首尾一貫した響きのある回答を生成できるようにしたモデルである。
これは、「生成AI」を使用して、次の単語を生成する。 次の単語の予測を生成する これは、与えられた入力プロンプトの幅広い範囲から、統計的に可能性の高い次の単語を予測します、 前の単語の文脈に基づいている。その出力はその出力は、流暢で自然な響きのテキスト応答の形をとる。
技術用語では、ChatGPTはGenerative Pre-trained Transformer (GPT)大規模言語モデル(LLM)の一種であり、プロンプトエンジニアリングを使って会話に似た振る舞いをするように誘導する。
言語モデルは新しいものではありませんが、ChatGPTで使われているGPT-3 LLMのすごいところは、それが本当に 本当に学習されるデータ(つまりインターネット上のすべてのテキストデータ)だけでなく、利用するパラメーターの数(1750億)も大きい。トランスフォーマー・ネットワーク・アプローチを使用して、この膨大なテキスト・リポジトリの相関関係やパターンを学習するのだが、これが超人的なのだ。
プロンプト・エンジニアリングと呼ばれる、要求される内容や返答のスタイルを記述する入力問題を巧みに作成することで、プロンプトを作成することができる。 プロンプトエンジニアリングChatGPTは、必要なスタイルとコンテンツを表示するように訓練された少数のテキストサンプルを選択し、これらのサンプルを合成して、人間の言語を模倣した方法でテキスト;記事と質問に対する回答のためのエッセイのような出力を生成することができます。
ジェネレーティブAI 他に何ができるのか?
大規模言語モデルは、生成AI モデルの一種である。また、テキスト入力を促し、画像などの他の出力を生成することもできる(例えばOpenAIの DALL-E-2)やビデオ(例えばMetaの MakeAVideo).ロボット工学でさえ、この技術を活用している。 RT-1これは、自然言語のテキスト命令と画像を入力として受け取り、出力として実世界のロボット・タスクを直接生成するよう促すことができるトランスフォーマーである。
LLMはまた、特定のドメインの内容理解/翻訳/質問応答(例えば、臨床記録の抽出、要約、符号化など)にも使用される。 臨床記録の符号化または 法律文書や 顧客サービス.LLMは、例えば以下のようなコーディング支援ツールを提供する。 例えばGithubのCopliotエラーにフラグを立てたり、コードを生成したり、自動補完したりできる コードを生成したり、自動補完したりします、作業している特定のAPIのコンテキストに基づいて.
ChatGPTの限界
ジェネレーティブAI ラベルに書いてある通り、予測を生成する。
ChatGPTは単語について知っており、どの単語がどのような順序で文中に一緒に現れる可能性が高いかを知っています。ChatGPTが最終的に選ぶ実際の単語は問題ではなく、文全体の中でその単語がもっともらしく聞こえる限り、事実であるこれらの単語のいくつかを「幻覚」してしまうことが多いのが問題だ。
幻覚の問題だけでなく、ChatGPTは権威的な書き方で回答を書くので、不正解でも、特に専門家でない人には信じられるように聞こえる。
これはChatGPTだけの問題ではなく、ジェネレーティブAI ツール全体の問題だ。本物のコンテンツを偽る(画像、動画、音声の深いフェイクなど)のが得意なのだ。他のツール同様、テクノロジーに何ができるか、そして最も重要なことは何ができないかを知る必要があります。
ChatGPTはスポーツ界で何ができるのか(そして何ができないのか)?
第一に、ChatGPTは2021年9月までの単語しか学習していないので、最近の答えを出すことはできない。第二に、GPT-3は入力としてテキストを必要とします。Stats Perform'sでは、AI動かす "スポーツ言語 "を作成しました。そして最後に、重要なことですが、ChatGPTは予測する "答え "が事実上正しいことを保証するために最適化されていません。
ChatGPTはラグビーやクリケット、バスケットボールやフットボール、国、カップ、バット、ボール、その他世界のことについては何も知りません。 事実や統計に関するトレーニングも受けていませんし、予想を生成するための正確な情報を認識することもできません。 知っているのは語順だけだ。
このため、ニュースやスポーツのように、結果は結果、統計は統計であるような領域では、特にChatGPTは、信憑性があるように見えるが、実際に起こったことに基づいていない、非常によく書かれた記事を生成することができるため、制限となる。
例えば、2019年ワールドカップに出場するラグビー選手に関するこの質問のように、非常に具体的な質問をすることでそれがわかる:
チェスリン・コルベはグループステージのイタリア戦で2トライ、決勝のイングランド戦でトライを挙げた。
スポーツ界にChatGPTの役割はあるのか?
P構造化された、正確で最新のデータとコンテンツフィードに答えて、ChatGPTの将来のバージョンは、理論的には、「明日のすべての試合のプレビューを書いてください」のようなテキスト質問をトリガーとして、ファンを更新するテキスト記事を迅速に作成することができます。
しかし、このような自動化された機械が書いた記事はすでに存在しています。彼らはChatGPTが提供するような "会話的 "なプロセスは使っていませんが、事実として正しいのです。
ニュアンスの違いだが、ChatGPTは物語を生成し、物語の中の情報も生成する。このため、スポーツ報道を含むニュース報道の合成には、生成AI 問題がある。
その代わりに、Stats Perform自動試合プレビューのような特定の事実に基づいた製品は、まずストーリーの種として我々のスポーツデータフィードから統計や事実を使用し、その具体的な情報を中心に物語を構築する。
私たちのツールはデータフィードから始まり、それらのデータフィードは構造化され、正確であるため、書かれる記事は変化せず、『生成された』予測ではなく、起こったことなのです。
その他、当社のデータフィードをベースとする自動化されたスポーツレポートスタイルのサービスには、テレビ解説者向けにリアルタイムでインサイトを生成する「Pressbox Live」や、ゴールやタッチダウン、バスケットが決まるたびにソーシャルメディアやブログ用に自動画像を生成する「PressboxGraphics」などがある。
次はどうする?
パート2では、ChatGPTを支える根本的なAI 注目し、特にハイパフォーマンスの世界で、スポーツ体験を向上させるためにどのようにすでに使用されているかをレビューする。
パート3では、最新のChatGPT-4モデルの意味と、それがスポーツにとって何を変えるのかを取り上げる。


