メインコンテンツへスキップ

ロール・ディスカバリーの紹介:エリート・プロサッカー選手におけるデータ駆動型役割の生成

 

クラブのゲームモデル内で役割を定義することで、採用アナリストは各役割のパラメーターに適合する選手をより客観的に直接比較することができる。この記事でStats Perform 、イベントデータによってAIモデルが、世界中の主要なコンペティションに出場する選手のオンフィールドでの役割をどのように自動的に検出できるかを概説している。

 

By: アンディ・クーパーアンディ・クーパー

テクニカル・スカウトに異なるアプローチを

過去10年間、スカウト部門が採用見込み選手を特定し、監視し、評価するプロセスは、ビデオやデータを駆使した新しいテクノロジーが利用可能になるにつれて、絶えず進化してきた。

しかし、その結果、クラブが実際に選手の評価基準をどのように定義しているかに目立った変化はあっただろうか?部署内では、ゲームモデルに基づいてポジション別のKPIが定義され、選手のパフォーマンス・アウトプットに照らして測定されます。KPIはまた、スカウトが主観的に選手を評価するためのポジション別テンプレートに適用することもでき、さらにコンテクストのレイヤーを追加することができます。

しかし、10年前と比べれば、これらのプロセスがより焦点化され、厳密になっていることは間違いないが、1つだけ、適切に対処されていない大きな疑問がある:特定のポジションのKPIに基づいて選手を評価することは、どの程度信頼できるのか?

今日、選手とそのポジションは、フルバック、センターバック、センターフォワードなど、25年前と同じようにラベリングされ続けている。しかし、同じ「ポジション」で異なるクラブでプレーする有望株を比較する場合、その多くは根本的に異なる資質を持っているため、同じKPIに照らして客観的に評価することは難しい。

そこでStats Perform新しいコンセプト「Role Discovery」の出番です。ロール・ディスカバリーとは、当社のAI チームが開発した新しい選手評価方法で、ポジションに基づいて選手を評価することの限界に対処するものです。その代わりに、チーム内での役割に基づいた選手のプロファイリングに焦点を当てています。

教師なし学習プロセスを適用することで、Role Discoveryは、採用アナリストがより広いチームスタイルの中でプレーヤーを評価することを可能にする。つまり、ゲームモデルの中で各役割を果たすために必要な主要な傾向と特徴に基づいて、見込み選手をグループ分けするのだ。

この記事では、クラブが来年に向けてテクニカル・スカウトの新たなアプローチを検討できるようにする、「役割発見」の背後にある重要な要素のいくつかを紹介する。

ステージ1:プレースタイルの観点から、各選手の空間的傾向を見極める

ロール・ディスカバリーは、ピッチ上の29の選手クラスタから、合計18種類のロールを検出する。役割検出の出発点は、空間的なヒートマップを生成するために、選手のパスの最も一般的な開始位置と終了位置を特定することです。

下の図は、2018/19シーズンに2人のセンターフォワード、ロベルト・レバンドフスキとロベルト・フィルミーノがピッチ上で最も多くパスを出した3つのエリアを示している。

両選手ともセンターフォワードと表記されているが、このヒートマップを見れば、両選手がそれぞれのクラブで異なる役割を果たしていたことは明らかだ。レバンドフスキが最も多くパスを出した場所は、中央のエッジ付近とボックス内だった。対照的に、フィルミーノは右サイドチャンネル内のハーフスペースからのボールが多かった。

しかし、この情報だけでは洞察に限界がある。そこで、Stats Perform Playing Stylesのフレームワークを選手のタッチに適用することで、各選手がプレーの特定の局面にどのような影響を与えるかを理解し始めることができる。

これはレバンドフスキとフィルミーノのスタイルの違いをさらに浮き彫りにしている。以下のグラフは、各選手が特定のスタイルでプレーしているときのボールタッチ数を、トップ5リーグの他の選手と比較したものである。

平均と比較すると、フィルミーノのクラスターはカウンターアタックの局面での関与が最も大きく、脅威の持続の局面でも強く機能している。レバンドフスキのクラスターは「脅威の持続」において平均を下回っており、彼の役割が他の役割と比較してアタッキングサードにおけるチームのポゼッションシークエンスにそれほど関与していないことを示している。

第2ステージポゼッションにおける選手の貢献の質を数値化する

Role Discoveryは、ピッチ上でプレーヤーが最も頻繁にボールに触れるエリアと、特定のプレースタイルにおけるプレーヤーの貢献度を確認した後、Stats Perform ポゼッションバリュー(PV)フレームワークを適用し、ポゼッションシークエンスにおけるプレーヤーの関与が、次の10秒間のプレーでチームが得点する確率をどのように高めるかを判断します。

ポゼッションバリューは、パス、ドリブル、クロスなどのオン・ザ・ボールの重要なイベントや、タックル、インターセプトなどの守備的なアクションをカバーし、ポジティブな貢献とネガティブな貢献に基づいてプレーヤーを評価する。

下の表は、2018/19プレミアリーグシーズンのリバプールで90試合あたり最高のPV+を記録した選手のリストであり、ゴール確率の向上におけるモ・サラー、アンドリュー・ロバートソン、フィルミーノの漸進的な貢献を強調している。

プレーヤーのボールの使い方を分析するために適用されるもうひとつの新しい指標は、パス完成期待値(xP)である。このモデルは、パスの距離や角度、ポゼッションムーブのその他の文脈的要素など、さまざまな要素を考慮して、パスが完了する確率を設定する。

この指標を適用することで、ポゼッションにおける選手の傾向をより深く理解することができる。つまり、どの選手が、確率の観点から見て、完了するのがより難しいペネトレイトパスを高い割合で試み、完了させるかを特定することができる。

このデータをロール・ディスカバリー・モデルに組み込むため、ピッチを異なるゾーンに分割し、各ゾーンにおける選手の位置とxP完了率を強調することで、彼らがチームのために重要な貢献をしている場所を特定した。

PVとxPを組み合わせることで、パスを出した選手の潜在的な報酬を潜在的なリスクと照らし合わせて評価し、他の選手とのパフォーマンスを比較することができる。

レバンドフスキとフィルミーノの比較に戻ると、下の図は2018/19シーズンに中央の攻撃的MFゾーンにパスを出したときの各選手のパフォーマンスを示している。

フィルミーノのxP完了率が0.75を上回っているのは、彼がこのゾーンに安全で確率の高いパスを出していることを示している。同時に、彼はプログレッシブPVの上位10%に入ることで、チームが得点する確率も高めている。

レバンドフスキは異なるタイプのストライカーであり、xP完了率では平均に近く、PVでは下位10%台である。これは、彼がポゼッションの連鎖に参加する回数が少なく、ゴールへのシュートを多く放ち、連鎖の最終的なプレーヤーになる可能性が高いことを裏付けている。この点については後ほど詳しく説明する。

ステージ3:選手がどのようにポゼッションシークエンスに関与するかを確立する

ロール・ディスカバリーでは、選手がチームメイトとどのように相互作用するかをさらに特定するために、もうひとつの新しいモデル、ムーブメント・チェーンを組み込んでいる。

ムーブメントチェーンは、4つのパスで構成されるパスのモチーフに基づいてラベル付けされており、チームがどのようにボールを進行させるか、またどの選手が関与しているかを特定するのに役立つ。

xPと同様に、ムーブメントチェーンを分析するために、ピッチをゾーンに分け、チームがあるゾーンから別のゾーンにボールを移動させる方法について、クラスタリングを使って最も頻度の高いパターンを特定する。下図のように、スタートゾーンはディフェンス3分の1の中央エリア、エンドゾーンは敵陣ボックスの端となる。

ムーブメントチェーンは、プレースタイルの文脈にも適用でき、特定のスタイルでプレーしているときにチームがどのようにボールを動かしているかを特定することができる。下の例は、2018/19シーズンにリヴァプールがビルドアップに取り組んだ際に、相手ペナルティエリア内で終わった最も危険な連鎖を示しており、ボックス内に侵入するために右インサイドと左インサイドのチャンネルを通してどのようにプレーするかを強調している。

ステージ4:各モデルを適用して役割を作成する

チームのポゼッションチェーンにおける個々の選手の関与を特定するために、Word2VecにインスパイアされたChain2Vecモデルを適用し、選手が頻繁に登場するチェーンクラスター、そのコンテキスト、および1つのパスモチーフの中で選手がどのように相互作用するかを特定する。ディープラーニング技術によるこの高度なモデリングは、選手とチームの関与をコンパクトに表現します。

これと並行して、プレーヤータッチマップが適用され、プレースタイル、xP、PVモデルと同様に、各選手の空間的なコンテキスト情報が提供されます。さらに、選手がオープンプレーで打つシュートの種類とその位置の内訳も含まれています。

これらの出力はすべて、クラスタリングアルゴリズムであるガウス混合モデルを使用して、グループ分けを学習し、選手を特徴的なグループに分けるために、最終的な役割発見モデルに適用されます。 これらのクラスターから、私たちはデータ駆動型の記述を使用して、400を超える個々の選手の記述子をピッチ全体の18の別々の役割に凝縮することができます。

これらの役割は以下のように表示されている(クリックで拡大):

レバンドフスキとフィルミーノに話を戻すと、それぞれの選手が異なる役割にフィットしていることがわかったので、今度は直接比較するのではなく、それぞれの役割の選手と比較してみよう。

下の図は、以前使ったのと同じパス比較だが、今回はそれぞれの役割の選手をオレンジ色で強調している。

フィルミーノの場合、トップ5リーグの全選手と比較すると、xP完了率は上位10%台に入るが、他の「攻撃的創造的脅威」の選手とだけ比較すると、平均にかなり近い。

レバンドフスキの場合、他の「上級フォワード」とだけ比較すると、彼のパスは平均よりもはるかに安全であることがわかる。また、彼のプログレッシブPVの貢献度はまだ平均以下ではあるが、全選手と比較した場合ほど極端な数字ではない。

結論選手比較をより客観的に

役割を定義することで、採用アナリストは「役割発見」を適用し、各役割のパラメーターに適合するプレーヤーをより客観的に直接比較することができる。これにより、スカウティングのプロセスが効率化され、フィールド上で同じポジションでプレーする選手を同列に評価するのではなく、その選手が果たす役割の文脈で分析することができる。

このモデルを構成する要素には、採用に関する4つの重要事項が集約されている:

  • 選手はピッチのどこでプレーするのか?- 空間的フットプリント
  • 彼らはいつ重要な貢献をするのか?- プレースタイル
  • 同じ役割を担う他の選手と比べた場合、そのリスク・リターン・プロフィールと重要な貢献の質は?- xPとプログレッシブPVのアウトプット
  • 選手はどのようなパスムーブに関与するのか?- 動きの連鎖

加えて、ロール・ディスカバリーは、現在所属クラブでプレーしているポジションとは異なる役割やポジションのために重要な特性を持つ選手を特定するための補助として使うこともできる。これは、若いガレス・ベイルやフィリップ・ラームなど、キャリアをスタートさせた当初はフルバックだった選手が、ピッチの高い位置でプレーするようになった例を分析するのに役立つ。

ロール・ディスカバリーが特定の役割の後任を特定するためにどのように適用できるかを示すケーススタディは、xPやムーブメント・チェーンなど、このコンセプトを支えるモデルから得られた分析例とともに、今年後半にStats Perform ウェブサイトで公開される予定だ。

ロール・ディスカバリーについてもっとお知りになりたい方、あるいはこれまでに開発したものに関してご質問がある方は、こちらからご連絡ください。