メインコンテンツへスキップ

ネットワーク科学を使ってサッカーチームの識別可能性を定量化する

 

Stats Performゲストブログで、ハビエル・ブルドゥとダビド・ガリードが、2017/18シーズンのリーガ・エスパニョーラのイベントデータを応用した研究プロジェクトから得た知見を紹介している。

 

によるStats Perform

ハビエル・ブルドゥとダビド・ガリドは、2020年のOptaProForumポスター発表を行い、Opta データを用いて、パスパターンの持続性に基づいて、チームのプレースタイルがシーズン中にどのように維持されるかを定量化するネットワーク科学のアプローチを紹介した。

このゲスト・ブログでは、彼らのプレゼンテーションの背後にある方法論と、主要な調査結果の概要を紹介する。

クリック ここをクリックをクリックしてポスターをご覧ください。

複雑系としてのサッカーチームの紹介

「複雑系とは、相互に作用し合う可能性のある多くの構成要素からなるシステムのことである。複雑系とは、構成要素間の依存関係、競合関係、関係性、あるいは他の種類の相互作用、あるいはあるシステムとその環境との相互作用のために、その振る舞いをモデル化することが本質的に困難なシステムのことである。

脳、地球の気候、生態系は、明らかに複雑系の例である。私たちは、サッカーもこのように分類されることを強く主張したい。

なぜですか?

さて、サッカーの試合中、選手と呼ばれる22の構成要素は、複雑な方法で相互に作用し、依存関係を生み出し、競争し、さらに重要なことに、「プレーパターン」のような新たな特性を生み出す。このような理由から、複雑系科学はサッカーのデータセットを分析するための有効な選択肢であり、美しいゲームの分析に新たな視点を導入するものである。

その理由は、複雑系科学の基礎となるパラダイムを言い換えれば、「構成要素(つまり選手)を個別に見て分析することはできず、逆にシステム全体を考慮する必要がある」というサッカーの複雑な性質にある。試合で最も成功した選手でさえ、"自分だけの力ではない、チームの力だ "と認識している。

チーム活動を複雑なネットワークに変換することは、複雑性科学に基づく多くのアプローチのひとつである。パスによる選手間の相互作用を考慮することで、チームの組織を分析することができる。パスネットワークを構築することで、試合中、選手から選手へ、どのようにボールが動いたかという情報を含むことができる。

パッシング・ネットワークが "複雑なネットワーク "である理由は主に2つある:

1.ノード(選手)と選手間のリンク(パス)で構成される;

2.ノード間の相互作用は、ある "複雑な "規則に従っている。

さらに、これらのネットワークは、有向性(プレーヤー間のリンクが一定の方向を持つ)、重み付け(リンクの重みはプレーヤー間のパス数)、空間埋め込み(ボールとプレーヤーのユークリッド位置が大きく関係する)、時間発展性(ネットワークが継続的にその構造を変化させる)であるため、分析は容易ではない。

以下の図1は、2017/18シーズンのバルセロナ戦におけるレアル・マドリードのパスネットワークの一例である。プロットでは、プレーヤーのサイズはパスネットワークにおける重要度に比例している。選手はパスが出された平均的な位置に配置されている。リンクの幅は、2人のプレーヤー間のパス数に比例している。最後に、交代は緑色でハイライトされている。

この図から、レアル・マドリードがどのようにプレーし、フィールドをどのように占拠し、選手同士がどのように影響し合い、交代後にどのように組織が変化したかを素早く把握することができる。

図1:パスネットワークの模式図(レアル・マドリード対バルセロナ、2017/2018シーズン)。

これは、チーム活動をネットワークに変換することで、どのようにチーム組織を理解することができるかのほんの一例に過ぎない。さまざまな空間的・時間的スケールのネットワーク構造から多様な指標を抽出することができ、チームがどのように組織化され、プレーヤーがチームのパフォーマンスにどのように貢献しているかをよりよく理解することにつながる(Burdú et al.)

これは、ネットワーク構造とダイナミクスを分析する複雑系科学の一分野であるネットワーク科学の課題である。ネットワーク科学は、サッカーのデータ分析にはまだ完全に適応されていないが、今後数年のうちに、パフォーマンスに関する新たな視点を提供する可能性を秘めている。

ピッチ・パス・ネットワーク

パスネットワークを作る方法は他にもある。選手の役割ではなく、チームの空間的な構成に関心があるのであれば、ピッチのパスネットワークを構築し、分析することができる。この例では、ネットワークのノードは選手固有のものではなく、フィールドの特定の領域であり、その領域を占める選手によるパスによって接続される。

図2は、レアル・マドリー戦でのバルセロナのピッチ・パス・ネットワークの例を示している。

図2:左から右へのプロットは、バルセロナの3×3、5×6、10×10のパスネットワークで、ノードはピッチの領域、リンクはその間のパス数を表す。

なぜ1つのネットワークではなく、3つのネットワークをプロットするのか?その理由は、ピッチを異なる大きさのエリアに分割することで、異なるスケールのピッチネットワークができるためである。このように、図2の3つのネットワークは、同じ試合中の同じチームに対応し、唯一の違いは分割の大きさである。しかし、分割の数によってネットワークの構造が異なることに注意してください。これは、異なるスケールでのネットワーク特性の分析が必要であることを示しています。

サッカーチームの識別可能性

さて、枠組みが決まったところで、いよいよ質問だ:

  • チームがどの程度プレースタイルを確立しているかを数値化することは可能か?
  • どのチームが対戦相手に順応し、どのチームが自分たちのスタイルに忠実なのか。
  • 試合中、どのチームが対戦相手に自分たちのスタイルを押し付けるかを数値化できるだろうか?
  • アウェイでプレーするとき、どのチームが異なる行動を取るのか?

これらすべての疑問に答えるため、私たちはネットワーク科学を応用して、ピッチのすれ違いネットワークの組織を分析した。

試合のイベントデータを使って、各チームに関連するマルチスケールのパスネットワークを構築し、ネットワーク科学のさまざまな方法論を使ってその構造を分析した。

こうして、我々は特定することができた:

  • どのチームが自分たちのプレースタイルを相手に押し付けたのか;
  • 試合前に対戦相手に何を期待するか;
  • チームが期待通りのプレーをしたかどうかをどう評価するか。

私たちの唯一の情報源は、シュート数、ゴール数、タックル数、ドリブル数、その他のアクションを無視して、各チームがボールをパスした方法だけである。しかし、後述するように、パスパターンは依然としてチームの組織の本質を捉えることができる。

ピッチをn×mの領域(n=1,2,3,...10m=1,2,3,...10)に分割し、ピッチのN=(n×m)の領域に対応するノードと、領域iから 領域jへのパス数を表す aijからなるピッチ通過ネットワークを構築した。

我々は、シーズンを通して、異なる空間スケールで、結果として得られた接続性マトリックスA{aij }の特性を分析した。コネクティビティ・マトリックスの要素は、ピッチの領域間のパス数であり、各チームのパスパターンを数学的に抽象化したものである。我々は、シーズン中のあるチームの接続性マトリックスがどれだけ似ているかを定量化することによって、各チームの一貫性パラメータ(C)を計算した。

つまり、一貫性の高いチームはシーズンを通してパスネットワークの構造を維持し、一貫性の低いチームは試合ごとに組織を変えていた。

次に、各チームのピッチのパスネットワークがどの程度ユニークであるかを定量化した。これは、あるチームのパッシングネットワークの構造を、大会に参加している他のチームのものと比較することによって行うことができる。最後に、チームの識別可能性パラメータ(I)を、一貫性パラメータCからライバルの類似性Rを引いたもの、すなわちI=C-Rと定義した。

識別可能性パラメータが高いチームとは、一貫性があり、同時に他とは異なるチームである。

私たちの方法論は、記述的かつ将来的な応用が可能である。一方では、シーズンを通してプレースタイルを維持しているチーム(「識別可能性が高い」)と、逆に一貫したスタイルを持っていないチーム(「識別可能性が低い」)を識別することができた。

リーガ・エスパニョーラと共同で、2017/18スペイン・トップリーグチームの識別可能性パラメータを計算した。

図3は、それぞれ首位と最下位に終わったバルセロナとマラガの識別可能性の値を示している。横軸には、ピッチを分割したノードの数をプロットした。興味深いことに、バルセロナのプレースタイルをよりよく識別するためには、ピッチを約50のエリア(ノード)に分割する必要があることがわかった。マラガに関しては、すべてのスケールで識別可能性がかなり低いことがわかる。

図3:左の図は、ピッチの分割数(ノード)に基づいてバルセロナの識別可能性パラメータをプロットしたもの。右側は、マラガについて同じ分析結果が表示されている。

申し込み

重要なのは、この情報が、対戦相手の予想されるアプローチを特定することによって、コーチングチームが試合の準備をするのに役立つことである。

例えば、チームが次の対戦相手の識別可能性を評価し、相手のプレースタイルに基づいて自分たちのアプローチを適応させるかどうか(相手チームの識別可能性が高い場合)、あるいは自分たちのスタイルを相手に押し付けようとするかどうか(識別可能性が低いチームと対戦する場合)を決定することは可能である。

また、識別可能性を使って、どのチームが自分たちのスタイルに最も近いプレーをしたかを、試合ごとに定量化することもできる。

表1は、2017/2018シーズンのリーガ・エスパニョーラにおけるホームチームとアウェイチームの試合ごとの識別可能性の違いを示している。

縦軸に示したホームチームが自らのプレースタイルを押し通した(つまり識別可能性が高かった)試合は黄色で強調され、緑色のセルはアウェイチームが自らのスタイルを押し通した試合に対応する。識別可能性とチームのパフォーマンスとの関連性を示すことを目的として、チームは最終的なリーグ戦の順位に基づいて並べられている。黄色のセルは主に対角線上のマトリックスラインの上に表示されており、これは2つのチームが対戦する際、上位にランクされている方が自チームのプレースタイルを押し付ける確率が高いことを示している。

個々のチームにスポットを当てると、バルセロナがホーム、アウェーともに、より多くの試合で「識別可能性コンテスト」を制し、レアル・マドリードが僅差で続いていることがわかる。ただし、識別可能性の差が必ずしも試合結果の指標になるとは限らないことは強調しておきたい。これがサッカーの本質であり、自分のやり方でプレーすれば必ず成功するとは限らないのだ。

表1:縦軸はホームチーム、横軸はアウェイチーム。アウェイチームは横軸に同じように並んでいる。試合結果は各セルの中に表示される。黄色はホームチーム、緑はビジターチーム。青色のセルは、両チームの識別可能性に明確な差がなかった試合に対応する。

結論として、試合中に識別可能性パラメータをリアルタイムで推定することが可能であり、チームや対戦相手が予想通りのプレーをしているときにハイライトを当てることができることも強調しておきたい。 これは貴重な情報であり、ベンチからの試合中の重要な意思決定に役立つ可能性がある。

この手法をさらに応用すれば、ホームとアウェーでどのチームが異なる行動をとるかを分析したり、試合中にチームの予想されるパスパターンから外れるピッチ上の領域を特定したりすることも可能になる。


参考文献

Buldú, J. M., Busquets, J., Martínez, J. H., Herrera-Diestra, J. L., Echegoyen, I., Galeano, J., & Luque, J. (2018).サッカーのパスネットワークを分析するためのネットワーク科学の利用:ダイナミクス、空間、時間、ゲームの多層性。Frontiers in Psychology, 9, 1900.

Buldú, J. M., Busquets, J., & Echegoyen, I., & F. Seirul.lo (2019).歴史的サッカーチームの定義:グアルディオラのFCバルセロナを分析するためにネットワーク科学を使用する。Nature Scientific Reports, 9(1), 1-14.


応用物理学の博士号を持つハビエル・ブルドゥは、マドリードのフアン・カルロス国王大学の複雑系グループのコーディネーターであり、生物医学技術センターの生物学的ネットワーク研究室の主任研究員でもある。

Eメールでのお問い合わせはjavier.buldu@urjc.esまで。

ダビッド・ガリドは、スペインのマドリードにあるキング・ファン・カルロス大学のバイオメディカル・テクノロジー・センターで学ぶ博士課程の学生である。