メインコンテンツへスキップ

現代のフルバックにおけるプレースタイルのクラスタリング

によるStats Perform

マーク・キャリーとムラデン・ソルマズは、2018年OptaProForumポスター発表を行った。本記事では、彼らの分析について詳しく紹介する。彼らのポスターはこちらでも読むことができます:

ポスター1を読む

ポスター2を読む 

 

近年、フルバックの役割は劇的に変化し、ヨーロッパ中の多くのチームが、ディフェンスを守ること以上に、フルバックをいかに攻撃に参加させるかに主眼を置いている。昨シーズン、チェルシーがプレミアリーグのタイトルを獲得した際、アントニオ・コンテ監督の3-5-2フォーメーションが大きな効果を発揮した。しかし、ヨーロッパ中のフルバックのプレースタイルの違いを主観的に観察するのではなく、これらのスタイルを数値化することはできるのだろうか?

ここ数シーズン、フルバックのプレースタイルが非常に多様化しているため、フルバックに焦点を当てたが、この方法はどのポジションにも適用できる。私たちがやりたかったのは、フルバックのさまざまなプロフィールについて、より詳細で客観的な指標を提供することである。そのために、まずOpta F9のデータ(集計された試合の合計)を使って、データの次元性を下げるためにバリマックス回転を用いた主成分分析(PCA)を実行し、分析に入力したフルバックの広範なプロフィールを決定しました(PCA分析の詳細はこちら)。次のステップは、この情報を使って、プレースタイルが最も似ているフルバックを定量化することだった。

数字

2015/16シーズンと2016/17シーズンの「ビッグ5」欧州コンペティションに出場した417人のフルバックを分析した。PCAが2シーズンにわたって安定したプロフィールを示した後、2016/17シーズンのデータをクラスター分析に入力した。類似または関連するプロフィールを持つ個人は一緒に配置され、プロフィールが異なる個人は分離される。リーグをまたいだ選手の比較は難しいので、分析ではその補正に最善を尽くした。

分析結果は非常に興味深く、パフォーマンス統計に基づいて11の選手クラスターが作成された(図1参照)。重要なのは、プレースタイルから同じクラスターに属すると予想される知名度の高い選手が、実際に同じクラスターに属していることである(例:マルセロ、アレックス・サンドロ、ダビデ・ザッパコスタ)。下の図1は、より広いグループと、より具体的なサブグループを作成し、それぞれの線が個々の選手を表している。

私たちは、すべての選手と「スタイル・パートナー」を一致させ、そのペアを他のペアやグループと繰り返し比較することによってグループを拡大し、ツリーのトップに達するまで、凝集法を使用した。繰り返しになるが、以下の線(1人の選手を表す)間の距離は、彼らのプレースタイルの類似性を示している。

 

 

図1:フルバックのクラスター分析

従来は、一定の高さで木の枝を切ることによって、デンドログラムにいくつのクラスターがあるかを決定する方法があった。なぜなら、木を切っても切らなくても、木が上に行くにつれてプレーヤーの類似性が失われるという原理は変わらないからである。色のついた枝は、図を見やすくするためにありますが、どのように行うか知りたい場合は、'Defining clusters from a hierarchical cluster tree:The Dynamic Tree Cut package for R'という良い論文がある。

各クラスターの例を以下に示す。議論したように、クラスタリングされた選手はサッカー的に理にかなっているが、クラスタリングアルゴリズムはサッカーの知識がないことを前提としているため、このような結果が分析の信頼性を高めている。

 

 

これはどのように使えるのか?

クラスター分析の最大の利点は、偏見やサッカーの予備知識なしに、プレースタイルが最も似ている選手を客観的に数値化してグループ分けできることだ。これは、移籍市場、特に財政的に厳しいクラブにとって大きな助けとなる。例えば、クラブは自分たちのプレースタイルに合いそうな選手のプロフィールの移籍候補リストを作成することができる。また、採用担当者は、理想的な選手(例:マルセロ)を特定し、このモデルを使用して、より手頃な価格でよく似た選手(例:クリスティアン・アンサルディ)を探すこともできる。これは、上のデンドログラムで簡単に見ることができます。選手を検索し、「ツリーを上に移動」して、その選手に最も似ている選手を探します。ツリーを上に進めば進めるほど、選手のプロフィールは似てこないが、クラブは予算と要求するプロフィールの間で妥協しなければならないかもしれない。

クラブ環境における選手のプロフィールをより現実的に視覚化する方法として、特定の属性に基づいて選手の長所と短所を評価するレーダーチャートの例を用意しました(図2参照)。これは、2人の移籍ターゲットを比較したり、獲得候補選手とすでにクラブにいる選手を比較したりするのに使えます。

下の例が示すように、ライアン・バートランドの特質は優れた守備にあり、可能な限り攻撃に参加するのが効果的だ。一方、ダニー・ローズは守備の強さでは劣るかもしれないが、ボールをより多く見ており、チームに多くのチャンスをもたらす可能性が高い。これは、クラブが移籍計画で下す決断の一例であり、クラスタリング・アルゴリズムに基づくこのツールを使うことは、その客観的な方法となり得るだろう。

 

図2:レーダーチャートのスケールは、各次元における選手のパーセンタイルランクを表す。分析に参加した全選手から抜粋

概要

世界中のリーグからより多くのデータにアクセスすることで、このモデルはクラブに移籍政策における競争力を与える上でさらに強力なものとなる。このモデルは、シーズン中とシーズン間の両方で、クラブに簡単に導入し更新することができる、迅速で費用対効果の高い方法を提供します。もちろん、(分析では常にそうであるように)このモデルは、現在存在する典型的なスカウティング手法に付随する有用なツールとして導入できるものであり、完全に取って代わるものではないことを強調しておく。このモデルが提供するのは、スカウトが報告するために、偏りなく客観的に移籍の可能性のあるターゲットを特定するための優れた基礎である。実際、この方法は従来のスカウトとアナリストの間で、ターゲットとなる選手の主観的なプロフィールが統計的なプロフィールと一致するかどうかを判断するための、良いキャリブレーションとして使うことができる。ヨーロッパ全体で選手の価格が高騰していることを考えると、このモデルを使えば、クラブは移籍市場で多くの資金を節約することができ、長年にわたって多くのチームを悩ませてきた「パニック買い」を避けるためのフィルタリング・メカニズムを提供することができるだろう。

 

今年のForumこの仕事を発表した際、非常に好意的なフィードバックを受けた。詳しくは、マークとムラデンのツイッター@MarkCarey93と @Mladen_Sormazまで