メインコンテンツへスキップ
プロクラブ&大学

プロForum 審査員より抽象的な5つのアイデア

 

ProForum 投稿締め切りまであと1ヶ月余りとなった今、コンペティションの審査員であるDevin Pleuler氏が、データサイエンティストやアナリストがオープン投稿部門で検討する可能性のある研究分野について、自身の考えを語ってくれました。

 

によるStats Perform

これを読んでいるということは、2022年プロ・Forum研究提案書の提出に興味がある可能性が高い。

どのような研究分野に焦点を当てたいかを考えるにあたり、アブストラクトを評価する際に審査員の目に留まりそうなことについて、いくつかの考えを共有することは有益かと思います。

ここに、私の頭の中をしばらくグルグル回っていた5つの中途半端なアイデアを紹介しよう。

1.合成イベントデータ

トレーニング用のイベントデータを使って、本物と見分けがつかない合成イベントデータを生成するリアルなゲームシミュレーターを構築することは可能だろうか?

もしそうであれば、縦断的シミュレーションの道が開ける。例えば、スタート条件を微調整し、複数のシーズンにわたって潜在的な影響を測定することができる。

2.PCFの選手パラメーター化

ピッチ・コントロール・サーフェスは、重要な戦術的背景を視覚的に解釈できる形でエレガントに捉えることができるため、完全なトラッキング・データを分析するための基礎的な手法のひとつとなっている。

しかし、ほとんどのPCFの実装は、すべてのプレーヤーが同じトップスピードと加速能力を持っていると仮定しています。個々の身体的特徴を考慮したパラメータ化されたピッチコントロール関数を構築し、検証する方法はあるのでしょうか?

3.体位推定

オンボールプレーヤーの向きを知ることは、パフォーマンス評価において重要な穴となる。前を向いたままチームメイトを見つけるプレーヤーは、ゴールに背を向けたままチームメイトにボールだけを渡すプレーヤーよりも、一般的に効果的である。

ボールを受けた選手がどの方向を向いているかを推定するモデルを構築し、検証することは可能か?イベントデータに基づいて、遠隔的に信頼できるヒューリスティックを構築することは可能でしょうか?

4.バリュー面の効率的な保存

これはサッカーのデータ工学的な側面が強い。25ヘルツのサンプリング・レートで90分間、22人のプレーヤーを分析すると、1試合あたりおよそ300万個のプレーヤーの座標が得られる。これを生のまま保存するのはかなり難しい。

平方メートルのビンで評価されるピッチコントロールのような値面を保存しようとすると、この値は1試合あたり約13億データポイントに爆発的に増加する。これは1000倍の増加だ。このデータを保存する効率的な方法はあるのだろうか?オートエンコーダを使って、より低い次元で表現ベクトルを見つけるとか?

5.ポゼッションがもたらす選手の健康

一般的に、試合中に選手にかかる身体的負荷が大きければ大きいほど、チームのローテーションや負傷によって出場時間を逃す可能性が高くなる。さらに、ポゼッションを取り戻そうとするとき、選手はより多くの距離をカバーすることが要求されるようだ。

これらの仮定は正しいのだろうか?また、ある種のポゼッション・ポジティブなプレースタイルによる選手の健康上のメリットを全体的に数値化することは可能なのだろうか?


これらのアイデアには技術的な詳細がないため、これをコピーして企画書に貼り付けても、あまりうまくいかないだろう。

しっかりとした実験デザインと方法論を持つことが、優れたForum アブストラクトを他から引き離すのだ。


トロントFCのアナリティクス・ディレクター。彼は、11月29日の締め切り前に提出されたプロForum 各提案を審査する5人の審査員の一人である。

各カテゴリーの詳細、審査基準、使用可能なデータサンプルなど、応募に関する詳細はこちらをご覧ください