リクルートと選手評価でよくある問題は、キャリアの異なる段階にある選手や、キャリアの経路が異なる選手を比較することである。
明らかに極端な例だが、今シーズン開幕時のマーカス・ラッシュフォードとウェイン・ルーニーを考えてみよう。一方は18歳でリーグ戦11試合しか出場しておらず、もう一方は30歳でリーグ戦400試合以上に出場している。
このブログでは、比較的単純な統計であるコンバージョン率をテンプレートとして使い、どのように仮定を変えれば選手評価の理解をより深めることができるかを理解する。
私たちのアプローチは、選手の過去のパフォーマンスだけでなく、将来のパフォーマンスに関する予測を取り巻くさまざまなレベルの不確実性も考慮しなければならない。
しかし、コンバージョンレートは、常に平均以上のコンバージョンレートを示す特定の選手がいることを知ることで、良い出発点として機能する。
では、その中からどうやって選手を選ぶのか?
再出発:基本に立ち返る
私は、野球の打率を推定するためにデビッド・ロビンソンが使ったアプローチに従うことにした。最初から最後までその概略を説明するが、この微調整された考え方の背景にある基本的なプロセスは、この記事が進むにつれて明らかになっていくだろう。
まず、2005-06年から2015-16年までのプレミアリーグ、リーガ・エスパニョーラ、ブンデスリーガ、セリエA、リーグ・アンにおける全選手のコンバージョン率を調べた。単純な表は、この期間中の最高のコンバージョン率を明らかにしている。
ブンデスリーガでの出場時間が37分のマルセル・ツィーマーとGKティム・ハワードは、一見素晴らしいコンバージョン率を誇っているように見えるが、おそらくこの大会では最高のフィニッシャーとは言えないだろう。
この問題は明らかで、どの選手も十分なシュートを打っていないため、コンバージョン率が少ないサンプルによって歪んでいるのだ。では、表にシュートフィルターをかけて、30本以上シュートを打った選手だけを見たらどうなるだろうか?
しかし、全選手の中で最もコンバージョン率が高いのは、依然として右サイドバックのポール・フェルヘグであり、ストライカーのバス・ドストとダリオ・クビタニッチの名前が少し意味を持ち始めたとはいえ、まだ満足のいくものではない。
新たな診断...
一歩下がって、私たちは問題を診断し、より多くの情報に基づいたアプローチを使用し始めることができます。一般的に11本に1本の割合でシュートが決まるので、すべての選手がこの平均的な割合でコンバージョンしていると仮定して始めることができる。このサンプルで30本以上のシュートを放った選手の平均コンバージョン率は9.12%である。

コンバージョン率とキャリア・ショット
シュート数が多い選手ほどコンバージョン率が平均値(赤線)に近づくのに対し、シュート数が少ない選手ではばらつきが大きいことがわかる。この「平均への回帰」と呼ばれる統計学的現象は、たとえポール・フェルヘーグのように、少ないサンプルで非常に高いコンバージョン率を記録した選手であっても、時間の経過とともに平均に近づくことを示唆している。
しかし、これは事象や結果を単純化しすぎているように見える。この現象を調整するために、我々は経験ベイズ的アプローチと呼ばれるものを使用することができます。コンスタンチノス・チャパスは、OptaProForum 、同様の集計指標で年ごとの不確実性を見るために同様のアプローチを使用しました。
スタート位置の調整
私たちは事前の確信(この場合、すべての選手が9.12%のコンバージョン率でスタートする)からスタートし、新しいデータポイント(この場合、ショットとその結果)が出るたびに、私たちの推定がスタート地点からずれる。
したがって、ある選手がシュートを1本打って得点した場合、その選手の推定コンバージョン率は、先のケースで示したように、すぐに100%になるわけではありません。コンバージョン率が9.12%であったという以前の見解がどれだけ変化したかに基づいて、推定コンバージョン率はわずかに変化するだけである(この詳細については数学的付録にある)。
この方法で新しいリーダーボードを手に入れる。
注目の選手たちが、より合理的に見えてきた。マンチェスター・ユナイテッドとバイヤー・レバークーゼンで素晴らしい得点率を記録したハビエル・エルナンデスや、セビージャとACミランで同様の活躍を見せたカルロス・バッカがトップ5に入っている。右サイドバックのポール・フェルヘグは、51本のシュートを放ったに過ぎないにもかかわらず、トップ5に入っている。
これが、このグラフの2つ目の傾向である。これは古典的な統計的傾向というよりも、ゲームそのものを理解した上での傾向である。

コンバージョン率とキャリアシュート:上昇傾向
青い傾向線を見れば一目瞭然だが、キャリアで500本以上のシュートを放った選手だけを見ても、ほぼ全員がコンバージョン率のサンプル平均である9.12%を上回っている。
では、なぜこのような傾向が生まれるのか。基本的に、優れたシューターはより多くのシュートを打つ。これは優秀なシューターが出場時間を増やしている、優秀なシューターが自分自身を信頼してシュートを打つ機会を増やしている、優秀なシューターがシュートチャンスをより多く作ろうとしている、チームメイトが優秀なシューターにボールをより多く渡そうとしている、あるいは他のさまざまな要因によるものかもしれない。
信念を変える
推定という観点からは、すべての選手が1本もシュートを打つ前にコンバージョン率を9.12%と仮定するのは欠陥があるということになる。
プレーヤーがそのキャリアですでに決めたシュート数を認識することで、この問題に対処することができる(ベータ二項回帰として知られている)。この新しいアプローチでは,優れたシューターはより頻繁にシュートを打つと考える.
トップ5には、過去10年間で最も臨床的なフォワードたちが名を連ねている。
これはフィニッシュ能力を見る多くの方法の一つに過ぎない。これは他の統計や評価基準にも応用でき、選手のベンチマークや評価方法をよりよく知るために応用できる。
しかし、この特別な例は、かなり単純な集計データ(この場合は基本的にゴール数とシュート数のみ)を使って、意味のある洞察を得たり、多種多様な選手サンプルの中から主要な選手のスキルセットを特定したりする方法を示している。
最後にラッシュフォードとルーニーの例をもう一度見てみよう。この方法を用いると、ラッシュフォードの推定コンバージョン率は11.31%、ルーニーの予想コンバージョン率は13.24%となる(この時間帯の実際のコンバージョン率と同じ)。 つまり、最初のプレミアリーグシーズンで16本のシュートから5ゴールを決めたにもかかわらず、つまり31.25%のコンバージョン率であるにもかかわらず、この推定コンバージョン率は、彼がルーニーよりはるかに少ないシュートを打ったという事実を調整し、ラッシュフォードがすでにルーニーより優れたフィニッシャーであるという、おそらく不見識な結論を導き出すことを許さない。



