メインコンテンツへスキップ

クリケット・イニング構成のモデリング

によるStats Perform

要点

- OptaProのデータサイエンスチームは、イニングを通して、選手やチームの得点率やコントロールショットの確率がどのように変化するかを説明する手法を開発しました。

- ワールドカップの開幕バッツマンのうち、イングランドのジョニー・ベアストウとジェイソン・ロイのペアは、2、3オーバーで急速に得点率を上げ、クリス・ゲイルだけが上回っている。

- 最後の10オーバーで、イングランドのジョス・バトラーはワールドカップの誰よりも早く加速し、41-50オーバーを通して着実に、しかし一貫して得点率を上げていく。

2019年2月20日、バルバドスのブリッジタウンで行われたウェストインディーズ対イングランドの1日国際試合(ODI)第1戦。イングランドは361というかつては手ごわかったターゲットに楽勝したところだ。スコアカードを見ると、ジョー・ルートが96球で100点、クリス・ゲイルが100球で100点。

最終スコアはジョー・ルート102球97オフ。クリス・ゲイル 135球(129球

スコアカードを見ているカジュアルなクリケットファンにとって、ルートとゲイルのイニングを表現するために使われた動詞は少し奇妙に見えるかもしれない。スコアカードでイニングのスピードを測るには、通常イニングストライクレイト(100球あたりの得点数)を使います。この場合、両者とも最終ストライク率は105。では、なぜ試合を観戦した人がイニングを違うように表現する傾向があるのだろうか?以下、100ランまでのイニング進行を見て、その理由を考えてみよう。

 

 

ここで、彼らのイニングがどのように展開したかを知ることができる。典型的なパターンで、ルートはイングランドのチェイスの接着剤となり、安定した1ボール1ランのペースで100まで進んだ。しかし、ゲイルは違う道を歩んだ。最初の50ランは76球、2度目の50ランはわずか24球。これはゲイルにとってかなり極端な例ではあるが、彼がギアを入れ替える前にゆっくりスタートして、他の選手にはほとんどできないスピードで加速することは珍しくない。しかし、その日のプレーが終わった時点で、スコアカードに記入された各選手のストライク・レートは驚くほど似ている。

イニング進行の理解を深める

特定のバッツマンのプレーをより深く理解するためには、イニングを通して変化する測定値を考慮する必要があります。OptaProのデータ・サイエンス・チームは、イニングを通してどのように測定値が変化するかに基づいて、選手のパフォーマンスを比較・評価する方法を開発しました。

50オーバークリケットの場合、これはランレートだけでなく、コントロールされたショットの割合などの指標を通して、選手が一般的にどのようにイニングを構築することを目指しているかを比較することができます。これを利用して、選手とチームの両方がイニングを構築する際に取るアプローチを比較することができる。さらに、これを発展させて、選手がどのようにイニングを構築するかだけでなく、試合中の特定の時間帯におけるスター選手を評価することによっても観察することができる。例えば、イニングの最後の10オーバーで最も危険な選手は誰なのか、彼らは通常どのように最後のデリバリーを攻撃するのか。

イニング進行を数値化する方法

このブログでは、イニングを通してのバッティングパフォーマンスの進化をモデル化するために使用する2つの指標に焦点を当てる:

- 1デリバリーあたりの予測ラン数: ストライク・レートではなく、送球あたりの得点を考慮する。これは、一般的にイニング全体の得点率を考慮するストライク・レートと、純粋にイニング中の特定のデリバリーの得点率を予測するデリバリーあたりの予測ランを区別するためである。

- 予測コントロールショット確率:0 から 1 の間のこの指標は、バッツマンがデリバリーをコントロールする確率の予測値である。我々は,コントロールされたショットとは,タイミングよくロフトを打ったショットから,オフ・スタンプの外側をよく判断して打ったリーブまで,ショットの結果がバッツマンにとって望ましいものであったショットと定義している.

我々の目的は、イニングの異なる期間にわたってこれらの尺度の近似値を提供することである。

我々の指標を予測するために、ODIクリケットでバッツマンがこのウィンドウの中で直面したすべてのデリバリーを考慮し、各デリバリーにわたって移動ウィンドウを考慮します。例えば、イニングの20回目のデリバリーでは、2つのウィンドウを考慮し、イニングの18回目から 22回目の間にバッツマンが直面したすべてのデリバリーを調べます。そして、イニングの特定のセクションにまたがるこのデータを使って一般化加法モデルを当てはめ、スプライン曲線によってスムーズな予測を可能にします(詳細は記事の最後にあります)。

イングランド開幕ペア

一例を挙げると、2015年ワールドカップ以降、その期間に最初の15オーバーで400ラン以上を記録したすべての開幕打者を考えてみよう。最初の15オーバーを検討することで、オープニングバッツマンが、内円の外側に2人の野手しか入れない最初のパワープレー(1~10オーバー)と、内円の外側に4人が入れるパワープレー2(11~15オーバー)に移行する前のパワープレーをどの程度活用しているかを判断する。

以下は、イングランド代表のワールドカップ開幕ペア、ジョニー・ベアストゥとジェイソン・ロイ(黄色)、そしてウェストインディーズのパワーヒッター、クリス・ゲイル(青色)の1デリバリーあたりのラン数予想である。その他のライン(赤)は残りのODIオープナーである。

 

 

この図は、イングランドの開幕ペアが最初の15オーバーでいかによく似たアプローチをしているかを示している。最初のパワープレーが終わり、バウンダリーにいるフィールドプレーヤーの数が最大4人になると、1ボール1ラン強で横ばいになる。クリス・ゲイルは少し違ったアプローチを取る。彼の最初の2オーバーはイングランドのオープナーに比べてやや控えめだが、その後、1デリバリーあたりのラン数が他のオープナーに比べて大きく伸びている。3人のオープナーはいずれも最初の逃げ足は速くないが、8オーバー目には1デリバリーあたりのラン数でトップ3の常連となっている。

次に、同じバッツマン、同じイニングの期間におけるコントロールショット確率を見てみよう。ここでは、ジョニー・ベアストウのコントロールショット確率がジェイソン・ロイに比べて一貫して高いことがわかる。このコントロールと高いストライク率が相まって、ベアストウがジェイソン・ロイ(1イニング平均40.54打点)に比べ、このポジションでやや成功している(1イニング平均50.41打点)理由がわかる。それに比べ、クリス・ゲイルは最初の10オーバーの間はより弱い。しかし、イニングが始まって15オーバーを過ぎると、彼のコントロール率は平均を上回り、1球あたりの最高得点率と相まって、早い段階で外さなければ、なぜ彼があれほど破壊的なプレーができるのかがわかる。

 

 

ジョス・バトラー

今年のワールドカップで最も破壊力のある選手の一人がジョス・バトラーだ。2015年ワールドカップ以降の彼の数字を一目見れば、専門家でなくともそう思うだろう。彼はイニングの最後の10オーバーで約175のストライクレートを叩き出す。

この数字をさらに掘り下げてみよう。最後の10オーバーの数字は、純粋に一貫した攻撃力によるものなのか?それとも、バトラーは他の誰よりもギアを切り替えることができるのだろうか?ここでは、2015年ワールドカップ以降、イニングのこの期間に少なくとも400ランを記録した選手について、最後の10オーバーにおける1デリバリーあたりのラン数を予測している。

 

 

最後の10オーバーのどの時点でも、バトラーのボール1個あたりの失点予測に迫る者はいない。ここで興味深いのは、バトラーのカーブがかなり直線的であることだ。彼の加速は41オーバー目ですでに始まっており、44、45オーバー目まで待つ他の多くの選手とは異なり、信じられないほど安定している。

結論

このブログの例では、クリス・ゲイルのようなアグレッシブでリスクを冒さないオープナーから、ジョス・バトラーのような一貫したレイトイニングのアグレッサーまで、様々なタイプのバッツマンを特定するモデルを開発するために、ボールごとのデータをどのように活用できるかを紹介している。より細かいスケールでパフォーマンスを分析することで、選手のパフォーマンスに関するより詳細な情報を抽出することができる。例えば、ジョス・バトラーがレイトイニングのチャージよりもむしろ持続的なアグレッシブさが、彼の最終10オーバーのストライク率にいかに貢献しているかを示しました。

これらの方法は、クリケットのあらゆる形式におけるバッツマンのパフォーマンスを理解し、視覚化するために使用することができ、選手のパフォーマンス分析にOpta データを使用できることのほんの始まりに過ぎません。さらなる可能性としては、ランレートやコントロールショット情報を補足するために、ショットの種類やボウリングの傾向などの詳細なイベントデータを使用することが挙げられます。

次回のブログでは、これらの方法をさらに発展させ、似たような出塁率とコントロール率の推移をクラスタリング分析することで、イニング構成に基づいて似たような選手をグループ分けし、選手のタイプを特定する方法を紹介します。これにより、我々の手法は類似した選手を特定するために使用することができ、チーム編成や選手のスカウティングに使用することができる。

*さらなるモデルの詳細

記事で説明したように、モデルを当てはめるデータを構築するために、移動窓法を利用した。

例としてODIの最後の10オーバーを見てみよう。本記事では、241~300球を対象として、対象となるデリバリーの左右に2つの大きさのウィンドウを使用した。したがって、241球目から300球目までの各デリバリーについて、各イニング内の5つのデリバリーウィンドウ(最大で左右2つずつ+対象デリバリー)の平均得点数を取る。多くの場合、1つのウインドウで対戦したデリバリーは0回であり、したがってそのイニングではそのデリバリーのデータはない。これらのデータポイントは、バッツマンがプレーした各イニングのセグメント内の各デリバリーにわたって収集されます。

これらのデータポイントを得たら、イニングセグメントにわたって一般化加法モデル(GAM)を当てはめる。ここでは、オーバーフィッティングを防ぐために、曲線の滑らかさを制御するために、ペナルティ付き基底スプラインを使用します。また、イニング全体ではなく、イニング内の5つのデリバリーウィンドウを平均しているだけなので、信頼区間を構築することもできます。スプラインにありがちな、エッジでの不安定な予測を防ぐために、(可能であれば)データ収集のために5オーバーのバッファを含める。例えば,41-50 オーバーでは,36-50 オーバーにモデルを適合させるが,予測分析では 36-40 オーバーは捨てる.また、最終ウィンドウ(この例では40.0-40.2と49.4-49.6)の予測も無視し、対象セグメント外の余分なオーバーを含めることができないエッジ効果の影響を低減する。