Ir al contenido principal

Modelización de la composición de entradas de críquet

Por: Stats Perform

Principales conclusiones

- El equipo científico de datos de OptaPro ha desarrollado métodos para describir cómo cambian la tasa de anotación y la probabilidad de tiro controlado para jugadores y equipos a lo largo de una entrada.

- De los bateadores abridores de la Copa Mundial, la pareja inglesa formada por Jonny Bairstow y Jason Roy aumenta rápidamente su ritmo de anotación tras un par de overs hasta un nivel sólo superado por Chris Gayle.

- En los últimos 10 overs, el inglés Jos Buttler acelera antes que nadie en la Copa del Mundo, con un aumento constante pero consistente del ritmo anotador a lo largo de los overs 41-50.

Es20 de febrero de 2019, el primer One Day International (ODI) entre las Indias Occidentales e Inglaterra en Bridgetown, Barbados. Inglaterra acaba de alcanzar un objetivo formidable de 361 puntos. Un vistazo a la tabla de puntuación muestra que Joe Root se ha paseado hasta un centenar de 96 bolas y Chris Gayle se ha disparado a sí mismo a un centenar de 100 bolas.

Sus puntuaciones finales son Joe Root 102 de 97 bolas. Chris Gayle 135 de 129 bolas.

Para un aficionado casual al críquet que observe el marcador, los verbos utilizados para describir las entradas de Root y Gayle pueden parecer un poco extraños. Para medir la velocidad de una entrada en el marcador, normalmente utilizamos la tasa de strike de la entrada (carreras por cada 100 bolas). En este caso, ambos tienen un porcentaje final de 105 golpes. Entonces, ¿por qué alguien que ha visto el partido se inclinaría por describir sus entradas de forma diferente? Veamos a continuación la progresión de las entradas hasta las 100 carreras para ver por qué.

 

 

Aquí podemos hacernos una mejor idea de cómo se desarrollaron sus entradas. Como era de esperar, Root fue el pegamento en la persecución de Inglaterra y progresó hasta los 100 puntos a un ritmo constante de carrera por balón. Sin embargo, Gayle tomó un camino diferente. Sus primeras 50 carreras llegaron en 76 pelotas y sus segundas 50 en sólo 24. Aunque éste es un ejemplo bastante extremo de Gayle, no es raro que empiece despacio antes de cambiar de marcha y acelerar a un ritmo que pocos jugadores pueden igualar. Sin embargo, al final de la jornada, las anotaciones de cada jugador en la tarjeta de puntuación son muy similares en lo que respecta a la tasa de ataque.

Comprender la progresión de las entradas

Para comprender mejor cómo juega un determinado bateador, debemos tener en cuenta las mediciones que evolucionan a lo largo de una entrada. El equipo de ciencia de datos de OptaPro ha desarrollado métodos para comparar y evaluar el rendimiento de los jugadores en función de cómo cambian sus métricas a lo largo de una entrada.

En el caso del críquet de 50 jugadores, se podría comparar el modo en que un jugador intenta construir su entrada en términos de porcentaje de carreras, pero también a través de medidas como la proporción de tiros controlados. Podemos utilizar esto para comparar el enfoque que adoptan tanto los jugadores como los equipos a la hora de construir una entrada. Además, podemos ampliarlo para observar no sólo cómo construyen sus entradas los jugadores, sino también evaluando a las estrellas en determinados periodos de un partido. Por ejemplo, ¿quiénes son los jugadores más peligrosos en los últimos 10 overs de una entrada y cómo suelen atacar esos últimos lanzamientos?

Cómo cuantificar la progresión de las entradas

En este blog nos centraremos en dos métricas, que utilizamos para modelar la evolución del rendimiento del bateo a lo largo de una entrada:

- Predicción de carreras por lanzamiento: Consideramos las carreras por lanzamiento en lugar de la tasa de strike. Esto se hace para distinguir entre la tasa de strike, que normalmente tiene en cuenta la tasa de anotación total de la entrada, y la predicción de carreras por lanzamiento, que es puramente una predicción de la tasa de anotación para un lanzamiento concreto en una entrada.

- Probabilidad prevista de golpe controlado: Esta métrica entre 0 y 1 es la probabilidad prevista de que un bateador controle un lanzamiento. Definimos los tiros controlados como aquellos en los que el resultado del tiro fue el deseado por el bateador, desde un tiro bombeado bien sincronizado hasta un golpe fuera del muñón.

Nuestro objetivo es proporcionar una aproximación para estas medidas a lo largo de diferentes periodos de una entrada.

Para predecir nuestras métricas, consideramos una ventana móvil en cada lanzamiento que tiene en cuenta todos los lanzamientos a los que se ha enfrentado el bateador en esta ventana en el críquet ODI. Por ejemplo, para lavigésima entrega deuna entrada, podríamos considerar una ventana de dos y, por tanto, considerar todas las entregas a las que se ha enfrentado el bateador en su carrera entre las entregas18 y22 de una entrada. A continuación, utilizamos estos datos en secciones específicas de una entrada para ajustar un modelo aditivo generalizado, lo que permite realizar predicciones suaves a través de una curva spline (al final del artículo encontrarás más información).

La pareja de apertura de Inglaterra

Por poner un ejemplo, consideremos a todos los abridores desde la Copa del Mundo de 2015 que hayan anotado al menos 400 carreras en los primeros 15 overs en ese periodo. Consideramos los primeros 15 overs para determinar lo bien que los bateadores abridores aprovechan el primer powerplay (overs 1-10), en el que solo se permiten dos jardineros fuera del círculo interior, antes de pasar al powerplay 2 (overs 11-15) en el que se permiten cuatro jugadores fuera del círculo.

A continuación mostramos nuestra predicción de carreras por lanzamiento de la pareja de abridores de Inglaterra en la Copa del Mundo, Jonny Bairstow y Jason Roy (amarillo), junto con el potente bateador de las Indias Occidentales Chris Gayle (azul). El resto de líneas (rojas) corresponden al resto de abridores de los ODI.

 

 

Este gráfico muestra cómo la pareja de abridores de Inglaterra tiene enfoques muy similares en los primeros 15 overs. Tienden a acelerar gradualmente a partir de un comienzo algo rápido, hasta estabilizarse en poco más de una carrera por bola una vez que el primer juego de poder ha terminado y el número máximo de jardineros en el límite se incrementa a cuatro. Chris Gayle adopta un enfoque ligeramente diferente. Sus dos overs iniciales son algo tranquilos en comparación con los de los abridores ingleses, pero luego su incremento de carreras por lanzamiento es significativo en comparación con el de todos los demás abridores. Aunque ninguno de los tres abridores tiene la salida inicial más rápida, en el octavo overs son regularmente los tres primeros en términos de carreras por envío.

Ahora veamos la medida de la probabilidad de tiro controlado sobre el mismo bateador y periodo de entradas. Aquí podemos ver que Jonny Bairstow tiene una tasa de tiros controlados sistemáticamente superior a la de Jason Roy. Este control combinado con altos porcentajes de strike muestra por qué Bairstow ha tenido un poco más de éxito en esta posición (promedio de bateo de 50,41 carreras por entrada) en comparación con Jason Roy (promedio de bateo de 40,54 por entrada). En comparación, Chris Gayle es más vulnerable durante los 10 primeros overs. Sin embargo, una vez transcurridos 15 overs, su porcentaje de control es superior a la media, lo que, combinado con su mayor porcentaje de carreras por bola, demuestra por qué puede ser tan destructivo si no se le desbanca pronto.

 

 

Jos Buttler

Uno de los jugadores más destructivos del Mundial de este año es Jos Buttler. No hace falta ser un experto para deducirlo tras echar un vistazo a sus cifras desde el Mundial de 2015. Batea a un ritmo de 175 golpes en los últimos 10 overs de una entrada; pocos jugadores en este Mundial se le pueden comparar.

Profundicemos en estas cifras. ¿Son estas cifras de los últimos 10 overs puramente fruto de una agresividad constante? ¿O Buttler es capaz de cambiar de marcha como nadie? Aquí mostramos nuestra tasa de carreras por lanzamiento prevista en los últimos 10 overs para los jugadores con al menos 400 carreras en este periodo de las entradas desde la Copa Mundial de 2015.

 

 

Nadie se acerca a la predicción de carreras por bola de Buttler en ningún momento de los últimos 10 overs. Lo interesante es que la curva de Buttler es bastante lineal. Su aceleración ya ha comenzado en el 41º overs y es increíblemente consistente, a diferencia de muchos de los otros jugadores que esperan hasta los 44/45º overs.

Conclusión

Los ejemplos de este blog ponen de relieve cómo pueden utilizarse los datos bola por bola para desarrollar modelos que permitan identificar varios arquetipos de bateadores, desde abridores agresivos que asumen riesgos, como Chris Gayle, hasta agresores constantes en las últimas entradas, como Jos Buttler. Analizando el rendimiento a una escala más fina podemos extraer información más detallada sobre el rendimiento de los jugadores. Por ejemplo, hemos demostrado que la agresividad sostenida de Jos Buttler, en lugar de su agresividad en las últimas entradas, contribuye a su inigualable tasa de ataque en los últimos 10 overs.

Estos métodos se pueden utilizar para comprender y visualizar el rendimiento de los bateadores en todas las modalidades del críquet y es sólo el principio de lo que se puede conseguir utilizando los datos de Opta para el análisis del rendimiento de los jugadores. Otras oportunidades incluyen el uso de nuestros datos detallados de eventos, como los tipos de tiro y las tendencias de los bolos, para complementar la información sobre el porcentaje de carreras y el tiro controlado.

En nuestro próximo blog llevaremos estos métodos más allá, mostrando cómo el análisis de agrupación de progresiones similares de porcentaje de carreras y porcentaje de control se puede utilizar para agrupar jugadores similares basados en sus composiciones de entradas para identificar tipos de jugadores. Esto permite utilizar nuestros métodos para identificar jugadores similares, lo que puede utilizarse para la composición de equipos y la búsqueda de jugadores.

*Más detalles del modelo:

Como se explica en el artículo, para construir los datos para los que ajustamos nuestro modelo, utilizamos un enfoque de ventana móvil.

Veamos los últimos 10 overs de los ODI como ejemplo. Para las cifras de este artículo, utilizamos una ventana de tamaño 2 a cada lado de la entrega de interés, donde nos interesan las entregas 241-300. Por lo tanto, para cada lanzamiento entre las bolas 241 y 300, tomamos el número medio de carreras anotadas en una ventana de 5 lanzamientos (máximo de 2 a cada lado + lanzamiento de interés) dentro de cada entrada. En muchos casos, habrá habido 0 entregas en una ventana, por lo que no habrá datos para esa entrega en esa entrada específica. Estos puntos de datos se recopilan en cada lanzamiento del segmento para cada entrada que haya jugado un bateador.

Una vez que tenemos estos puntos de datos, ajustamos un Modelo Aditivo Generalizado (GAM) a través del segmento de entradas. Esto toma una función suave de todos nuestros valores de carrera a través de las entregas, donde utilizamos una spline de base penalizada para controlar la suavidad de nuestra curva para evitar el sobreajuste. También podemos construir intervalos de confianza ya que sólo estamos promediando a través de 5 ventanas de entrega dentro de entradas, no a través de entradas. Para evitar un problema común que tienen las splines con predicciones erráticas en sus bordes, incluimos un búfer de 5 en la recopilación de datos (si es posible). Por ejemplo, para los overs 41-50 ajustamos el modelo a los overs 36-50 pero descartamos los overs 36-40 en el análisis de predicción. También ignoramos las predicciones en la ventana final (entregas 40,0-40,2 y 49,4-49,6 en este ejemplo) para reducir el impacto de los efectos de borde en los que no podemos incluir overs adicionales fuera del segmento de interés.