Desde el innovador artículo de Sam Green en 2012 en el que presentaba los goles esperados, la métrica se ha convertido en una de las más extendidas y perspicaces dentro de la analítica futbolística.
Este blog sirve de breve recapitulación y visión de conjunto, con el fin de explicar la métrica en su contexto y ofrecer algunos ejemplos más recientes.
Los goles esperados (xG) miden cuantitativamente la calidad del azar, un concepto muy utilizado en este deporte.
Viendo un partido podemos distinguir intuitivamente las buenas ocasiones de las malas basándonos en una serie de factores. ¿Cómo de cerca estaba el tirador de la portería? ¿Tenía un buen ángulo hacia la portería? ¿Fue un uno contra uno? ¿Fue un remate de cabeza?
xG tiene en cuenta estos y otros factores y calcula la probabilidad de que se marque un tiro concreto. Por ejemplo, si un tiro con un conjunto específico de características tiene probabilidades de ser marcado una de cada 10 veces, valdrá 0,10 xG. Estos cálculos se basan en una gran cantidad de datos históricos de tiros (más de 300.000 tiros de la base de datos Opta en el momento de escribir este artículo) y se ajustan a las diferentes ligas.
*Véase el apéndice para una explicación más detallada del cálculo.
La métrica refleja la forma en que analizamos los partidos; el equipo que crea las ocasiones de mayor calidad suele ser el que consideramos que ha sido "el mejor equipo". Un modelo xG da una medida cuantitativa de la calidad de las oportunidades de gol y añade un contexto adicional a los disparos de un jugador o equipo que va más allá de los totales de disparos brutos y disparos a puerta.
Los goles esperados suelen ser una medida más coherente del rendimiento que los goles reales. Mientras que los goles son acontecimientos relativamente raros que van y vienen por rachas, la producción de xG de un equipo o jugador tiende a fluctuar mucho menos de un partido a otro. Está claro que los goles que se marcan realmente son los que hacen ganar puntos, pero los xG nos dan más contexto para evaluar el rendimiento del equipo.
Comprender el rendimiento subyacente de un equipo
Pensemos en el Arsenal al comienzo de la temporada 2015-16 de la Premier League. En sus seis primeros partidos solo marcó cinco goles, con una media de 0,83 goles por partido. Se trata de una cifra preocupantemente baja para un equipo que esperaba luchar por el título. Sin embargo, durante este periodo el Arsenal tuvo más de 12 goles esperados para una media de 2,11 goles esperados por partido.
Al final de la temporada, el Arsenal promediaba 1,71 goles por partido, lo que se asemeja mucho a su producción de goles esperados del principio de la temporada, en comparación con su decepcionante total de goles de ese periodo.
Si sólo analizáramos los goles que marcó el Arsenal en sus primeros partidos de la temporada, nunca habríamos esperado que terminara la temporada con tantos goles. Sin embargo, si nos fijamos en su xG podemos obtener una visión mucho más clara de cómo estaba jugando realmente el Arsenal.
Comprender el rendimiento subyacente de un jugador
Comparando los goles que marca un jugador con las ocasiones de las que dispone a través de la xG, podemos entender mejor qué está impulsando el rendimiento de ese jugador. Si las cifras de xG son significativamente inferiores a la producción de goles del jugador, puede ser un signo de una racha insostenible o, al menos, merece un estudio más profundo para entender por qué se está produciendo este rendimiento excesivo, comparado al menos con la media.
Analizando la media de xG por tiro de un jugador podemos saber si realiza tiros de gran calidad o muchos tiros desde zonas en las que es poco probable que marque.
Un círculo más grande indica un valor xG más alto en el disparo
Goles esperados es una herramienta eficaz para evaluar la calidad de las ocasiones y predecir el rendimiento futuro tanto a nivel de jugador como de equipo. El concepto de calidad de las ocasiones no es nada nuevo, pero Expected Goals asigna un valor cuantitativo a cada disparo para generar un análisis más profundo y significativo.
Anexo
El modelo xG de Optase calcula mediante una regresión logística en la que la variable dependiente es si el disparo fue o no gol y las entradas de la regresión son las siguientes:
- Desarrollo de la jugada (juego abierto, tiro libre directo, jugada a balón parado, saque de esquina, asistencia, saque de banda)
- Tipo de asistencia (balón largo, centro, pase en profundidad, pase a la zona de peligro, saque de banda)
- Después del saque
- Rebote
- Cabezazo
- Distancia a la portería
- Ángulo visible de la portería
- 1 v 1
- Gran ocasión
- Ajustes de competición para un subconjunto de competiciones


