Ir al contenido principal
Aficionados animando en el estadio Luzhniki durante el partido entre Rusia y Arabia Saudí durante el mundial 2018
Federaciones y titulares de derechos, clubes profesionales y universidades

El futuro de la cobertura deportiva: Parte 2

Patrick Lucey, científico jefe de Stats Perform, habla de ChatGPT, aprendizaje profundo y tecnologías AI en el deporte.

Por: Patrick Lucey

La primera parte puede consultarse aquí.

¿Qué pueden hacer en el deporte los modelos lingüísticos y los transformadores de ChatGPT?

Más allá de los chatbots, ¿hay lugar para los modelos lingüísticos y la Inteligencia Artificial Generativa en el deporte?

La respuesta es un sí rotundo y, en nuestra opinión, es la próxima revolución de la analítica deportiva, para proporcionar una comprensión más profunda que nunca del juego a equipos y aficionados, especialmente en el fútbol.

Para empezar, tenemos que especificar el idioma del deporte. Para el texto, que es la entrada requerida para ChatGPT el idioma ya existe. Como hemos visto, el modelo de lenguaje ChatGPT utiliza datos de texto sin procesar, que tienen su propia estructura inherente (piense en letras, palabras, frases, párrafos). La arquitectura del transformador aprende las estadísticas y correlaciones prediciendo las palabras que faltan utilizando el contexto dentro de la frase, el párrafo y la narración general de la historia.

Los datos deportivos tienen una estructura lingüística inherente diferente. En el fútbol, por ejemplo, son 11 contra 11 (o 10 jugadores de campo contra 10 jugadores de campo la mayoría de las veces). Cada uno de estos jugadores tiene un papel, que puede evolucionar o cambiar durante un partido.

La representación de la información de los jugadores durante el partido dentro de un equipo es extremadamente importante. Podríamos decir que cada jugador es una letra (en lugar de utilizar el nombre o el número de camiseta, utilizamos su ubicación y estadísticas durante el partido, así como sus estadísticas de juego recientes y a largo plazo), y cada acontecimiento en el campo podría describirse como una palabra, y estas letras tienen que estar correctamente ordenadas para que podamos entender esa palabra.

Cada jugada podría ser una frase, y cada posesión podría verse como un párrafo. El capítulo podría ser el partido, y la temporada podría verse como un libro. Además de crear la estructura (o gramática) adecuada, la entrada de datos deportivos es a la vez espaciotemporal (es decir, las posiciones de los jugadores) y basada en eventos (es decir, el tipo de evento y el resultado de las posesiones), lo que requiere un preprocesamiento significativo. Los datos deportivos son más parecidos a una película que a un libro: la entrada es multimodal y no una única fuente.

Una vez definido el lenguaje de entrada del fútbol, podemos empezar a aprender un "modelo del lenguaje del fútbol" que nos permita generar resultados que antes no podíamos. Ahora, dados los problemas inherentes que tienen los chatbots AI para "alucinar" los hechos, en lugar de intentar generar resultados para cualquier pregunta que se les haga, podemos utilizar la "ingeniería de respuesta inteligente" para responder a preguntas a las que antes no se podía responder. Para más información sobre la ingeniería inteligente de instrucciones, consulta el primer artículo de esta serie.

A continuación damos una serie de ejemplos prácticos.

Opta Vision

Opta Vision es una fuente de datos AI que utiliza tanto datos de vision por ordenador como nuestros datos de eventos humanos. Estos datos se procesan a través de nuestra red neuronal gráfica para proporcionar predicciones sobre cada evento que describen la capacidad de toma de decisiones y ejecución tanto del equipo como de cada jugador.

Por ejemplo, con nuestra representación de la formación subyacente (o lenguaje), podemos detectar qué formación está jugando un equipo (por ejemplo, 4-4-2, 3-4-3, 4-3-3, etc.) y cómo cambia con y sin posesión.

También podemos asignar el papel de un jugador en cada fotograma, lo que nos permite ver cuándo se solapan los jugadores o si hay un cambio táctico durante el partido.

Utilizando la misma representación subyacente, también podemos predecir la probabilidad de que un jugador realice un pase, la probabilidad de que el pase cree una ocasión de gol en los 10 segundos siguientes o evaluar si era la opción correcta.

Con nuestro modelo de lenguaje futbolístico, predecimos todas las opciones posibles al mismo tiempo; en otras palabras, predecimos la frase, en lugar de predecir cada letra por separado. Para ello, utilizamos las ubicaciones, dinámicas y eventos de todos los jugadores como secuencia de entrada y, a continuación, la asignamos a la secuencia de salida que corresponde a la dificultad del pase, la disponibilidad, etc.

Anteriormente, analizábamos cada opción de jugador de forma independiente, pero gracias a nuestro enfoque de modelización del lenguaje del fútbol de gran tamaño, ahora podemos analizar a todos los jugadores a la vez. Esto es obviamente valioso para comprender la capacidad de decisión de cada jugador en cada evento, pero podemos utilizar un enfoque similar para predecir las estadísticas de cada jugador al final del partido.

Predicción del rendimiento de los jugadores basada en transformadores 

Imagine que es usted entrenador de fútbol y quiere saber qué jugador tendrá mayor impacto en el cambio del resultado durante el partido. Las predicciones anteriores sobre el rendimiento de un jugador se hacían independientemente de otros jugadores y de los rivales. Utilizando nuestro enfoque transformador con nuestra enorme base de datos de fútbol, hemos creado un modelo que puede predecir todos los rendimientos de los jugadores y del equipo al mismo tiempo.

Utilizando de nuevo la analogía de la traducción automática, la idea es mapear una secuencia de entrada de información sobre jugadores y equipos al comienzo del partido (o durante el partido) como secuencia de entrada. A continuación, utilizamos nuestra red transformadora para asignarla a la secuencia de salida más probable, que en este caso son las estadísticas finales del partido. La ventaja de la red transformadora es que puede generalizar rápidamente a situaciones desconocidas. En el fútbol, esto es habitual, ya que los equipos de la temporada regular juegan en casa y fuera, y las alineaciones suelen ser diferentes (al igual que los entrenadores), así como el estado de forma reciente.

Se trata de una nueva innovación, y en 2023 mostraremos la potencia de esta tecnología. Para entrenar este modelo, hemos utilizado nuestra base de datos de Opta , con una profundidad única y un tamaño de más de 1,5 TB (sin incluir nuestro importante archivo de datos de seguimiento).

Ghosting

También podemos utilizar técnicas similares para mejorar nuestra capacidad de hacer ghosting (es decir, simular dónde deberían haber estado los jugadores en una jugada, que fue un trabajo del que fuimos coautores anteriormente en fútbol y baloncesto).

Los enfoques anteriores aprendían una red de políticas supervisadas para predecir los comportamientos de los equipos de forma determinista, pero con los avances en la modelización del lenguaje, se podrían generar resultados más creativos (algunos que quizá no se hayan visto antes). No obstante, cabe señalar que, en ocasiones, los entrenadores/analistas preferirán tener la predicción determinista (es decir, lo que ocurrió) frente a las distintas formas en que se podría haber ejecutado la jugada.

Recogida de datos

Otra ventaja de la modelización del lenguaje es que puede utilizarse como ayuda en el proceso de recopilación de datos deportivos (de forma similar al asistente de codificación mencionado anteriormente), en nuestros sistemas de seguimiento de jugadores y balones vision, o para señalar un dato potencialmente erróneo para que lo evalúen nuestros equipos humanos de operaciones o integridad.

Conclusión

ChatGPT es una herramienta fantásticamente ambiciosa e increíblemente bien ejecutada. Aunque puede que no tenga tantas aplicaciones directas en el deporte o en la información periodística como en otros campos, los enfoques subyacentes de AI erativa ya se están utilizando en Stats Perform, utilizando nuestro propio lenguaje del deporte como entrada. Ya están impulsando muchas aplicaciones en el ámbito del rendimiento de los equipos y seguramente aumentarán muchos aspectos del contenido y el análisis deportivo en el futuro.

El Dr. Patrick Lucey es el científico jefe del gigante de datos deportivos Stats Perform, y dirige el equipo de AI con el objetivo de maximizar el valor de los profundos tesoros de datos deportivos de la empresa. Patrick ha estudiado y trabajado en el campo AI durante los últimos 20 años, ocupando puestos de investigación en Disney Research y en el Instituto de Robótica de la Universidad Carnegie Mellon, además de pasar un tiempo en el Centro de Investigación T.J. Watson de IBM mientras realizaba su doctorado. Patrick procede de Australia, donde se licenció en Ingeniería Electrónica por la Universidad del Sur de Queensland y se doctoró por la Universidad Tecnológica de Queensland. Es autor de más de 100 artículos revisados por pares y ha sido coautor de artículos en el MIT Sloan Best Research Paper Track, ganando el mejor artículo en 2016 y el subcampeonato en 2017 y 2018.