Ir al contenido principal
Organismos de radiodifusión y televisión conectada, federaciones y titulares de derechos, clubes profesionales y universidades

Aplicaciones de la IA Generativa en el Deporte: Actualización del primer trimestre

Por: Patrick Lucey

Bienvenido a la nueva edición de la serie Últimas tendencias en IA en el deporte de Stats PerformPerform, en la que nuestro científico jefe, Patrick Lucey, analiza los últimos avances en IA generativa y sus aplicaciones en la industria del deporte.

Para los aficionados a la inteligencia artificial y los deportes, la Super Bowl de febrero fue un regalo tanto dentro como fuera del campo.

En el campo y en nuestras pantallas, vimos a los jugadores utilizar jugadas ideadas con la ayuda del aprendizaje automático por los analistas de sus equipos, y oímos a los locutores darnos ideas impulsadas por la IA para ayudarnos a entender el contexto y el significado.

Fuera del campo, la Super Bowl presentó anuncios centrados en la IA como una característica de los productos de consumo general, como el anuncio Copilot de Microsoft, y Google utilizando la IA para mostrar su poder en su teléfono Pixel.

En el breve periodo anterior y posterior a la Super Bowl, hemos asistido a lanzamientos de titulares como Gemini de Google, el lanzamiento completo de Vision Pro de Apple y, por último, el reciente lanzamiento de OpenAI de su herramienta multimodal texto2vídeo "Sora", así como rumores sobre el lanzamiento de agentes de IA y una mayor utilización de la Generación de Recuperación-Aumentada (RAG).

En este artículo procesaremos algunos de estos avances en el mundo de la IA Generativa y explicaremos los RAG y los LLM multimodales. Esbozaremos cómo se relacionan con nosotros en el deporte (tanto para los aficionados como para las aplicaciones de los equipos profesionales) y analizaremos cómo, a pesar de los nuevos cambios, una cosa sigue siendo la misma: el valor de los datos subyacentes que alimentan los modelos de GenAI.

En resumen: más de 12 meses después de ChatGPT

Lo que estamos viendo un año después del lanzamiento de ChatGPT es que la tecnología de IA Generativa no está sustituyendo a los humanos en su trabajo, como se temía en algunos círculos, sino que permite a los humanos hacer más.

ChatGPT y las posteriores tecnologías basadas en LLM que le han seguido nos han proporcionado una serie de herramientas "AI-asistivas" que pueden ayudarnos a realizar algunas de nuestras tareas un poco mejor y más rápido.

Por ejemplo, la atención al cliente, la traducción de idiomas, la búsqueda e interrogación de documentación (ya sea pública o privada) empiezan a hacerse de forma mucho más eficiente y a mayor escala que antes. También permite crear nuevos contenidos, ya sean textuales, sonoros o en imágenes y vídeo (o una combinación de ambos).

En última instancia, el progreso en estas áreas (y lo que ha impulsado a Copilot, Gemini y Sora) se debe a que GenAI maximiza nuestra capacidad de extraer valor de los datos. Los datos subyacentes siguen siendo el elemento más importante del ecosistema GenAI.

La tercera ola de la IA generativa: datos diferenciados

El presidente y consejero delegado deVista Equity Partners, Robert Smith, hizo recientemente un excelente resumen de lo que él considera "Las 3 Olas de la IA Generativa".

En la primera oleada, describió que el valor perdurable iría a parar a los proveedores de hardware (por ejemplo, NVIDIA).

En la segunda oleada, dijo que el valor perdurable iría a parar a los superescaladores (por ejemplo, los proveedores de nubes).

Y en la tercera ola, dijo que el valor duradero beneficiaría a quienes puedan utilizar esa capacidad en los mercados específicos en los que venden sus productos. En otras palabras, si se tiene una diferenciación clave en un dominio concreto (como datos excepcionalmente profundos y amplios en el deporte), la IA generativa puede "superimpulsar" los productos y servicios en ese campo.

En la actualidad estamos asistiendo al desarrollo de las dos primeras oleadas.

La primera está beneficiando a los fabricantes de chips, ya que la sed de chips que puedan utilizarse para GenAI parece insaciable. Esto ha desembocado en la segunda ola, en la que los proveedores de la nube disponen del almacenamiento y la computación necesarios para ampliar las soluciones GenAI e integrarlas en sus soluciones generales, algo que también está ocurriendo ahora.

Pero el valor duradero a largo plazo residirá en la tercera ola, en la que mercados específicos necesitan soluciones adaptadas a sus casos de uso concretos.

¿Por qué los datos siguen siendo tan importantes para las aplicaciones de la IA Generativa en el deporte?

Conviene recordar que, para obtener los resultados más precisos, los sistemas de IA Generativa necesitan entradas de datos lo más exactas, fiables y uniformes posible. Sin entradas de calidad, pueden propagarse salidas erróneas o desinformación, o las aplicaciones de la IA se ven muy limitadas, sobre todo cuando se trata de utilizarla en campos específicos.

Así que, aunque pueda parecer que las cosas evolucionan y cambian, en el fondo todo sigue igual, ya que toda la información y los conocimientos se basan en datos fiables y precisos.

En campos específicos como el deporte o la medicina, con casos de uso concretos como el análisis de jugadores y la predicción de su rendimiento, o el diagnóstico de síntomas y la evaluación de tratamientos, no se pueden equivocar los datos. Si lo haces, los análisis, predicciones y diagnósticos posteriores también serán erróneos.

Además, cuanto más detallados y coherentes sean los datos, más específicos, pertinentes y útiles serán los resultados y las respuestas.

Por ejemplo, en el fútbol, donde Stats Perform dispone de datos detallados de Opta para más de 13.500 equipos profesionales masculinos y femeninos, nos aseguramos de que se generen los mismos datos y mediciones en todos los partidos (no sólo en unas pocas ligas seleccionadas).

Así, un pase y un disparo tienen la misma definición y colección uniforme en todas las ligas de fútbol. Cada evento utiliza los mismos protocolos para metadatos como nombres, marcas de tiempo y coordenadas de ubicación.

La clasificación y estructura uniformes de los datos -recogidos en tiempo real- permiten entrenar modelos de IA Generativa a partir de cantidades ingentes de datos, tanto históricos como estadísticos de las jugadas.

Esto mejora su eficacia, así como las capacidades de búsqueda y facilita la identificación de correlaciones y patrones en el conjunto de datos.

Si no se recogen y distribuyen uniformemente, las estadísticas y los resultados derivados carecen de sentido tanto para los humanos como para los modelos GenAI.

La IA generativa nos ayuda a descubrir información valiosa que antes quedaba oculta o pasaba desapercibida al ojo humano. Ayuda a maximizar el valor de los datos subyacentes. Si esos datos son detallados, uniformes y objetivos, su valor puede aumentar aún más.

Cuanto más profundo sea el conjunto de datos de origen, más perspicaces serán los patrones y más precisas las predicciones producidas por GenAI, y mayor será su utilidad para aplicaciones y campos específicos, como los deportes.

La calidad, profundidad, amplitud y coherencia de los datos son los ingredientes clave para que los sistemas de IA (y en concreto los sistemas GenAI) prosperen.

Por otra parte, el aumento de la cobertura mediática de los deepfakes que podrían influir en las elecciones me ha llevado a considerar también el valor de los datos deportivos independientes y fiables para combatir o contrarrestar los posibles usos nefastos de los vídeos deepfake que podrían amenazar la integridad del deporte.

Algunos de ustedes recordarán una falsa "historia alternativa" del famoso tiro de Michael Jordan sobre Craig Ehlo, que se publicó en las redes sociales hace un par de años.s hace un par de años. En ella se ve a Jordan fallando el tiro ganador del partido que en realidad hizo, engañando a muchos observadores. A medida que los LLM text2video se hacen más eficaces, aumenta la probabilidad de que los deepfakes se infiltren en el deporte.

Es otra de las razones por las que nos tomamos increíblemente en serio el papel de Stats Performcomo guardianes de confianza de los registros deportivos, y estamos agradecidos a nuestro increíble equipo de Operaciones de Datos que se centra día y noche en la integridad de nuestros datos, porque las fuentes fiables, independientes y verificables como los datos de Opta probablemente serán aún más críticas en un futuro de deepfake.

¿Qué es el GAR?

Retrieval-Augmented Generation (alias RAG) es otro desarrollo relativamente nuevo en el campo de la IA Generativa que permite a "expertos no técnicos" ser capaces de recuperar e interrogar bases de conocimiento, sin tener que recurrir a un ingeniero o a un experto en bases de datos para obtener esos datos, lo que de otro modo supondría un gran obstáculo.

Si dispone de una base de datos sólida y precisa, RAG puede envolver esa información con la tecnología actual basada en LLM.

Esta tecnología GenAI puede permitir a las personas hacer más cosas, así como iteraciones más rápidas y obtener conocimientos con mayor celeridad. En cierto modo, es el asistente definitivo, como tener a un experto permanentemente sobre el hombro dándote las respuestas (isi el sistema tiene acceso a los datos más precisos y actualizados).

Siempre que se disponga de una amplia base de conocimientos, el uso de GenAI puede permitir recuperar e interrogar información deportiva, y RAG puede facilitar esta tarea a los sistemas que necesiten acceder a conocimientos específicos de un dominio.

No obstante, también en este caso es necesario extremar la precaución, ya que pueden propagarse alucinaciones e información obsoleta, lo que significa que la calidad y la confianza en la fuente de datos subyacente son imperativas.

Pero si se utiliza correctamente, con guardarraíles y supervisión, el GAR podría ser de enorme valor para personalizar contenidos y tratamientos en el mundo del deporte.

En un próximo artículo profundizaremos en este tema.

Avances mediante vídeo, imágenes y LLM multimodales

El lenguaje del deporte son los datos recogidos tanto en el balón como fuera de él. A esto lo llamamos multimodal, ya que captura dos modos de información que son complementarios, como imágenes o vídeo con una leyenda de texto para describir lo que está ocurriendo (que es como GPT-4, Gemini y Sora pueden hacer la generación de texto2imagen y texto2vídeo).

Una forma de utilizar eficazmente el vídeo en los LLM para deportes es capturar y combinar los datos del jugador y del balón tanto fuera como dentro del campo, ya que esto permite medir una reconstrucción completa del rendimiento completo, así como crear aplicaciones interactivas.

En un avance reciente, hemos podido utilizar nuestra vasta base de datos Opta y un LLM multimodal para estimar las ubicaciones de los jugadores que faltan y que no pueden verse en el vídeo (ni parcial ni totalmente), lo que permite analizar cada pase y cada decisión en el contexto completo de dónde están situados los demás jugadores y qué están haciendo.

Acabamos de mostrar esta aplicación avanzada de la IA Generativa en el deporte en la 2024 MIT Sloan Sports Analytics Conference. Pero esto no es más que el principio: a partir de este modelo básico hay muchas otras aplicaciones. Esperen muchas más actualizaciones nuestras en este espacio.

¿Qué otra relación pueden tener los recientes avances de la IA Generativa con el análisis del deporte profesional?

Los LLM específicos de cada deporte también pueden utilizarse para crear predicciones que antes no podían modelarse con precisión, lo que proporciona a los analistas y entrenadores de los equipos un asistente muy potente.

Por ejemplo, modelizar las estadísticas individuales de un jugador de fútbol es notoriamente difícil, porque depende de con qué compañeros de equipo esté jugando, así como de los rivales, además del estado del partido para las predicciones en directo (por ejemplo, si el equipo va ganando/perdiendo, si un jugador está expulsado, etc.).

Sin embargo, los mismos métodos de IA generativa utilizados para entrenar los modelos de ChatGPT y Gemini (es decir, las redes neuronales transformadoras) pueden utilizarse para generar predicciones para cada jugador (y el equipo) a partir del mismo modelo, lo que supone un cambio de paradigma en la forma de realizar predicciones deportivas.

El poder de este enfoque no es sólo proporcionar predicciones más precisas, sino permitir nuevas aplicaciones como un "entrenador asistente virtual", en el que un usuario podría preguntar "si quito al jugador X y pongo al jugador Y, ¿cómo podría cambiar eso el resultado del partido, o provocar más o menos tiros?". O, otra pregunta podría ser "¿dónde debería haber estado el defensa en esa situación para parar el tiro?", o "¿dónde va a golpear el jugador el balón a continuación?".

Esta podría ser una nueva forma de interactuar con los deportes que antes solo se limitaba a un videojuego, y para ese último ejemplo, hicimos exactamente eso con nuestros grandes socios de Tennis Australia durante el último Open de Australia allá por enero de 2024. Puedes verlo en acción AQUÍ.

Al igual que con los demás asistentes de IA, los analistas y entrenadores deportivos podrán desarrollar estrategias y tácticas cada vez más sofisticadas, lo que se traducirá en un mayor número de "momentos sorpresa" en el campo para los aficionados.

¿Cómo influyen los datos deportivos y los LLM en los avances de la Realidad Mixta (es decir, Apple Vision Pro)?

Ver e interactuar con los deportes ocupa un lugar destacado en el vídeo de presentación de Apple Vision Pro.

Además de ver el partido desde múltiples ángulos, se muestra a los usuarios la posibilidad de disponer de todos los datos y perspectivas que deseen dentro de su ecosistema de visionado, ya sea mediante una consulta de audio o un gesto. También pueden interactuar con módulos para consumir contenidos adyacentes, como resúmenes, otros partidos, chatear con amigos o ver tertulias (o publicidad contextual).

La ambición parece ser crear una experiencia de 360 grados que, en última instancia, haga que cada detalle del juego sea más interesante y entretenido, vinculando al aficionado más estrechamente con los jugadores, los equipos, el "locutor" y los patrocinadores.

Los datos deportivos de calidad sustentan muchas de estas experiencias, tanto de forma visible como entre bastidores.

Entre esas formas entre bastidores se encuentran LLM para las predicciones; la selección de los mejores contenidos y anuncios para mostrarlos en el mejor momento, incluidos los momentos más destacados; la personalización de lo que los usuarios ven, oyen y sienten en función del estado del partido y de sus preferencias; la potenciación de las oportunidades de ludificación; la adición de increíbles capas de contexto para que las habilidades de los atletas sean aún más memorables y, en general, la profundización del poder narrativo del evento y, por tanto, de su valor para los aficionados y los patrocinadores.

Por no hablar de la información táctica que proporcionará a analistas y entrenadores, lo que elevará aún más el espectáculo sobre el terreno de juego.

Conferencia Sloan Sports Analytics 2024

Para concluir esta actualización, acabo de regresar de otro par de días fascinantes en la Sloan Sports Analytics Conference. Como ya he mencionado, presentamos allí una ponencia sobre cómo la IA Generativa puede aprovecharse para una aplicación específica en el deporte, dada la alta calidad de los datos de origen, para predecir con precisión la ubicación de los jugadores de fútbol que no se perciben visualmente en las retransmisiones (enlace más abajo). En otros paneles y presentaciones se debatieron amplias aplicaciones de GenAI en tareas para organizaciones deportivas como la atención al cliente y la búsqueda. Trataremos estos y otros usos específicos en futuros artículos.


Patrick Lucey es el científico jefe de Stats Perform. Puedes leer sus otras opiniones y puntos de vista sobre el papel que desempeñan ChatGPT y los grandes modelos lingüísticos en el deporte, y lo que habrá que ver en el futuro.

Próximamente en los artículos de Patrick: hablará de la ponencia 2024 deStats Perform en la Sloan Sports Analytics Conference con más detalle, si la IA Generativa podría mejorar la aplicación del VAR (Video Assistant Referee) en el deporte, si los agentes de IA serán útiles en el deporte y las aplicaciones de la IA Generativa para mejorar las retransmisiones deportivas y los patrocinios. También analizará el objetivo original de la RoboCup, que consiste en conseguir que robots humanoides totalmente autónomos derroten al mejor equipo humano de fútbol del mundo, en un campo real al aire libre, para el año 2050.