GPT-4: ¿Cambia algo para el deporte?

En noviembre de 2022, el laboratorio de investigación de inteligencia artificial Open AI lanzó su popularísima aplicación AI ChatGPT, que arrasó en todo el mundo. La tecnología que impulsa la tecnología ChatGPT es el modelo de lenguaje de gran tamaño (LLM) llamado GPT-3 (o más exactamente GPT-3.5 - para una descripción de lo que es un LLM y nuestra opinión inicial sobre esta tecnología y cómo se relaciona con el deporte echa un vistazo a nuestra serie de dos partes aquí (Parte 1 & Parte 2). Hace un par de semanas, OpenAI lanzó su nuevo modelo de lenguaje de gran tamaño (LLM), GPT-4. Según OpenAI, el nuevo modelo puede hacer más cosas y es más preciso que el LLM anterior. Pero lo que realmente puso los pelos de punta a la gente fue la introducción de la capacidad de comprensión de imágenes, especialmente cuando el cofundador de OpenAI subió un dibujo de un diseño para un sitio web de bromas[LINK]. Pocos días después, Google lanzó su chatbot "Bard" en modo de investigación. Hay un montón de buenos artículos generales que dan una idea de lo que estos dos lanzamientos recientes pueden hacer, pero en este artículo se discuten las implicaciones que el modelo GPT-4 tiene en el deporte. Las reflexiones que aquí comparto son un resumen de lo que he presentado en el último mes en el MIT Sloan (resumen aquí) y en nuestroForum Opta .

¿Ha resuelto la GPT-4 el problema de la "alucinación de los Factsen el deporte?

En nuestros artículos anteriores, destacamos los principales problemas a la hora de utilizar ChatGPT en el deporte: 1) alucina con los hechos, y 2) el corte del conjunto de datos con el que se entrena fue septiembre de 2021. Analicemos el primer problema. Como ya se ha mencionado, se supone que GPT-4 es más preciso, así que veamos el ejemplo que utilizamos en el artículo anterior (como recordatorio, preguntamos cuántos ensayos marcó Cheslin Kolbe en la Copa del Mundo de Rugby de 2019). La respuesta que dio fue 2 tries (uno vs NZ y el otro contra Japón, lo cual era incorrecto, anotó 3 tries - 2 vs Italia en la fase de grupos y 1 vs Inglaterra en la final).

Como se puede ver en la imagen, cuando el chatbot recibe la misma pregunta, su respuesta es mucho más limitada. Como tal, la respuesta es correcta, ya que anotó 3 ensayos en la Copa del Mundo de Rugby, pero carece del nivel de detalle que se proporcionó en la respuesta anterior. Al pedir más detalles, esto es lo que obtuvimos:

A partir de los resultados, respondió correctamente a algunas de las preguntas (2 tries contra Italia), pero se equivocó en la otra parte (no marcó contra Canadá, marcó un try en la final contra Inglaterra). Así que, con respecto a que GPT-4 resuelva el problema de la alucinación, sigue siendo un problema y es probable que lo sea durante mucho tiempo debido a la naturaleza autorregresiva de estos modelos de inteligencia artificial (es decir, el modelo predice la siguiente palabra de una secuencia dada la palabra anterior y no está vinculado a ningún conocimiento de la realidad).

En una presentación la semana pasada en la Universidad de Nueva York, una de las figuras más destacadas de AI, Yann LeCunn, puso de relieve esta cuestión y afirmó que el enfoque actual de los LLM está condenado al fracaso, ya que nunca resolverán este problema de alucinación. Estos modelos tienen que estar vinculados a la realidad de alguna manera (ver diapositivas aquí), lo que concuerda con lo que hemos dicho en artículos anteriores, que necesitamos que los resultados se basen en el mundo real: es vital que la fuente de la verdad en el deporte provenga de proveedores de datos deportivos de confianza como Stats Perform. Tal es la preocupación por este problema y el potencial de daño y desinformación - hubo una carta abierta de más de 1000 líderes tecnológicos para detener el desarrollo de estos LLMs ya que presentan "profundos riesgos para la sociedad y la humanidad" [ENLACE]. Más información al final.

¿Y qué hay de tener un conjunto de datos actualizado? ¿Ha cambiado algo al respecto?

Sí y no. Aunque el problema de la alucinación persistirá, como ya se ha mencionado, OpenAI lanzó la semana pasada una serie de plugins para ChatGPT que permitirán al chatbot interactuar con 3rd parte de las API [ENLACE]. Con estos avances en los plugins, es posible incorporar la funcionalidad de ChatGPT en la pila de código existente, permitiendo a los desarrolladores recuperar llamadas de información en tiempo real. Esté atento.

Además, esto plantea la cuestión de cómo puede utilizarse la tecnología de inteligencia artificial como ChatGPT en un entorno en directo. Por lo general, la mayoría de las preguntas de la gente se basan en un conocimiento estático que no cambia. Sin embargo, el deporte es diferente, especialmente en un partido en directo. Obviamente, se puede hacer una pregunta sencilla, como "¿Quién va ganando?" o "¿Quién ha marcado?", pero esas respuestas ya están disponibles actualmente a través de los chatbots "pre-ChatGPT". Para obtener una visión más profunda, la capacidad de consultar cosas en directo es difícil, porque en el tiempo que se tarda en escribir una consulta sobre un elemento específico del juego, puede que ya haya ocurrido otra cosa, lo que disminuye el valor o el interés de esa consulta. Por eso es necesaria la consulta automática o "detección de elementos destacados", que se activa cuando se produce un acontecimiento interesante. En nuestra plataforma PressBoxLive disponemos de esta capacidad: cuando se produce un acontecimiento interesante, como un gol, podemos generar automáticamente información interesante al respecto. Lo mejor de esto es que es escalable. Por ejemplo, en un partido reciente de la segunda división de la Bundesliga (2. Bundesliga) entre el Arminia Bielefeld y el Nurnberg, cuando se marca un gol, podemos generar una perspectiva para ese partido como lo haríamos para la primera división, lo que subraya el valor de AI en el deporte: la capacidad de escalar (y hacerlo en directo). No se trata sólo de información textual; podemos generar superposiciones automáticas en vídeo que den más color al rendimiento, como hemos hecho recientemente en el tenis.

La posibilidad de introducir imágenes y dibujos era genial. ¿Podemos introducir una imagen o un dibujo deportivo en ChatGPT y obtener un resultado?

Como se mencionó en el artículo anterior, en Stats Perform Perform fuimos pioneros en el ámbito de la analítica deportiva interactiva, donde se podía dibujar una jugada y recuperar jugadas similares, o hacer analíticas sobre la jugada [ENLACE], o incluso predecir dónde deberían haber estado los jugadores en una situación determinada utilizando nuestro trabajo Ghosting [ENLACE]. Sin embargo, en lo que respecta a la demostración de GPT-4, el funcionamiento es ligeramente distinto. La red transformadora de texto a imagen o de imagen a texto aprende de una enorme cantidad de pares de texto a imagen (es decir, para cada imagen hay una descripción textual como un pie de foto). Para este conjunto de entrenamiento, el transformador aprende la correlación entre las descripciones textuales y las partes de la imagen. Debido al comportamiento emergente de estas redes neuronales de gran tamaño, puede realizar algunos razonamientos sobre determinados elementos de la imagen (por ejemplo, ¿por qué es graciosa una determinada imagen?).

En el caso del deporte, seguimos ampliando el vocabulario de los eventos, que puede considerarse un pie de foto de la jugada. No basta con tener el flujo de eventos; utilizando nuestras métricas y modelos de aprendizaje automático, podemos detectar la calidad de una acción (como un tiro con xG, o un pase utilizando nuestro valor de posesión en fútbol). Ampliar el vocabulario es una cosa, pero ampliar la cantidad de datos es otra cosa que hay que hacer.

Por eso el Opta Vision es tan importante, ya que hace dos cosas: a) amplía el vocabulario de eventos en el fútbol y b) amplía el número de partidos para los que disponemos de este rico vocabulario.

Además, al haber emparejado el flujo de eventos ampliado (que puede verse como el subtitulado) con los datos de seguimiento, podemos aumentar nuestras capacidades de razonamiento en torno a cada jugada mediante este conjunto de datos emparejados (es decir, vocabulario ampliado y datos de seguimiento). Nos encontramos en el punto de inflexión que nos llevará al siguiente nivel de la analítica deportiva.

LLMs: Confianza, perturbación e impacto en la sociedad

Como ya se ha mencionado, debido a la impresionante y rápida mejora de la tecnología LLM, muchas personas destacadas de todo el mundo se están volviendo extremadamente cautelosas sobre el impacto que dicha tecnología tendrá en la sociedad y el potencial de daño, y como tal, han pedido una pausa en esta tecnología. Se trata de un tema extremadamente importante, pero en lo que respecta al deporte, ésta es mi opinión personal sobre mi opinión personal sobre este tema:

Como herramienta de asistencia, los chatbots AI basados en LLM cambian las reglas del juego en términos de ayuda al aprendizaje y eficiencia. Como toda tecnología, hay que saber lo que puede y lo que no puede hacer. En mi opinión, estas herramientas de AI son la herramienta de asistencia definitiva y pueden ayudar a los principiantes a alcanzar un mayor nivel de eficiencia, como se puso de manifiesto en un reciente estudio realizado por investigadores del MIT [ENLACE]. Otro estudio mostró que los desarrolladores que utilizaron GitHub Copilot completaron las tareas un 55,8% más rápido que el grupo de control [ENLACE]. Cuando la base de conocimientos es estática, fiable y está actualizada, poder preguntar y profundizar en fragmentos específicos de conocimiento es increíble (pero lo fundamental es poder hacer la pregunta adecuada y entender si la respuesta está relacionada con el problema que se quiere resolver).
Sin embargo, tiene que haber límites. Si los datos son fiables (como los que tenemos en Stats Perform), no hay nada malo en utilizarlos para estos fines, pero hay que asegurarse de que se mantienen los hechos (y no alucinaciones). En ámbitos ajenos al deporte, donde existe una mezcla de realidad y ficción en el éter, esto es más problemático, ya que puede propagarse la desinformación, por lo que es necesario establecer controles para evitar que esto ocurra. Además, es importante proteger la información privada y sensible, ya que una vez que esta información está dentro de los LLM, es casi imposible evitar que se propague.
En el deporte, existen estos límites naturales. Por ejemplo, en Stats Perform, somos los guardianes del registro público de datos de los partidos, pero no tenemos información privada como la información médica, psicológica, de entrenamiento y contractual de los jugadores (y nunca esperaríamos tenerla). Esta barrera natural ofrece protección. También ofrece a los jugadores, clubes y clientes la oportunidad de utilizar nuestros análisis y modelos a nivel de partido como una de las entradas, que luego pueden combinar con los datos privados que poseen.
Además, el ser humano debe ser quien tome las decisiones en última instancia (y debe ser capaz de saber cuándo se equivoca la tecnología y cuándo se puede confiar en ella). Se podría pensar en esto como un piloto en un avión. En los últimos 100 años de transporte aéreo comercial, el número de pilotos no ha cambiado. Sin embargo, la tecnología del avión ha mejorado espectacularmente, lo que ha mejorado la toma de decisiones, la seguridad y la eficiencia de los viajes en avión. A pesar de ello, el número de pilotos sigue siendo el mismo. Esencialmente, lo que la tecnología AI está haciendo en nuestra área del deporte es crear tecnología de asistencia para ayudar a los expertos en la materia a tomar las mejores decisiones, así como a ser lo más eficientes posible.
Además, el mundo no existe únicamente en lenguaje natural o datos deportivos. Hay muchas cosas que todavía no podemos digitalizar (y probablemente no lo hagamos debido a los datos públicos frente a los privados mencionados anteriormente), como si un jugador ha dormido bien la noche anterior, si se ha peleado con su pareja, si los niños están enfermos o disgustados, o las interacciones entre las personalidades de los jugadores. Los responsables de la toma de decisiones son capaces de digitalizar todo eso ellos mismos a través de los numerosos sensores de los que disponen y, como tales, tendrán a mano la información más relevante para tomar la mejor decisión. Nuestro trabajo consiste en darles la mejor información posible con los datos de que disponemos.

El espacio de la inteligencia artificial cambia a diario, y haremos todo lo posible por mantener a todo el mundo al día de los avances en este campo y de cómo se relacionan con nosotros. En el próximo artículo, también profundizaremos en el proyecto Opta Vision y sus paralelismos con lo que está ocurriendo en el ámbito de los vehículos autónomos. Manténgase informado.

El Dr. Patrick Lucey es el científico jefe del gigante de los datos deportivos Stats Perform, y dirige el equipo de AI con el objetivo de maximizar el valor de los profundos tesoros de datos deportivos de la empresa. Patrick ha estudiado y trabajado en el campo AI durante los últimos 20 años, ocupando puestos de investigación en Disney Research y en el Instituto de Robótica de la Universidad Carnegie Mellon, además de pasar un tiempo en el Centro de Investigación T.J. Watson de IBM mientras realizaba su doctorado. Patrick es originario de Australia, donde obtuvo su BEng(EE) en la Universidad de Southern Queensland y su doctorado en la Universidad Tecnológica de Queensland. Es autor de más de 100 artículos revisados por pares y ha sido coautor de artículos en el MIT Sloan Best Research Paper Track, ganando el mejor artículo en 2016 y el subcampeonato en 2017 y 2018.

GPT-4: ¿Cambia algo para el deporte?

También le recomendamos

Suscríbase al Marcador