El ChatGPT de OpenAI se lanzó a finales de 2022. El "chatbot conversacional", entrenado con una enorme cantidad de texto de Internet, acumuló rápidamente millones de usuarios deseosos de experimentar un nuevo avance en la utilización cotidiana de las tecnologías AI .
Pero, ¿es ChatGPT relevante para el deporte? ¿Complementa o compite con los modelos de aprendizaje automático de Stats PerformPerform, entrenados con nuestra enorme cantidad de datos deportivos?
Spoiler: ChatGPT utiliza algunos de los mismos enfoques de aprendizaje profundo que el equipo de AI de Stats Perform, pero con entradas diferentes y para un objetivo diferente. De hecho, esas mismas técnicas AI se pueden encontrar en todo el mundo de la tecnología, resolviendo numerosos problemas. Aquí utilizaremos ChatGPT para explicar estas tecnologías AI subyacentes, así como el valor de ChatGPT, sus limitaciones y dónde podría ser relevante en la industria del deporte.
En un artículo posterior también abordaremos algunos usos actuales y futuros de métodos similares de aprendizaje profundo por parte de Stats Perform Perform para resolver problemas para el deporte.
¿Qué es ChatGPT?
ChatGPT es un modelo que ha leído la mayor parte del texto de Internet para entender cómo se estructuran las palabras, las frases y los párrafos, de modo que puede aceptar preguntas como entradas de texto y generar respuestas coherentes en forma de salidas de texto con estilo de diálogo.
Utiliza la " AIGenerativa" para generar predicciones de las siguientes palabras de una secuencia que son estadísticamente probables a partir de una amplia gama de entradas dadas, basándose en el contexto de las palabras anteriores. El resultado en forma de respuestas de texto fluidas y naturales.
En términos técnicos, ChatGPT es una variante de un gran modelo lingüístico (LLM) de Transformador Generativo Preentrenado (GPT) que utiliza la ingeniería de avisos para convencerlo de que produzca un comportamiento similar al de una conversación.
Los modelos de lenguaje no son nuevos, pero lo sorprendente del GPT-3 LLM utilizado por ChatGPT es el hecho de que es realmente grande: no sólo por los datos con los que se entrena (es decir, todos los datos de texto de Internet), sino por el número de parámetros que utiliza (175.000 millones). Utiliza un enfoque de red transformadora para aprender correlaciones y patrones en este vasto repositorio de texto que parecen sobrehumanos.
Mediante la elaboración inteligente de la pregunta de entrada para describir el contenido y el estilo requeridos de la respuesta, lo que se conoce como ingeniería de instruccionesChatGPT es capaz de seleccionar un pequeño número de muestras de texto con las que se ha entrenado y que muestran el estilo y el contenido requeridos, y sintetizar estas muestras para generar resultados de tipo ensayo para textos, artículos y respuestas a preguntas que imitan el lenguaje humano.
¿Qué más puede hacer la AI Generativa?
Los grandes modelos lingüísticos son un tipo de modelos de AI generativa. También pueden recibir entradas de texto y generar otras salidas, como imágenes (por ejemplo, OpenAI's DALL-E-2) y vídeo (por ejemplo, Meta MakeAVideo). Incluso la robótica está utilizando esta tecnología, con el lanzamiento del RT-1que es un transformador que toma como entradas instrucciones de texto en lenguaje natural e imágenes, y se le puede pedir que genere directamente como salidas tareas robóticas del mundo real.
Los LLM también se utilizan para la comprensión de contenidos/traducción/respuesta de preguntas para dominios específicos (por ejemplo, extraer, resumir y codificación de historias clínicaso documentos jurídicos) y atención al cliente. Un LLM potencia una herramienta de ayuda a la codificación, por ejemplo Copliot de Githubque puede marcar errores y generar o autocompletar código, basándose en el contexto de la API específica con la que se trabaja..
Las limitaciones de ChatGPT
AI generativa hace lo que pone en la etiqueta: genera predicciones.
ChatGPT sabe de palabras, y qué palabras es probable que aparezcan juntas en las frases y en qué orden. La palabra que elija en última instancia no importa, siempre y cuando la palabra dentro de la frase suene plausible, lo cual es un problema, ya que a menudo "alucinará" con algunas de estas palabras que son los hechos, y los hechos no pueden cambiar.
Además del problema de la alucinación, ChatGPT redacta las respuestas de forma tan autoritaria que las respuestas incorrectas seguirán sonando creíbles, especialmente para los no expertos.
Esto no es sólo un problema para ChatGPT, sino para las herramientas AI Generativa en general. Es realmente buena falsificando contenido real (por ejemplo, falsificaciones profundas en imágenes, vídeos y audio). Como todas las herramientas, hay que saber lo que la tecnología puede hacer, pero sobre todo lo que no puede hacer.
¿Qué puede hacer (y qué no puede hacer) ChatGPT en el deporte?
En primer lugar, ChatGPT sólo se ha entrenado con palabras hasta septiembre de 2021, por lo que no puede dar respuestas recientes. En segundo lugar, GPT-3 requiere texto como entrada. El lenguaje del deporte es diferente al texto, y en Stats Perform's hemos creado el "lenguaje del deporte" que alimenta nuestra AI. Por último, ChatGPT no está optimizado para garantizar que las "respuestas" que predice sean correctas.
ChatGPT no sabe nada de rugby ni de críquet, ni de baloncesto ni de fútbol, ni de países, ni de copas, ni de bates, ni de pelotas, ni de nada del mundo. No ha sido entrenado en hechos y estadísticas o para reconocer información precisa sobre la que generar sus predicciones. Sólo conoce el orden de las palabras.
Esto lo hace restrictivo en ámbitos como las noticias y el deporte, donde los resultados son resultados y las estadísticas son estadísticas, sobre todo porque ChatGPT puede generar artículos muy bien redactados que parecen creíbles pero que no se basan en lo que ocurrió realmente.
Puedes comprobarlo haciéndole consultas muy concretas, como esta sobre un jugador de Rugby en el Mundial 2019:
Las dos primeras frases de esta respuesta bien redactada son incorrectas: Cheslin Kolbe marcó 2 ensayos contra Italia en la fase de grupos y un ensayo en la final contra Inglaterra.
¿Tiene algún papel el ChatGPT en el deporte?
Por medio de datos y contenidos estructurados, precisos y actualizados, una futura versión de ChatGPT podría, en teoría, producir rápidamente artículos de texto para poner al día a los aficionados, desencadenados por una pregunta de texto del tipo "escríbeme un avance de todos los partidos de mañana".
Sin embargo, ya existen artículos automatizados escritos por máquinas. No utilizan los mismos procesos "conversacionales" que ChatGPT, pero son objetivamente correctos.
Es un matiz, pero ChatGPT genera tanto la narración como la información dentro de la narración. Esto hace que AI tiva sea problemática para sintetizar noticias, incluidas las deportivas.
En cambio, los productos basados en hechos específicos, como las Previas Automatizadas de Partidos de Stats Perform, utilizan primero las estadísticas y los hechos de nuestros feeds de datos deportivos como semillas de la historia, y luego construyen la narración en torno a esa información concreta.
Como nuestras herramientas parten de nuestras fuentes de datos, y esas fuentes de datos están estructuradas y son precisas, esto significa que los artículos que se escriben no cambian y no son predicciones "generadas": son lo que ha ocurrido.
Otros servicios automatizados de informes deportivos que utilizan nuestros datos como base son "Pressbox Live", que genera información en tiempo real para los comentaristas de televisión, y "Pressbox Graphics", que produce imágenes automatizadas para redes sociales o blogs cada vez que se marca un gol, un touchdown o una canasta.
¿Y ahora qué?
En la segunda parte, analizaremosla AI subyacente a ChatGPT y veremos cómo se utiliza ya para mejorar las experiencias deportivas, especialmente en el mundo del alto rendimiento.
En la Parte 3, abordamos las implicaciones del último modelo ChatGPT-4 y lo que cambia para el deporte.


