Ir al contenido principal
Clubes y colegios profesionales

Documento de investigación - Predecir el talento NBA a partir de enormes cantidades de datos de seguimiento del baloncesto universitario

Los equipos de la NBA tienen una capacidad limitada para tomar decisiones en el draft, ya que no disponen de datos detallados de seguimiento de los jugadores de la NCAA. Para evitar este problema, utilizamos técnicas de vision por ordenador de última generación para capturar datos de seguimiento de miles de partidos históricos de baloncesto masculino D-I de la NCAA directamente de las retransmisiones de vídeo.

Por: Stats Perform

En 2010, el sistema de seguimiento óptico de jugadores y balones SportVU se implantó por primera vez en determinados estadios de la NBA por parte de equipos que querían obtener una ventaja en el análisis de jugadores y equipos. Debido al valor de los datos de seguimiento, la NBA adoptó SportVU en toda la liga antes de la temporada 2013-14. Desde entonces, casi todos los análisis y la toma de decisiones de los equipos de la NBA se han basado en datos, utilizando no solo los datos posicionales en bruto, sino también las perspectivas tácticas derivadas de las marcas detectadas automáticamente por algoritmos de aprendizaje automático (por ejemplo, pantallas, aislamientos, conducciones, etc.).

Sin embargo, cuando se trata de analizar a los jugadores de la NCAA para un próximo draft, los equipos de la NBA se ven gravemente limitados en su capacidad de toma de decisiones, ya que no disponen de los mismos datos de seguimiento detallados de los jugadores de la NCAA. Las soluciones de hardware en las sedes son poco prácticas para la NCAA, con más de 300 escuelas de la División I solamente, además de los numerosos partidos de exhibición/torneo y de postemporada que no se juegan en las sedes de la NCAA. Además, para que una oficina de la NBA pueda modelar el rendimiento potencial futuro de un jugador universitario, necesitará datos históricos de seguimiento de los actuales jugadores de la NBA para construir un conjunto de entrenamiento para el modelado, algo que las soluciones in situ no pueden lograr.

Para evitar este problema, hemos utilizado técnicas de vision por ordenador de última generación para capturar datos de seguimiento de jugadores y balones de miles de partidos históricos de baloncesto masculino D-I de la NCAA directamente de la retransmisión de vídeo. Este volumen de datos equivale a más de 650.000 posesiones y más de 300 millones de fotogramas de vídeo. A partir de los datos de rastreo, detectamos automáticamente eventos como pases de balón, conducciones, aislamientos, subidas al poste, pantallas sin balón y emparejamientos defensivos mediante nuestro sistema de red neuronal de atención al actor-acción, con unos índices de recuerdo y precisión de 0,8 y 0,7 respectivamente.

Aunque la generación de datos de seguimiento a partir de la retransmisión para el baloncesto universitario es en sí misma un gran avance en el campo de la analítica del baloncesto, no es suficiente. Para demostrar el valor de los datos generados, lo mejor es calibrar el valor mediante una tarea predictiva. En este artículo, nos centramos en la tarea de predecir el talento de los futuros jugadores de la NBA. Para ello, predecimos la probabilidad de que un jugador llegue a la NBA directamente a partir de datos universitarios. Demostramos que el uso de datos de seguimiento nos permite obtener previsiones más precisas en comparación con las fuentes de datos actuales (log-loss de seguimiento: 0,30 frente a log-loss de jugada a jugada: 0,40). La ventaja adicional de nuestro enfoque es que aplicamos técnicas de "aprendizaje automático interpretable" (es decir, valores de Shapley) no sólo para crear predicciones precisas, sino también para identificar los puntos fuertes y débiles de un jugador concreto.

Ver el documento de investigación completo