Skip to Main Content
Clubs professionnels et collèges

Document de recherche - Prédire les talents de la NBA à partir d'énormes quantités de données de suivi du basket-ball universitaire

Les équipes de la NBA sont limitées dans leur capacité à prendre des décisions en matière de sélection car elles ne disposent pas de données détaillées sur le suivi des joueurs de la NCAA. Pour contourner ce problème, nous avons utilisé des techniques de vision ordinateur vision pointe pour capturer les données de suivi de milliers de matchs historiques de basket-ball masculin D-I de la NCAA directement à partir de la vidéo diffusée.

Par : Stats Perform

En 2010, le système de suivi optique des joueurs et des ballons SportVU a été déployé pour la première fois dans certains stades de la NBA par des équipes désireuses d'obtenir un avantage dans l'analyse des joueurs et des équipes. En raison de la valeur des données de suivi, la NBA a ensuite adopté SportVU à l'échelle de la ligue avant la saison 2013-14. Depuis lors, la quasi-totalité des analyses et des décisions des équipes de la NBA sont basées sur des données, utilisant non seulement les données positionnelles brutes, mais aussi les informations tactiques dérivées des marques détectées automatiquement par les algorithmes d'apprentissage automatique (par exemple, les écrans, les isolations, les entraînements, etc.)

Cependant, lorsqu'il s'agit d'analyser les joueurs de la NCAA en vue d'une prochaine sélection, les équipes de la NBA sont fortement limitées dans leur capacité à prendre des décisions car elles ne disposent pas des mêmes données détaillées de suivi des joueurs de la NCAA. Les solutions matérielles sur place ne sont pas pratiques pour la NCAA, qui compte à elle seule plus de 300 écoles de la division I, sans compter les nombreux matchs d'exhibition/tournoi et d'après-saison qui ne sont pas joués sur les sites de la NCAA. En outre, pour qu'un front office de la NBA puisse modéliser le rendement potentiel futur d'un joueur universitaire, il aura besoin de données historiques de suivi des joueurs actuels de la NBA pour construire un ensemble d'entraînement pour la modélisation - ce que les solutions sur place ne peuvent pas réaliser.

Pour contourner ce problème, nous avons utilisé des techniques de vision ordinateur vision pointe pour capturer les données de suivi des joueurs et des ballons de milliers de matchs historiques de basket-ball masculin de la NCAA D-I directement à partir de la vidéo diffusée. Ce volume de données équivaut à plus de 650 000 possessions et à plus de 300 millions d'images de vidéo diffusée. À partir des données de suivi, nous détectons automatiquement des événements tels que les sorties de balle, les drives, les isolations, les post-ups, les écrans hors balle et les matches défensifs à l'aide de notre système de réseau neuronal d'attention à l'acteur-action, atteignant des taux de rappel et de précision de 0,8 et 0,7 respectivement.

Même si la génération de données de suivi à partir de la radiodiffusion pour le basket-ball universitaire constitue en soi une avancée considérable dans le domaine de l'analyse du basket-ball, elle n'est pas suffisante. Pour mettre en évidence la valeur des données générées, il est préférable de l'évaluer à l'aide d'une tâche prédictive. Dans cet article, nous nous concentrons sur la tâche consistant à prédire le talent des futurs joueurs de la NBA. Pour ce faire, nous prédisons la probabilité qu'un joueur atteigne la NBA directement à partir des données de l'université. Nous montrons que l'utilisation de données de suivi nous permet d'obtenir des prévisions plus précises que les sources de données actuelles (log-perte de suivi : 0,30 contre log-perte de jeu : 0,40). L'avantage supplémentaire de notre approche est que nous appliquons des techniques d'"apprentissage automatique interprétable" (c'est-à-dire les valeurs de Shapley) pour non seulement créer des prévisions précises mais aussi identifier les forces et les faiblesses d'un joueur spécifique.

Voir le document de recherche complet