2010년, 선수와 팀 분석에서 우위를 점하고자 하는 팀들이 일부 NBA 경기장에 SportVU 광학 선수 및 공 추적 시스템을 처음 도입했습니다. 그 후 트래킹 데이터의 가치로 인해 NBA는 2013-14시즌을 앞두고 리그 전체에 SportVU를 도입했습니다. 그 이후로 NBA 팀의 거의 모든 분석과 의사 결정은 원시 위치 데이터뿐만 아니라 머신러닝 알고리즘이 자동으로 감지한 표시(예: 스크린, 아이솔레이션, 드라이브 등)에서 도출한 전술적 인사이트를 활용하여 데이터 기반으로 이루어지고 있습니다.
그러나 다가오는 드래프트를 위해 NCAA 선수를 분석할 때, NBA 팀들은 NCAA 선수들에 대한 상세한 추적 데이터가 없기 때문에 의사 결정 능력에 심각한 제약을 받습니다. 디비전 I 학교만 300개가 넘고 수많은 전시/토너먼트 및 포스트시즌 경기가 NCAA 경기장에서 열리지 않기 때문에 경기장 내 하드웨어 솔루션은 NCAA에 비현실적입니다. 또한 NBA 프런트 오피스가 대학 선수의 미래 잠재력을 모델링하려면 모델링을 위한 훈련 세트를 구축하기 위해 현재 NBA 선수의 과거 추적 데이터가 필요한데, 이는 경기장 내 솔루션으로는 달성할 수 없습니다.
이러한 문제를 해결하기 위해 유니티는 최첨단 컴퓨터 vision 기술을 활용하여 수천 개의 역대 NCAA D-I 남자 농구 경기의 선수 및 공 추적 데이터를 방송 비디오에서 직접 캡처했습니다. 이 방대한 양의 데이터는 65만 개 이상의 소유권과 3억 프레임 이상의 방송 영상에 해당합니다. 추적 데이터에서 각각 0.8과 0.7의 리콜률과 정확도를 달성하는 행위자 행동 주의 신경망 시스템을 사용하여 볼 스크린, 드라이브, 아이솔레이션, 포스트업, 오프볼 스크린, 수비 매치업과 같은 이벤트를 자동으로 감지합니다.
대학 농구 중계에서 추적 데이터를 생성하는 것 자체는 농구 분석 분야에서 엄청난 혁신이지만, 그것만으로는 충분하지 않습니다. 생성된 데이터의 가치를 보여주기 위해서는 예측 작업을 통해 그 가치를 측정하는 것이 가장 좋습니다. 이 백서에서는 미래 NBA 선수의 재능을 예측하는 작업에 초점을 맞춥니다. 이를 위해 대학 데이터를 통해 선수가 NBA에 진출할 확률을 직접 예측합니다. 추적 데이터를 사용하면 현재 데이터 소스에 비해 더 정확한 예측을 얻을 수 있음을 보여줍니다(추적 로그-손실: 0.30 대 플레이 바이 플레이 로그-손실: 0.40). 이러한 접근 방식의 또 다른 장점은 '해석 가능한 머신 러닝' 기법(예: 샤플리 값)을 적용하여 정확한 예측을 생성할 뿐만 아니라 특정 선수의 강점과 약점을 파악할 수 있다는 것입니다.