주요 콘텐츠로 건너뛰기
프로 클럽 및 대학

프로 Forum 심사위원단의 의견 다섯 가지 잠재적 추상 아이디어

 

프로 Forum 제출 마감일이 한 달여 앞으로 다가온 가운데, 대회 심사위원인 Devin Pleuler가 공개 제출 부문에서 데이터 과학자와 분석가가 고려할 수 있는 잠재적 연구 분야에 대한 자신의 생각을 공유합니다.

 

기준: Stats Perform

이 글을 읽고 계신다면 2022년 프로 Forum 연구 제안서를 제출하는 데 관심이 있으실 가능성이 높습니다.

집중하고 싶은 연구 분야를 고려할 때 초록을 평가할 때 심사위원의 눈길을 끌 수 있는 요소에 대해 몇 가지 생각을 공유하는 것이 도움이 될 수 있다고 생각했습니다.

한동안 제 머릿속을 맴돌던 반쯤 구워진 아이디어 5가지를 소개해드리며, 누군가 좀 더 자세히 살펴봐 주셨으면 좋겠습니다.

1. 합성 이벤트 데이터

훈련용 이벤트 데이터를 사용하여 실제와 구분할 수 없는 합성 이벤트 데이터를 생성하는 사실적인 게임 시뮬레이터를 구축할 수 있을까요?

그렇다면 종단적 시뮬레이션을 위한 게이트웨이가 열립니다. 예를 들어, 시작 조건을 조정하고 여러 시즌에 걸쳐 잠재적인 영향을 측정할 수 있습니다.

2. PCF의 플레이어 파라미터화

피치 컨트롤 서페이스는 중요한 전술적 맥락을 시각적으로 해석 가능한 방식으로 우아하게 포착하기 때문에 전체 추적 데이터를 분석하는 기본 방법 중 하나로 자리 잡았습니다.

하지만 대부분의 PCF 구현은 모든 플레이어가 동일한 최고 속도와 가속 능력을 가지고 있다고 가정합니다. 개인의 신체적 특성을 고려한 파라미터화된 피치 제어 함수를 구축하고 검증할 수 있는 방법이 있을까요?

3. 신체 위치 추론

볼을 가진 선수의 방향을 파악하는 것은 경기력 평가에서 매우 중요한 요소입니다. 정면을 향하면서 팀원을 찾는 선수는 일반적으로 골대를 등지고 팀원에게만 공을 패스하는 선수보다 더 효과적입니다.

플레이어가 공을 받을 때 어느 방향을 향하고 있는지 추정하는 모델을 구축하고 검증할 수 있나요? 이벤트 데이터를 기반으로 원격으로 신뢰할 수 있는 휴리스틱을 구축할 수 있나요?

4. 가치 표면의 효율적인 저장

이것은 축구 데이터 엔지니어링 스펙트럼에 더 가깝습니다. 22명의 선수에 대해 90분 동안 25헤르츠 샘플링 속도를 적용하면 경기당 약 300만 개의 선수 좌표를 얻을 수 있습니다. 이것은 이미 원시 형태로 저장하기에는 상당히 어려운 데이터입니다.

평방미터 단위로 평가되는 피치 컨트롤과 같은 값 표면을 저장하려는 경우, 이 값은 게임당 약 13억 개의 데이터 포인트로 폭발적으로 증가합니다. 이는 1000배 증가한 수치입니다. 이 데이터를 효율적으로 저장할 수 있는 방법이 있을까요? 자동 인코더를 사용해 더 낮은 차원으로 표현 벡터를 찾는 것은 어떨까요?

5. 소유의 플레이어 체력 혜택

일반적으로 경기 중 선수에게 가해지는 신체적 부담이 클수록 스쿼드 로테이션이나 부상으로 인해 출전 시간을 놓칠 가능성이 높아집니다. 또한 플레이어는 소유권을 되찾기 위해 더 많은 거리를 커버해야 하는 것으로 보입니다.

이러한 가정이 사실일까요? 그리고 특정 소유 포지티브 플레이 스타일의 전반적인 플레이어 체력 이점을 정량화할 수 있을까요?


이러한 아이디어에는 실제 기술적인 세부 사항이 없으므로 제안서에 복사하여 붙여 넣는다고 해서 멀리 갈 수는 없습니다.

탄탄한 실험 설계와 방법론은 다른 Forum 초록과 차별화되는 훌륭한 Forum 초록의 핵심입니다.


데빈 플률러는 토론토 FC의 분석 담당 이사입니다. 그는 11월 29일 마감일을 앞두고 제출된 각 프로 Forum 제안서를 검토할 5명의 심사위원 중 한 명입니다.

각 제안 카테고리의 세부 사항, 심사 기준 및 사용 가능한 데이터 샘플을 포함한 전체 제출 정보를 보려면 여기를 클릭하세요.