주요 콘텐츠로 건너뛰기

역할 발견을 소개합니다: 엘리트 프로 축구에서 데이터 기반 역할 생성하기

 

구단의 게임 모델 내에서 역할을 정의함으로써, 채용 분석가는 각 역할의 매개변수에 맞는 선수를 보다 객관적으로 직접 비교할 수 있습니다. 이 글에서는 이벤트 데이터를 기반으로 하는 AI 모델을 통해 전 세계 주요 대회에 출전하는 선수들의 경기장 내 역할을 자동으로 감지하는 방법을 간략하게 설명합니다.

 

작성자: 작성자: 앤디 쿠퍼

기술 스카우팅에 대한 다른 접근 방식 취하기

지난 10년 동안 비디오와 데이터를 기반으로 하는 새로운 기술이 등장하면서 채용 가능성을 식별, 모니터링 및 평가하는 스카우트 부서의 프로세스는 지속적으로 발전해 왔습니다.

하지만 이로 인해 구단이 실제로 선수에 대한 평가 기준을 정의하는 방식에 눈에 띄는 변화가 생겼나요? 부서 내에서 포지션별 KPI는 게임 모델을 기반으로 정의되며, 이는 선수의 성과 산출물을 기준으로 측정됩니다. 또한 스카우트가 선수를 주관적으로 평가할 수 있도록 포지션별 템플릿에 KPI를 적용하여 추가적인 맥락을 추가할 수 있습니다.

하지만 이러한 프로세스가 10년 전과 비교하면 분명 더 집중적이고 엄격해졌지만, 한 가지 중요한 질문이 제대로 해결되지 않았습니다. 특정 직책의 KPI를 기준으로 선수를 평가하는 것이 얼마나 신뢰할 수 있는가 하는 점입니다.

오늘날에도 선수와 포지션은 25년 전과 같은 방식으로 풀백, 센터백, 센터 포워드 등으로 분류되고 있습니다. 그러나 같은 '포지션'에서 다른 클럽에서 뛰는 영입 유망주들을 비교할 때, 많은 선수들이 근본적으로 다른 자질을 가지고 있기 때문에 동일한 KPI로 객관적으로 평가하기는 어렵습니다.

바로 여기에서 Stats Perform새로운 역할 발견 개념이 등장합니다. 역할 발견은 AI 팀이 개척한 새로운 선수 평가 방법으로, 포지션에 따라 선수를 평가하는 것의 한계를 해결합니다. 대신 팀 내 역할에 따라 선수를 프로파일링하는 데 중점을 둡니다.

채용 분석가는 역할 발견을 통해 비지도 학습 프로세스를 적용함으로써 게임 모델 내에서 각 역할을 수행하는 데 필요한 주요 성향과 특성을 기반으로 지원자를 그룹화하여 더 넓은 팀 스타일 내에서 플레이어를 평가할 수 있습니다.

이 글에서는 내년부터 구단이 기술 스카우트에 대한 새로운 접근 방식을 고려할 수 있도록 도와줄 역할 발견의 핵심 요소 몇 가지를 살펴보고자 합니다.

1단계: 플레이 스타일의 맥락에서 각 플레이어의 공간적 성향 파악하기

역할 검색은 경기장 전체에서 총 18가지 유형의 역할을 감지하며, 29개의 서로 다른 선수 클러스터에서 작동합니다. 역할 감지의 시작점은 플레이어 패스의 가장 일반적인 시작과 끝 위치를 식별하여 공간 히트 맵을 생성하는 것입니다.

아래 그래픽은 2018/19 시즌 동안 두 센터 포워드인 로베르트 레반도프스키와 호베르투 피르미누가 가장 많이 패스를 주고받은 경기장 내 세 구역을 보여줍니다.

두 선수 모두 센터 포워드로 분류되어 있지만, 이 히트 맵을 보면 두 선수는 각자의 클럽에서 다른 역할을 수행했음을 알 수 있습니다. 레반도프스키의 가장 일반적인 패스 위치는 에지 주변과 박스 안 중앙 지역이었습니다. 반면 피르미누는 오른쪽 채널 안쪽 하프 스페이스에서 많은 볼을 처리했습니다.

그러나 이 정보만으로는 인사이트가 제한적이며 경기 상황에 대한 맥락이 부족합니다. 따라서 Stats Perform 플레이 스타일 프레임워크를 플레이어의 터치에 적용하면 각 플레이어가 특정 플레이 단계에 어떤 영향을 미치는지 이해할 수 있습니다.

이는 레반도프스키와 피르미누의 스타일 차이를 더욱 강조합니다. 아래 차트는 상위 5개 리그의 다른 선수들과 비교하여 팀이 특정 스타일로 경기를 펼칠 때 각 선수의 볼 터치 횟수를 보여줍니다.

평균과 비교했을 때 피르미누의 클러스터는 역습 단계에서 가장 많이 관여하며 지속 위협 단계에서도 강한 특징을 보입니다. 레반도프스키의 클러스터는 지속 위협 단계에서 평균보다 낮았는데, 이는 그의 역할이 다른 역할에 비해 공격 3선에서 팀의 소유권 시퀀스에 관여도가 낮다는 것을 나타냅니다.

2단계 2단계: 보유 중인 플레이어의 기여도를 정량화하기

선수가 가장 자주 공을 소유하는 경기장 영역과 특정 플레이 스타일에 대한 기여도를 파악한 다음, 역할 발견은 Stats Perform PV(Possession Value) 프레임워크를 적용하여 소유 시퀀스 중 선수의 참여가 다음 10초 동안 팀의 득점 확률을 어떻게 높이는지 파악합니다.

점유 가치는 패스, 드리블, 크로스를 포함한 주요 온더볼 이벤트와 태클, 인터셉트와 같은 수비 동작을 포함하여 긍정적이거나 부정적인 기여도에 따라 선수에게 점수를 부여합니다.

아래 표에는 2018/19 프리미어 리그 시즌 리버풀에서 90당 가장 높은 PV+를 기록한 선수가 나와 있으며, 모살라, 앤드류 로버트슨, 피르미누가 골 확률을 높이는 데 크게 기여한 것이 눈에 띕니다.

플레이어의 공 사용 분석에 적용되는 또 다른 새로운 지표는 예상 패스 완료(xP)입니다. 이 모델은 패스의 거리와 각도, 소유권 이동의 기타 상황적 요소 등 다양한 요소를 고려하여 패스가 완료될 확률을 설정합니다.

이 지표를 적용하면 확률 관점에서 볼 때 완료하기 어려운 침투 패스를 시도하고 완료하는 비율이 높은 선수를 식별하여 선수의 소유권 성향을 더 잘 이해할 수 있습니다.

이 데이터를 역할 발견 모델에 통합하기 위해 경기장을 여러 구역으로 나누고, 각 구역에서 선수의 위치와 xP 완료율을 강조하여 해당 선수가 팀에 중요한 기여를 하는 위치를 파악했습니다.

PV와 xP를 결합하여 패스를 하는 플레이어의 잠재적 보상을 평가하고, 잠재적 위험에 대비하여 설정하고, 다른 플레이어와의 성과를 비교할 수 있습니다.

다시 레반도프스키와 피르미누 비교로 돌아가서, 아래 그래프는 2018/19 시즌 중앙 공격형 미드필더 지역으로 패스를 플레이했을 때 각 선수의 퍼포먼스를 보여줍니다.

피르미누의 xP 완료율이 0.75 이상이라는 것은 그가 이 구역에서 높은 확률로 안전한 패스를 하고 있음을 나타냅니다. 동시에 피르미누는 프로그레시브 PV 상위 10% 백분위수에 속해 팀의 득점 확률도 높이고 있습니다.

다른 유형의 공격수인 레반도프스키는 xP 완료율에서는 평균에 가깝고 PV에서는 하위 10% 백분위 수에 속해 소유권 체인에 더 적게 관여하고 골문을 향해 많은 슈팅을 할 가능성이 높아 체인에서 마지막 선수라는 사실을 뒷받침합니다. 그러나 이 수치가 모든 것을 설명하지는 못하며, 이에 대해서는 이 글의 뒷부분에서 자세히 설명하겠습니다.

3단계: 플레이어가 점령 시퀀스에 관여하는 방식 설정하기

역할 발견은 플레이어가 팀 동료와 상호작용하는 방식을 더 자세히 파악하기 위해 경기장에서 가장 높은 PV를 생성하는 팀의 가장 일반적인 패스 패턴을 식별하는 또 다른 새로운 모델인 ' 무브먼트 체인'을 통합했습니다.

무브먼트 체인은 4개의 패스로 구성된 패스 모티브를 기반으로 레이블이 지정되어 팀이 공을 진행하는 방식과 관련된 선수를 식별하는 데 도움이 됩니다.

xP와 마찬가지로 무브먼트 체인을 분석하기 위해 경기장을 구역으로 분할하여 클러스터링을 통해 팀이 한 구역에서 다른 구역으로 공을 이동하는 가장 빈번한 패턴을 파악할 수 있습니다. 아래 그림과 같이 시작 구역은 수비 3명의 중앙 영역이 될 수 있고, 끝 구역은 상대 박스 가장자리가 될 수 있습니다.

무브먼트 체인은 특정 스타일을 사용할 때 팀이 공을 어떻게 움직이는지 파악하기 위해 플레이 스타일의 맥락에서 적용될 수도 있습니다. 아래 예는 2018/19 시즌 리버풀이 빌드업에 참여했을 때 상대 페널티 에어리어에서 끝나는 가장 위험한 체인을 보여주는 것으로, 오른쪽 안쪽과 왼쪽 안쪽 채널을 통해 박스 안으로 침투하는 플레이를 강조합니다.

4단계: 각 모델을 적용하여 역할 만들기

개별 플레이어가 팀의 소유권 체인에 관여하는 것을 파악하기 위해 Word2Vec에서 영감을 얻은 Chain2Vec 모델을 적용하여 플레이어가 자주 등장하는 체인 클러스터와 그 맥락, 플레이어가 하나의 패스 모티브 내에서 어떻게 상호작용하는지를 파악합니다. 딥러닝 기법을 통한 이 고급 모델링은 플레이어와 팀의 참여를 간결하게 표현합니다.

이와 함께 플레이어 터치 지도가 적용되어 각 플레이어의 공간적 상황 정보와 플레이 스타일, xP 및 PV 모델을 제공합니다. 또한 플레이어가 촬영하는 오픈 플레이 샷의 유형과 위치도 분석됩니다.

이 모든 결과물은 클러스터링 알고리즘인 가우시안 혼합 모델을 사용하여 최종 역할 발견 모델에 적용되어 그룹을 학습하고 선수를 고유한 그룹으로 분리합니다. 그런 다음 이러한 클러스터에서 데이터 기반 설명을 사용하여 400개가 넘는 개별 선수 설명자를 경기장 전체에 걸쳐 18개의 개별 역할로 압축할 수 있습니다.

이러한 역할은 다음과 같이 레이블이 지정되어 있습니다(확대하려면 클릭):

다시 레반도프스키와 피르미누로 돌아와서, 각 선수의 역할이 다르다는 것을 확인했으니 이제 직접 비교하기보다는 각자의 역할에 맞는 선수와 비교할 수 있습니다.

아래 그래픽은 이전에 사용한 것과 동일한 패스 비교를 표시하지만 이번에는 주황색으로 강조 표시된 각 역할의 플레이어를 분리했습니다.

피르미누의 경우 상위 5개 리그의 모든 선수와 비교했을 때 xP 완료율 상위 10% 백분위수에 속하지만, 다른 '공격형 창의적 위협' 선수들과만 비교하면 평균에 훨씬 더 가까워집니다.

레반도프스키의 경우, 다른 '고급 공격수'와만 비교했을 때 그의 패스가 평균에 비해 훨씬 안전하다는 것을 알 수 있으며, 그의 공격 기여도는 여전히 평균 이하이지만 전체 선수와 비교했을 때만큼 극단적인 수치는 아닙니다.

결론 플레이어 비교의 객관성 높이기

채용 분석가는 역할을 정의함으로써 역할 발견을 적용하여 각 역할의 매개변수에 맞는 선수를 보다 객관적으로 직접 비교할 수 있습니다. 이를 통해 스카우트 프로세스를 간소화하여 경기장에서 같은 포지션에서 뛰는 선수들을 동일하게 평가하는 것이 아니라, 그들이 수행하는 역할의 맥락에서 분석할 수 있습니다.

모델을 구성하는 요소에는 네 가지 주요 채용 고려 사항이 요약되어 있습니다:

  • 선수는 경기장에서 어디에서 플레이하나요? - 공간 발자국
  • 그들은 언제 중요한 기여를 할까요? - 플레이 스타일 참여도
  • 같은 역할을 맡은 다른 사람들과 비교했을 때 주요 기여도의 위험 보상 프로필과 품질은 어떤가요? - xP 및 점진적 PV 출력
  • 플레이어는 어떤 유형의 패스 동작에 관여하나요? - 움직임 체인 관련

또한 역할 발견은 현재 소속 클럽에서 뛰고 있는 포지션과 다른 역할이나 포지션의 핵심 속성을 가진 선수를 식별하는 데에도 사용할 수 있습니다. 이를 통해 분석가는 커리어 초기에 풀백에서 더 높은 포지션에서 활약하는 선수로 성장한 가레스 베일이나 필립 람과 같은 선수를 식별하는 데 도움이 될 수 있습니다.

역할 발견을 적용하여 특정 역할의 대체를 식별하는 방법을 보여주는 사례 연구는 올해 말 Stats Perform 웹사이트에 xP 및 이동 체인 등 이 개념을 뒷받침하는 모델에서 파생된 몇 가지 분석 사례와 함께 게시될 예정입니다.

역할 발견에 대해 더 자세히 알고 싶거나 지금까지 개발한 내용과 관련하여 궁금한 점이 있으면 여기로 문의해 주세요.