로리나스 라우도니우스는 Stats Perform 프로 Forum 학부생이 제출한 제안서 중 가장 뛰어난 제안서를 선정하는 개리 젤라드 박사상의 첫 번째 수상자였습니다.
수상 후 로리나스는 2021년 가상 이벤트에서 포스터 프레젠테이션을 통해 보로노이 셀과 기타 방법을 사용해 개별 플레이어가 팀의 성공적인 역습에 어떻게 기여하는지 시공간 데이터를 적용하여 정량화한 프로젝트의 결과를 설명했습니다.
카운터 공격 평가 시 주관성 배제하기
역습에 대한 각 플레이어의 기여도를 객관적으로 정량화하는 것이 중요한 이유는 무엇인가요?
좋은 시작점은 육안으로만 고립된 역습 시나리오에서 가장 중요한 공헌을 한 플레이어를 찾아내 점수를 부여하는 것입니다.
다음 동영상을 시청하면서 어떤 플레이어의 기여가 가장 영향력이 있었는지, 그리고 그 이유는 무엇인지 생각해 보세요.
이 영상을 보셨다면, 이제 축구 선수가 하는 행동에 객관적으로 수치를 부여하는 것이 얼마나 어려운 일인지 이해하실 수 있을 것입니다. 이는 의심할 여지 없이 축구 분석의 가장 큰 도전 과제 중 하나입니다.
두 선수를 편견 없이 비교할 수 있는 모델을 만들면 스카우트, 팀 선발 및 기타 축구의 여러 분야에서 큰 도움이 될 수 있습니다.
제 모델은 추적 및 이벤트 데이터를 사용하여 계산된 네 가지 지표를 결합하고 이를 적용하여 상대 공격에 대한 선수의 기여도에 가치를 부여합니다. 패스에 가치를 부여하는 데 초점을 맞춘 기존의 축구 관련 연구는 많지만, 이 모델은 한 걸음 더 나아가 모든 행동을 공헌도로 결합하여 가치를 부여합니다. 다소 유사한 모델이 개발되었지만 머신 러닝 모델로 학습되어 별도의 지표를 많이 포함하지 않습니다.
또한, 이 프로젝트는 지금까지 데이터 과학자와 연구자들로부터 거의 주목을 받지 못했던 공격 시나리오의 하위 집합인 카운터 공격에 초점을 맞추고 있습니다.
기여 정의하기
이 프로젝트에 사용된 모델은 플레이어가 수행하는 다양한 유형의 공격 동작을 구분하지 않고 모두 공헌으로 결합합니다. 기여도는 본질적으로 한 쌍의 게임 내 소유권 상태(특정 시점에 모든 선수와 공의 경기장 내 위치)로, 첫 번째는 선수가 공을 처음 터치하는 순간부터, 두 번째는 팀 동료가 공을 터치하는 순간부터(그리고 차례로 자신의 기여를 시작하는 순간부터) 시작됩니다. 이 두 가지 게임 내 소유 상태의 차이는 '선수가 공을 소유하고 있는 동안 상황에 어떤 영향을 미쳤는가'라는 질문에 대한 답을 제공합니다.
기여도의 정확한 점수 도출하기
두 가지 소유 상태의 차이는 객관적으로 수치를 할당할 수 있는 방법이 없다면 큰 의미가 없습니다. 이를 위해 추적 및 이벤트 데이터에서 파생된 4개의 개별 지표를 설계하고 구현했습니다:
1. 거리
이것은 네 가지 지표 중 가장 직관적인 지표입니다. 예를 들어 선수가 자신의 3번째 페널티 박스에서 상대 페널티 박스까지 공을 운반하면 공격이 더 위험해지는 데 많은 기여를 한 것이 분명합니다. 따라서 그들의 기여도는 높은 평가를 받아야 합니다. 이를 정확히 측정하기 위해 이 모델은 선수가 처음 공을 잡았을 때 공과 골대 사이의 유클리드 거리를 계산하고, 선수의 행동(즉, 패스 시도)이 끝났을 때 같은 거리를 계산합니다. 이 둘의 차이는 플레이어의 참여로 인해 공이 골대에 얼마나 가까워졌는지를 알려주며, 따라서 지표의 값이 됩니다. 플레이어가 공을 골대에서 더 멀리 가져갈 수 있으므로 음수 값도 지정할 수 있습니다.
2. 위험
거리 지표를 기반으로 공이 골대에서 얼마나 멀리 떨어져 있는지뿐만 아니라 플레이어의 행동에 따라 공이 경기장에서 정확한 위치에 있는지를 설명할 수 있습니다.
경기장 내 여러 구역의 위험도를 평가하는 것은 축구 공격의 위험성에 대한 연구에서 Daniel Link 등이 심도 있게 연구한 주제입니다. 이들의 연구는 공격하는 3분의 1을 2×2미터 정사각형으로 나눈 다음 각 정사각형에 0과 1 사이의 위험 점수를 부여할 것을 제안합니다(아래 그림 1 참조).
정확한 값을 계산하기 위해 5가지 주요 규칙을 따릅니다:
a) 목표와의 거리가 멀어지고 중심이 멀어질수록 위험은 증가합니다.
b) 페널티 지역으로 이동하면 수비팀이 페널티킥을 실점할 위험이 갑자기 증가합니다.
c) 골대 앞에 위험이 더 이상 증가하지 않는 균일한 영역이 있습니다.
d) 골대를 향한 각도가 예리하면 위험이 줄어듭니다.
e) 페널티 지역 측면은 오프사이드의 위험이 거의 없는 크로스가 발생할 수 있기 때문에 위험합니다.
3. 압도적인 플레이어
거리 및 위험 지표는 정보를 제공하지만, 기본적으로 볼 위치만을 기준으로 합니다.
만약 한 선수가 하프라인에서 골로 연결되는 경로가 명확하다면 어떨까요? 앞의 두 지표만 놓고 보면 상대 선수의 압박이 거의 없더라도 그 선수의 기여도가 크게 평가될 것입니다. 따라서 선수의 행동을 평가할 때는 상대 수비에게 어떤 영향을 미치는지 고려하는 것이 중요합니다.
이것이 바로 세 번째 지표가 측정하는 것입니다. 좀 더 구체적으로 설명하자면, 이 지표는 플레이어의 행동 중에 공 뒤에 있는 상대 선수의 수를 계산합니다. 골키퍼는 대부분의 시간 동안 공 뒤에 머물기 때문에 이 지표에는 포함되지 않습니다.
4. 공간 제어
한 연구에서 한 팀의 성공과 골대에서 30미터 떨어진 상대팀 하프의 공간을 얼마나 많이 장악했는지 사이의 관계를 탐구했습니다. 2010년대 초반 바르셀로나나 보루시아 도르트문트처럼 성공한 많은 팀들이 상대팀 하프의 넓은 공간을 장악했으므로, 통제 공간을 넓히는 데 기여한 선수에게 더 높은 가치를 부여하는 것이 합리적이라는 결론을 내렸습니다.
이 프로젝트에서는 보로노이 셀을 사용하여 제어 공간을 측정합니다. 플레이어의 보로노이 셀은 경기장에서 다른 플레이어보다 더 가까이 있는 지점의 집합입니다.
자기 진영의 공간을 넓힌 선수가 반드시 역습에 기여하는 것은 아니기 때문에 경기장 전체에 걸쳐 공간을 계산하는 것은 그다지 유익하지 않습니다. 따라서 피치의 임계값(면적)을 선택하여 공간 제어가 고려되는 시점을 결정했습니다.
골대 앞의 다양한 구역을 대상으로 실험한 결과, 공간 통제력을 경기장의 마지막 쿼터 내에서만 측정할 경우 모든 선수의 공간 통제력 편차가 커져 선수의 기여도를 더 잘 구분할 수 있는 것으로 나타났습니다. 따라서 이를 모델의 임계값으로 설정했습니다.
지표 결합하기
플레이어 기여도당 단일 점수를 산출하기 위해 네 가지 지표를 결합했습니다. 첫 번째 단계는 모두 같은 범위로 정규화하는 것입니다. 여기서는 [-1;1]이 선택되었습니다. 그런 다음 기여도에 대한 점수를 합산하고 2.5를 곱하여 -10에서 10 사이의 점수를 얻습니다. 이렇게 하면 기여도에 할당된 최종 점수가 결정됩니다.
애플리케이션
방법론을 정립했으니 이제 이 모델을 경기의 임의적인 플레이 흐름에 어떻게 적용할 수 있는지 보여줄 필요가 있습니다.
2014 코파 델 레이에서 가레스 베일의 역습 득점처럼 비교적 복잡하지 않은 패스는 기여도에 따라 점수를 배분하는 것이 다소 간단하지만, 새로운 선수가 플레이에 참여할 때마다 이 문제는 기하급수적으로 어려워집니다.
이 모델은 이러한 문제를 해결할 수 있습니다.
이 글의 시작 부분에서 보여드린 비디오 예시로 돌아가 보겠습니다. 이 새로운 버전의 클립에서는 각 기여가 끝날 때마다 영상을 일시 정지하고 모델이 그 기여를 어떻게 평가했는지 표시합니다.
아래 막대형 차트에는 이 카운터 공격 동안 기여도에 할당된 값이 요약되어 있습니다.
처음에 이 특정 카운터 공격에서 어떤 플레이어의 기여도가 가장 큰 영향을 미치는지 고려했을 때, 이 모델에서 도출한 값과 비슷한지 알아보는 것은 흥미로울 것입니다.
이제 방법론에 대해 설명했으니 재미를 위해 동일한 연습을 다시 해보되 이번에는 각 기여도에 점수를 할당할 때 네 가지 지표를 고려해 보겠습니다.
클립을 시청한 후 아래 동영상을 클릭하여 모델이 기여한 기여도를 확인하고 자신의 기여도와 비교해 보세요.
다음 막대형 차트에는 각 카운터 공격 기여도의 값이 요약되어 있습니다.
이 예에서는 6번 선수의 기여도를 강조할 가치가 있습니다. 모델에 따르면 그의 기여도가 가장 커서 합산 점수가 거의 5점에 달합니다. 하지만 프로 Forum 이 동영상을 대표자들에게 보여줬을 때 사람들은 8번 선수나 9번 선수의 기여도가 가장 높다고 생각하는 경향이 있었습니다. 이는 육안으로만 공격 단계에 대한 선수의 기여도를 정량화하려는 주관성을 강조하는 것입니다.
또한 반복되는 매칭 시나리오를 평가할 때 편견을 줄이기 위한 이러한 유형의 연구가 잠재적으로 매칭 분석 프로세스를 개선하고 채용 프로파일링에 정보를 제공할 수 있다는 점을 더욱 강조합니다.
참조
타바레스, 리카르도. (2019). 축구에서 보로노이 다이어그램 사용하기.
Link, D., Lang S., Seidenschwarz P. 2016. 시공간 추적 데이터를 이용한 축구의 위험성 실시간 정량화.
Rein, R., Raabe D., Memmert D. (2017). "어떤 패스가 더 나은가?" 엘리트 축구에서 패스 효과를 평가하는 새로운 접근법. 인간 운동 과학 55.
Perl, J. & Memmert, D. (2017). 공간과 볼 컨트롤에 기반한 축구의 공격 성공에 대한 파일럿 연구 - 핵심 성과 지표 및 게임 역학 이해의 핵심.
리투아니아 출신인 라우리나스 라우도니우스는 올해 초 맨체스터 대학교에서 컴퓨터 공학을 전공했습니다. 현재 스위스에 거주하고 있으며, 이전에는 리투아니아 1부 리그 팀인 FK 카우노 잘기리스에서 경기 분석가로 일한 바 있습니다.


