주요 콘텐츠로 건너뛰기

현대 풀백의 플레이 스타일 분류하기

기준: Stats Perform

마크 캐리와 믈라덴 소르마즈가 2018 옵타프로 애널리틱스 Forum 포스터 발표를 진행했습니다. 이 기사에서는 이들의 분석에 대한 심층적인 내용을 확인할 수 있습니다. 두 사람의 포스터는 여기에서 확인할 수 있습니다:

포스터 1 보기

포스터 2 읽기 

 

최근 몇 년 동안 풀백의 역할이 극적으로 변화하면서 유럽 전역의 많은 팀들이 수비를 지키는 것보다 풀백을 어떻게 공격에 참여시킬 수 있는지에 더 많은 초점을 맞추고 있습니다. 실제로 지난 시즌 첼시가 프리미어리그 우승을 차지할 때 안토니오 콘테 감독의 3-5-2 포메이션이 큰 효과를 거두면서 윙백의 활용이 다시 유행처럼 번지고 있는 것 같습니다. 하지만 유럽 전역에서 풀백들의 다양한 플레이 스타일을 주관적으로 관찰하는 것이 아니라 정량화할 수 있을까요?

최근 몇 시즌 동안 풀백의 플레이 스타일이 매우 다양해졌기 때문에 풀백에 초점을 맞추었지만, 이 방법은 모든 포지션에 적용될 수 있습니다. 저희는 풀백의 다양한 프로필을 보다 상세하고 객관적으로 측정하여 개별 통계보다는 선수의 스타일에 대한 보다 넓은 차원을 고려하고자 했습니다. 이를 위해 먼저 Opta F9 데이터(경기 총합 집계)를 사용하여 데이터의 차원을 줄이고 분석에 입력한 풀백의 광범위한 프로필을 파악하기 위해 주성분 분석(PCA)을 베리맥스 로테이션으로 실행했습니다(PCA 분석에 대한 자세한 내용은 여기에서 확인할 수 있습니다). 다음 단계는 이 정보를 사용하여 플레이 스타일이 서로 가장 유사한 풀백을 정량화하는 것이었습니다.

숫자

2015/16 시즌과 2016/17 시즌 '빅 5' 유럽 대회의 풀백 417명을 분석했습니다. 두 시즌에 걸쳐 안정적인 프로파일을 보인 PCA를 바탕으로 2016/17 시즌 데이터를 군집 분석에 입력했습니다. 프로필이 비슷하거나 관련성이 있는 선수는 함께 배치하고 프로필이 다른 선수는 분리했습니다. 리그 간 선수 비교는 어렵다는 점에 유의해야 하며, 분석 내에서 이를 보정하기 위해 최선을 다했습니다.

분석 결과는 매우 흥미로웠는데, 성적 통계를 기반으로 11개의 선수 클러스터가 생성되었습니다(그림 1 참조). 중요한 점은 플레이 스타일에 따라 함께 묶일 것으로 예상되는 유명 선수들이 실제로 같은 클러스터에 속한다는 점입니다(예: 마르셀로, 알렉스 산드로, 다비드 자파코스타). 이는 분석의 신뢰성을 강조하고 '안목 테스트'를 통과한 것입니다. 아래 그림 1은 더 넓은 그룹과 더 구체적인 하위 그룹을 생성하며, 각 선은 개별 선수를 나타냅니다.

저희는 모든 플레이어를 '스타일 파트너'와 매칭한 다음, 트리의 맨 위에 도달할 때까지 해당 쌍을 다른 쌍 및 그룹과 반복적으로 비교하여 그룹을 확장하는 응집 방법을 사용했습니다. 다시 설명하자면, 아래 선(한 플레이어를 나타내는) 사이의 거리는 플레이 스타일의 유사성을 나타냅니다.

 

 

그림 1: 풀백 클러스터 분석

기존에는 나뭇가지를 일정한 높이로 잘라 덴드로그램에 클러스터가 몇 개 있는지 확인하는 방법이 있었습니다. 여기서는 그렇게 하지 않았는데, 나무를 자르든 자르지 않든 나무 위로 올라갈수록 플레이어의 유사성이 줄어든다는 원칙은 그대로 유지되기 때문입니다. 그림의 가독성을 높이기 위해 가지에 색을 입혔지만, 그 방법을 알고 싶다면 '계층적 클러스터 트리에서 클러스터 정의하기'라는 제목의 좋은 논문이 있습니다: R용 동적 트리 컷 패키지'라는 제목의 논문이 있습니다.

각 클러스터의 몇 가지 예는 아래에서 볼 수 있습니다. 앞서 설명한 것처럼 함께 클러스터링된 선수들은 축구적으로 의미가 있지만, 클러스터링 알고리즘은 축구에 대한 지식이 없다고 가정하기 때문에 이러한 결과는 분석의 신뢰성을 높여줍니다.

 

 

어떻게 사용할 수 있나요?

클러스터 분석의 가장 큰 장점은 편견이나 사전 축구 지식 없이도 플레이 스타일이 가장 유사한 선수들을 객관적으로 정량화하고 그룹화할 수 있다는 점입니다. 이는 이적 시장에서, 특히 재정 예산이 부족한 축구 클럽에 큰 도움이 될 수 있습니다. 예를 들어, 클럽은 자신의 플레이 스타일에 맞는 선수의 프로필에 대한 이적 후보 명단을 만들 수 있습니다. 또한 채용 담당자는 이상적인 선수(예: 마르셀로)를 파악하고 이 모델을 사용하여 더 저렴한 가격에 비슷한 선수(예: 크리스티안 안살디)를 여러 명 탐색할 수 있습니다. 이는 위의 덴드로그램에서 선수를 검색하고 '트리 위로 이동'하여 해당 선수와 가장 유사한 선수를 탐색하면 간단하게 확인할 수 있습니다. 트리 위로 올라갈수록 선수의 프로필이 덜 유사하지만, 구단은 예산과 필요한 정확한 프로필 사이에서 타협해야 할 수도 있습니다.

클럽 환경 내에서 선수의 프로필을 보다 현실적으로 시각화하는 방법으로 특정 속성을 기반으로 선수의 강점과 약점을 평가할 수 있는 레이더 차트 예시를 제공했습니다(그림 2 참조). 이 차트는 두 명의 이적 대상을 비교하거나 잠재적 영입 대상과 클럽에 이미 보유하고 있는 선수를 비교하는 데 사용할 수 있습니다.

아래 예에서 볼 수 있듯이 라이언 버트랜드의 특성은 좋은 수비에 기반을 두고 있으며, 가능한 한 공격에 효과적으로 가담합니다. 반면에 대니 로즈는 수비력이 뛰어나지는 않지만 볼을 더 많이 볼 수 있고 팀에 더 많은 기회를 제공할 가능성이 높습니다. 이는 구단이 이적 계획에서 내릴 수 있는 결정의 한 예이며, 클러스터링 알고리즘을 기반으로 하는 이 도구를 사용하면 객관적인 방법이 될 수 있습니다.

 

그림 2: 레이더 차트의 척도는 각 차원에 대한 플레이어의 백분위수 순위를 나타냅니다. 분석에 입력된 모든 플레이어에서 가져온 값입니다.

요약

전 세계 리그의 더 많은 데이터에 액세스할 수 있는 이 모델은 클럽의 이적 정책에서 더욱 강력한 경쟁력을 제공할 수 있습니다. 이 모델은 클럽에서 시즌 내 또는 시즌 사이에 쉽게 구현하고 업데이트할 수 있는 빠르고 비용 효율적인 방법을 제공합니다. 물론 분석이 항상 그렇듯이 이 모델은 현재 존재하는 일반적인 스카우팅 방법을 보조하는 유용한 도구로 구현할 수 있으며, 이를 완전히 대체할 수는 없다는 점을 강조합니다. 이 모델이 제공하는 것은 편견 없이 잠재적인 이적 대상을 객관적으로 파악하여 스카우트 담당자에게 보고할 수 있는 좋은 근거입니다. 실제로 이 방법은 기존 스카우트와 분석가 사이에 대상 선수의 주관적 프로필이 통계적 프로필과 일치하는지 여부를 판단하기 위한 좋은 보정 수단으로 사용될 수 있습니다. 유럽 전역의 치솟는 선수 가격을 고려할 때, 이 모델을 사용하면 이적 시장에서 구단이 많은 돈을 절약하고 지난 수년간 많은 팀을 괴롭혀온 '패닉 바이'를 피할 수 있는 필터링 메커니즘을 제공할 수 있습니다.

 

올해 옵타프로 Forum 이 작업을 발표했을 때 매우 긍정적인 피드백을 받았습니다. 자세한 내용은 마크와 믈라덴의 트위터( @MarkCarey93@Mladen_Sormaz)를 통해 확인할 수 있습니다.