주요 콘텐츠로 건너뛰기

네트워크 과학을 활용한 축구 팀의 식별 가능성 정량화

 

하비에르 불두와 데이비드 가리도가 Stats Perform 게스트 블로그에서 2017/18 라리가 시즌의 이벤트 데이터를 적용한 연구 프로젝트의 결과를 발표하며, 한 팀이 한 시즌 동안 자신의 경기 스타일을 얼마나 유지하는지를 파악하는 것을 목표로 삼았습니다.

 

기준: Stats Perform

하비에르 불두와 데이비드 가리도는 2020 옵타프로 Forum Opta 데이터를 사용해 패스 패턴의 지속성을 기반으로 한 시즌 동안 팀의 플레이 스타일이 어떻게 유지되는지 정량화하는 네트워크 과학 접근법을 소개하는 포스터 발표를 진행했습니다.

이 게스트 블로그에서는 프레젠테이션의 방법론에 대한 개요와 함께 주요 결과를 요약하여 설명합니다.

클릭 여기를 를 클릭하여 포스터를 확인하세요.

복잡한 시스템으로서의 축구 팀 소개

"복잡한 시스템은 서로 상호 작용할 수 있는 여러 구성 요소로 구성된 시스템입니다. 복잡한 시스템은 각 부분 간 또는 특정 시스템과 환경 간의 의존성, 경쟁, 관계 또는 기타 유형의 상호 작용으로 인해 본질적으로 동작을 모델링하기 어려운 시스템입니다."

뇌, 지구 기후 및 생태계는 복잡한 시스템의 명백한 예입니다. 축구도 이러한 방식으로 분류할 수 있는 강력한 사례를 가지고 있다고 주장할 수 있습니다.

왜 그럴까요?

축구 경기 중에는 선수라고 불리는 22개의 구성 요소가 복잡한 방식으로 서로 상호작용하며 의존성을 만들고, 경쟁하며, 더 중요한 것은 '플레이 패턴' 과 같은 새로운 속성을 생성합니다. 이러한 이유로 복잡성 과학은 축구 데이터 세트를 분석할 수 있는 실행 가능한 대안으로, 아름다운 경기의 분석에 새로운 관점을 도입합니다.

그 이유는 복잡성 과학의 기본 패러다임을 의역하면 "축구의 구성 요소(즉, 선수)를 개별적으로 보면 분석할 수 없고, 반대로 시스템 전체를 고려해야만 분석할 수 있는" 축구의 복잡한 특성에 있습니다. 경기에서 가장 성공한 선수조차도 "나만이 아니라 팀"이라는 사실을 인식합니다.

팀 활동을 복잡한 네트워크로 해석하는 것은 복잡성 과학에 기반한 여러 접근법 중 하나입니다. 패스를 통한 선수들 간의 상호 작용을 고려하여 팀의 조직을 분석할 수 있습니다. 전체 경기 동안 공이 선수와 선수 사이에서 어떻게 이동했는지에 대한 정보를 포함하는 패스 네트워크를 구성할 수 있습니다.

통과 네트워크가 '복잡한 네트워크'인 이유는 크게 두 가지입니다:

1. 노드(플레이어)와 노드 간의 링크(패스)로 구성됩니다;

2. 노드 간의 상호 작용은 특정 "복잡한" 규칙을 따릅니다.

또한 이러한 네트워크는 방향성이 있고(즉, 플레이어 간의 링크가 일정한 방향을 가지고 있음), 가중치가 있으며(링크의 가중치는 플레이어 간의 패스 횟수), 공간적으로 내재되어 있고(즉, 공과 플레이어의 유클리드 위치가 매우 연관성이 높음), 시간이 지남에 따라 네트워크의 구조가 지속적으로 변화한다는 점에서 분석이 쉽지 않습니다.

아래 그림 1은 2017/18 시즌 바르셀로나와의 경기 중 레알 마드리드의 패스 네트워크의 예를 보여줍니다. 그림에서 선수의 크기는 패스 네트워크에서 차지하는 중요도에 비례합니다. 플레이어는 패스가 이루어진 평균 위치에 배치되어 있습니다. 링크의 너비는 두 선수 사이의 패스 횟수에 비례합니다. 마지막으로 교체는 녹색으로 강조 표시됩니다.

이 그래픽을 통해 레알 마드리드의 경기 방식, 경기장 점유 방식, 선수들 간의 상호 작용, 교체 후 조직이 어떻게 변화했는지를 빠르게 파악할 수 있습니다.

그림 1: 패싱 네트워크의 개략도, 2017/2018 시즌 레알 마드리드 대 바르셀로나.

이는 팀 활동을 네트워크로 변환하면 팀 조직을 이해하는 데 어떻게 도움이 될 수 있는지에 대한 스냅샷일 뿐입니다. 다양한 공간적, 시간적 규모에서 네트워크 구조에서 다양한 지표를 추출할 수 있으므로 팀이 어떻게 조직되고 플레이어가 팀의 성과에 어떻게 기여하는지를 더 잘 이해할 수 있습니다(Buldú et al., 2018).

이는 네트워크 구조와 역학을 분석하는 복잡성 과학의 한 분야인 네트워크 과학의 과제입니다. 네트워크 과학은 아직 축구 데이터 분석에 완전히 적용되지는 않았지만, 앞으로 몇 년 안에 경기력에 대한 새로운 관점을 제공할 잠재력을 가지고 있습니다.

피치 패싱 네트워크

패스 네트워크를 만드는 다른 방법도 있습니다. 선수의 역할이 아닌 팀의 공간적 조직에 더 관심이 있다면 경기장 패스 네트워크를 구성하고 분석할 수 있습니다. 이 경우 네트워크의 노드는 선수별이 아니라 경기장의 특정 영역이며, 해당 영역을 점유하고 있는 선수의 패스를 통해 연결됩니다.

그림 2는 바르셀로나의 레알 마드리드와의 피치 패스 네트워크의 예를 보여줍니다.

그림 2: L에서 R까지의 플롯은 바르셀로나의 3×3, 5×6 및 10×10 패싱 네트워크로, 노드는 피치의 영역을 나타내고 링크는 노드 간의 패스 수를 나타냅니다.

왜 하나의 네트워크가 아닌 3개의 네트워크를 플롯하나요? 그 이유는 피치를 서로 다른 크기의 영역으로 분할하여 서로 다른 규모의 피치 네트워크를 만들 수 있기 때문입니다. 이러한 방식으로 그림 2의 세 네트워크는 동일한 경기 동안 동일한 팀에 해당하며 유일한 차이점은 파티션의 크기뿐입니다. 그러나 구단의 수에 따라 네트워크의 구조가 달라지므로 다양한 규모의 네트워크 속성에 대한 분석이 필요합니다.

축구 팀의 식별 가능성

이제 프레임워크를 정의했으니 이제 질문을 할 차례입니다:

  • 팀의 플레이 스타일이 어느 정도인지 정량화할 수 있나요?
  • 어떤 팀은 상대 팀에 적응하고 어떤 팀은 자신의 스타일에 충실할까요?
  • 경기 중 어떤 팀이 상대방에게 자신의 스타일을 강요하는지 정량화할 수 있나요?
  • 원정 경기에서는 어떤 팀이 다르게 행동하나요?

이 모든 질문에 답하기 위해 네트워크 과학을 적용하여 피치 패싱 네트워크의 조직을 분석했습니다.

경기의 이벤트 데이터를 사용하여 각 팀과 관련된 다중 규모의 패스 네트워크를 구성하고 네트워크 과학의 다양한 방법론을 사용하여 그 구조를 분석했습니다.

이러한 방식으로 식별할 수 있었습니다:

  • 어떤 팀이 상대 팀에게 자신의 플레이 스타일을 강요했는지 알아보세요;
  • 경기 전 상대방에게 기대할 수 있는 사항;
  • 팀이 예상한 대로 플레이했는지 평가하는 방법.

저희는 슈팅, 골, 태클, 드리블 또는 기타 동작을 무시하고 각 팀이 공을 패스한 방식만을 유일한 정보원으로 삼았습니다. 하지만 앞으로 살펴볼 것처럼 패스 패턴은 여전히 팀 조직의 본질을 파악할 수 있습니다.

피치를 n x m 영역( n =1,2,3,...10m =1,2,3,.. . 10)으로 나누고 피치 통과 네트워크를 구성했는데, 여기서 노드는 피치의 N=(nxm) 영역에 해당하고 aij는 영역 i에서 영역 j로의 통과 횟수를 설명합니다.

전체 시즌에 걸쳐 다양한 공간 규모에서 결과 연결 행렬 A{aij}의 속성을 분석했습니다. 연결 행렬의 요소는 각 팀의 패스 패턴을 수학적으로 추상화한 것으로, 경기장 구역 간 패스 횟수입니다. 시즌 동안 특정 팀의 연결 행렬이 얼마나 유사한지를 정량화하여 각 팀의 일관성 매개변수(C) 를 계산했습니다.

즉, 일관성이 높은 팀은 시즌 내내 패스 네트워크의 구조를 유지한 반면, 일관성이 낮은 팀은 경기마다 조직을 변경했습니다.

다음으로, 각 팀의 패스 네트워크가 얼마나 독특한지 정량화했습니다. 이는 특정 팀의 패스 네트워크 구조를 대회에 참가한 다른 팀들의 패스 네트워크 구조와 비교하여 측정할 수 있습니다. 이 매개변수를 라이벌 유사성 R이라고 합니다. 마지막으로 팀의 식별 가능성 매개변수(I)일관성 매개변수 C에서 라이벌 유사성 R을 뺀 값, 즉 I=C-R로 정의했습니다 .

식별 가능성 매개변수가 높은 팀은 일관성이 있으면서 동시에 다른 팀과 차별화되는 팀입니다.

저희의 방법론은 설명적인 측면과 향후 적용 가능성이 모두 있습니다. 한편으로는 시즌 내내 자신의 플레이 스타일을 유지한 팀("높은 식별 가능성")과 반대로 일관된 스타일을 유지하지 못한 팀("낮은 식별 가능성")을 식별할 수 있었습니다.

라리가와 협력하여 2017/18 시즌 스페인 1부 리그 팀들의 식별 가능성 매개변수를 계산했습니다.

그림 3은 각각 1위와 2위를 차지한 팀인 바르셀로나와 말라가의 식별 가능성 값을 보여줍니다. 앞서 설명했듯이 모든 척도를 분석해야 하기 때문에 가로축에는 피치가 분할되는 노드 수를 표시했습니다. 흥미롭게도 약 50개 영역(노드)의 피치 분할이 바르셀로나의 플레이 스타일을 더 잘 파악하는 데 도움이 되는 것으로 나타났습니다. 말라가의 경우, 모든 규모에서 식별성이 다소 낮다는 것을 알 수 있습니다.

그림 3: 왼쪽의 그래픽은 경기장의 디비전(노드) 수를 기준으로 바르셀로나의 식별 가능성 파라미터를 표시합니다. 오른쪽에는 말라가에 대해 동일한 분석 결과가 표시됩니다.

애플리케이션

결정적으로, 이 정보는 코칭 팀이 상대방의 예상 접근 방식을 파악하여 경기를 준비하는 데 도움이 될 수 있습니다.

예를 들어, 한 팀이 다음 상대의 식별 가능성을 평가하여 상대의 플레이 스타일에 따라 자신의 접근 방식을 조정할지(상대 팀의 식별 가능성이 높은 경우), 아니면 자신의 스타일을 강요할지(식별 가능성이 낮은 팀을 상대하는 경우)를 결정할 수 있습니다.

또한 식별 기능을 사용하여 매 경기마다 어떤 팀이 자신의 스타일과 가장 유사한 플레이를 했는지 정량화할 수 있습니다.

표 1은 2017/2018 라리가 시즌 동안 홈팀과 원정팀 간의 경기별 식별성 차이를 보여줍니다.

세로축에 표시된 홈 팀이 자신의 플레이 스타일을 강요한 경기(즉, 식별 가능성이 더 높았던 경기)는 노란색으로 강조 표시되어 있으며, 녹색 셀은 원정 팀이 자신의 스타일을 강요한 경기에 해당합니다. 식별 가능성과 팀 성적 사이의 연관성을 보여주기 위해 최종 리그 순위를 기준으로 팀을 정렬했습니다. 노란색 셀은 주로 대각선 매트릭스 라인 위에 나타나며, 두 팀이 경기를 할 때 더 높은 순위에 있는 팀이 자신의 플레이 스타일을 강요할 확률이 더 높다는 것을 나타냅니다.

개별 팀을 살펴보면 바르셀로나가 홈과 원정 모두에서 더 많은 경기에서 '식별 가능성 경쟁'에서 승리했고 레알 마드리드가 그 뒤를 바짝 쫓고 있음을 알 수 있습니다. 그러나 경기에서 패한 팀의 식별 가능성이 더 높았던 경기도 있기 때문에 식별 가능성의 차이가 항상 경기 결과를 나타내는 지표는 아니라는 점을 강조할 필요가 있습니다. 내 방식대로 플레이한다고 해서 항상 성공을 보장할 수 없는 것이 축구의 특성입니다.

표 1: 홈 팀은 세로축에 나열되며, 최종 리그 순위에 따라 정렬됩니다. 원정 팀은 가로축에 같은 방식으로 배열됩니다. 각 셀 안에는 경기 결과가 표시됩니다. 노란색은 홈 팀이, 녹색은 원정 팀이 자신의 스타일을 강요한 경기입니다. 파란색 셀은 양 팀의 식별 가능성에 명확한 차이가 없는 경기에 해당합니다.

결론적으로, 경기가 진행되는 동안 식별 가능성 매개변수를 실시간으로 추정하여 팀 또는 상대가 예상대로 플레이하고 있는 시점을 강조할 수 있다는 점도 강조할 가치가 있습니다. 이는 벤치에서 게임 내 주요 의사 결정에 영향을 줄 수 있는 귀중한 정보입니다.

이 방법론을 추가로 적용하면 분석가들은 홈과 원정 경기에서 어떤 팀이 다르게 행동하는지 평가하거나 경기 중 팀의 예상 패스 패턴에서 벗어나는 부분을 파악할 수 있습니다.


참조

Buldú, J. M., Busquets, J., Martínez, J. H., Herrera-Diestra, J. L., Echegoyen, I., Galeano, J., & Luque, J. (2018). 네트워크 과학을 사용하여 축구 패스 네트워크 분석 : 역학, 공간, 시간 및 게임의 다층적 특성. 심리학의 프론티어, 9, 1900.

Buldú, J. M., Busquets, J., & Echegoyen, I., & F. Seirul.lo (2019). 역사적인 축구팀 정의하기: 네트워크 과학을 사용하여 과르디올라의 FC 바르셀로나 분석. 자연 과학 보고서, 9(1), 1-14.


응용 물리학 박사 학위를 취득한 하비에르 불두는 마드리드 킹 후안 카를로스 대학교의 복합 시스템 그룹의 코디네이터이자 생의학 기술 센터의 생물학적 네트워크 연구소의 수석 연구원으로 활동하고 있습니다.

이메일( javier.buldu@urjc.es)을 통해 연락할 수 있습니다.

데이비드 가리도는 스페인 마드리드에 있는 킹 후안 카를로스 대학교의 바이오메디컬 기술 센터에서 박사 과정을 밟고 있는 학생입니다.