
1부는 여기에서 스토리를 확인하시기 바랍니다.
ChatGPT의 언어 모델과 트랜스포머는 스포츠에서 어떤 역할을 할 수 있나요?
챗봇을 넘어 스포츠에서 언어 모델과 생성 인공 지능이 자리 잡을 자리는 없을까요?
이에 대한 대답은 '그렇다'이며, 특히 축구에서 팀과 팬들에게 경기에 대한 더 깊은 이해를 제공할 수 있는 스포츠 분석의 차세대 혁명이라고 생각합니다.
먼저 스포츠 언어를 지정해야 합니다. ChatGPT에 필요한 입력인 텍스트의 경우 언어 가 이미 존재합니다. 앞서 살펴본 바와 같이 ChatGPT 언어 모델은 고유한 구조(글자, 단어, 문장, 단락)를 가진 원시 텍스트 데이터를 활용합니다. 트랜스포머 아키텍처는 문장, 단락 및 전체 스토리 내러티브 내의 문맥을 활용하여 누락된 단어를 예측함으로써 통계와 상관관계를 학습합니다.
스포츠 데이터는 고유한 언어 구조가 다릅니다. 예를 들어 축구에서는 11 대 11(또는 대부분의 경우 필드에 있는 선수 10명 대 필드에 있는 선수 10명)입니다. 이 선수들은 각각 역할이 있으며, 경기 중에 진화하거나 변경될 수 있습니다.
팀 내에서 경기 중 선수 정보를 표현하는 것은 매우 중요합니다. 각 선수는 하나의 글자(이름이나 유니폼 번호를 사용하는 대신 경기 중 위치와 통계, 최근 및 장기 경기 통계를 활용)라고 할 수 있으며, 각 경기 중 이벤트는 하나의 단어로 설명할 수 있으며, 이 단어의 순서를 정확히 맞춰야 해당 단어를 이해할 수 있습니다.
각 플레이는 하나의 문장이 될 수 있고, 각 소유물은 단락으로 볼 수 있습니다. 챕터는 경기가 될 수 있고 시즌은 책으로 볼 수 있습니다. 올바른 구조(또는 문법)를 만드는 것 외에도, 스포츠 데이터의 입력은 시공간적(즉, 선수 위치의 X와 O)이며 이벤트 기반(즉, 이벤트 유형과 소유권의 결과)이기 때문에 상당한 사전 처리가 필요합니다. 따라서 스포츠 데이터는 책이 아니라 영화라고 생각할 수 있으며, 입력은 단일 입력 소스가 아니라 멀티모달입니다.
이제 축구의 입력 언어가 정의되었으므로 이전에는 할 수 없었던 출력을 생성할 수 있는 '축구 언어 모델'을 학습할 수 있습니다. 이제 AI 챗봇이 사실을 '환각'하는 데 내재된 문제를 고려할 때, 어떤 질문에 대한 출력을 생성하는 것을 목표로 하는 대신 '스마트 프롬프트 엔지니어링'을 사용하여 이전에는 답변할 수 없었던 질문에 답할 수 있습니다. 스마트 프롬프트 엔지니어링에 대한 자세한 내용은 이 시리즈의 첫 번째 글을 참조하세요.
아래에서 다양한 실제 사례를 소개합니다.
Opta Vision
Opta Vision 컴퓨터 vision 데이터와 인간의 이벤트 데이터를 모두 활용하는 AI 데이터 피드입니다. 그런 다음 그래픽 신경망을 통해 처리하여 팀과 개별 선수의 의사 결정 및 실행 능력을 설명하는 모든 이벤트에 대한 예측을 제공합니다.
예를 들어, 기본 포메이션 표현(또는 언어)을 사용하면 팀이 어떤 포메이션(예: 4-4-2, 3-4-3, 4-3-3 등)을 사용하는지, 소유권 유무에 따라 어떻게 변하는지를 감지할 수 있습니다.
또한 매 프레임마다 플레이어의 역할을 지정할 수 있어 플레이어가 겹치는 시점이나 경기 중 전술적 변화가 있는지 확인할 수 있습니다.
동일한 기본 표현을 사용하여 플레이어가 패스를 할 가능성, 패스가 다음 10초 동안 득점 기회를 만들 확률을 예측하거나 올바른 옵션이었는지 평가할 수도 있습니다.
축구 언어 모델을 사용하면 각 문자를 개별적으로 예측하는 대신 가능한 모든 옵션을 동시에 예측, 즉 문장을 예측합니다. 이를 위해 모든 선수의 위치, 역동성 및 이벤트를 입력 시퀀스로 사용한 다음 이를 패스 난이도, 가용성 등에 해당하는 출력 시퀀스에 매핑합니다.
이전에는 각 선수의 옵션을 개별적으로 분석했지만, 대규모 축구 언어 모델링 접근 방식을 사용하여 이제 모든 선수를 한 번에 분석할 수 있습니다. 이는 각 이벤트에 대한 각 선수의 의사 결정 능력을 이해하는 데 분명히 유용하지만, 유사한 접근 방식을 사용하여 경기가 끝날 때 각 선수의 통계를 예측할 수도 있습니다.
트랜스포머 기반 플레이어 성과 예측
여러분이 축구 코치이고 경기 중 어떤 선수가 경기 결과를 바꾸는 데 가장 큰 영향을 미칠지 알고 싶다고 상상해 보세요. 이전에는 선수의 경기력을 예측할 때 다른 선수나 상대 선수와는 별개로 예측했습니다. 저희는 방대한 축구 데이터 데이터베이스와 트랜스포머 접근 방식을 사용하여 모든 선수와 팀의 결과를 동시에 예측할 수 있는 모델을 만들었습니다.
다시 기계 번역의 비유를 사용하자면, 게임 시작 시(또는 경기 중) 선수와 팀 정보의 입력 시퀀스를 입력 시퀀스로 매핑하는 것입니다. 그런 다음 트랜스포머 네트워크를 사용하여 이를 가장 가능성이 높은 출력 시퀀스(이 경우 최종 경기 통계)에 매핑합니다. 트랜스포머 네트워크의 장점은 보이지 않는 상황까지 빠르게 일반화할 수 있다는 점입니다. 축구에서는 정규 시즌의 팀이 홈과 원정을 오가며 경기를 치르고, 라인업은 물론 감독도 달라지고, 최근 성적도 달라지는 경우가 많기 때문에 이러한 상황이 흔히 발생합니다.
이는 새로운 혁신이며, 2023년에 이 기술의 위력을 선보일 예정입니다. 이 모델을 학습시키기 위해 1.5TB가 넘는 이벤트 데이터로만 구성된 고유한 딥 Opta 데이터베이스를 활용했습니다(대규모 추적 데이터 아카이브는 포함되지 않음).
고스팅
또한 유사한 기법을 활용하여 고스팅 기능을 향상시킬 수 있습니다(예: 이전에 공동 작업한 작품에서 플레이어가 있어야 할 위치를 시뮬레이션하는 것). 축구 와 농구).
이전 접근 방식에서는 지도 정책 네트워크를 학습하여 결정론적 방식으로 팀의 행동을 예측했지만, 언어 모델링의 발전으로 이전에는 볼 수 없었던 보다 창의적인 결과물(일부)을 생성할 수 있게 되었습니다. 하지만 코치/분석가가 결정론적 예측(즉, 어떤 일이 일어났는지)과 다른 방식으로 경기를 운영할 수 있는 방법을 선호하는 경우가 있다는 점에 유의할 필요가 있습니다.
데이터 수집
언어 모델링 사용의 또 다른 이점은 앞서 언급한 코딩 어시스턴트와 유사하게 스포츠 데이터 수집 프로세스에서 컴퓨터 vision 선수 및 공 추적 시스템 내에서 사용하거나, 인간 운영 또는 무결성 팀이 평가할 수 있도록 잠재적으로 잘못된 데이터 포인트를 강조하는 보조 도구로 사용할 수 있다는 점입니다.
결론
ChatGPT는 환상적으로 야심차고 놀랍도록 잘 실행되는 도구입니다. 다른 분야만큼 스포츠나 뉴스 보도에 직접적으로 많이 적용되지는 않았지만, 기본 생성 AI 접근 방식은 이미 Stats Perform 자체 개발한 스포츠 언어를 입력으로 사용하여 사용되고 있습니다. 이미 팀 성적 분야에서 많은 애플리케이션을 지원하고 있으며, 앞으로 스포츠 콘텐츠와 분석의 여러 측면을 보강할 것입니다.
패트릭 루시 박사는 스포츠 데이터 대기업인 Stats Perform 수석 과학자로, 회사의 방대한 스포츠 데이터의 가치를 극대화하는 것을 목표로 AI 팀을 이끌고 있습니다. Patrick은 지난 20년간 AI 분야에서 연구하고 일해 왔으며, 디즈니 리서치와 카네기멜론대학교 로봇공학연구소에서 연구직을 맡았고, 박사 학위를 취득하는 동안 IBM의 TJ 왓슨 연구 센터에서 시간을 보냈습니다. Patrick은 호주 출신으로 서던퀸즐랜드대학교에서 공학사(EE) 학위를, 퀸즐랜드공과대학에서 박사 학위를 받았습니다. 그는 100편 이상의 동료 심사 논문을 저술했으며 MIT 슬론 최우수 연구 논문 트랙의 공동 저자로 2016년 최우수 논문, 2017년과 2018년에는 준우승을 차지한 바 있습니다.