
2022년 11월, 인공 지능 연구소인 Open AI 전 세계적으로 큰 인기를 끌었던 ChatGPT AI 애플리케이션을 출시했습니다. ChatGPT 기술을 구동하는 기술은 GPT-3(또는 더 정확하게는 GPT-3.5)라는 대규모 언어 모델(LLM)입니다. LLM이 무엇인지, 이 기술에 대한 설명과 스포츠와의 관계에 대해서는 여기에서 2부로 구성된 시리즈를 확인하세요(1부 & 파트 2). 몇 주 전, OpenAI는 새로운 대규모 언어 모델(LLM)인 GPT-4를 출시했습니다. OpenAI에 따르면 이 새로운 모델은 이전 LLM보다 더 많은 작업을 수행할 수 있고 더 정확하다고 합니다. 하지만 사람들을 놀라게 한 것은 이미지 이해 기능의 도입이었는데, 특히 OpenAI의 공동 창립자가 농담 웹사이트의 디자인 도면을 업로드했을 때[링크] 더욱 그러했습니다. 그 뒤를 이어 며칠 후 구글은 리서치 모드의 챗봇 '바드'를 출시했습니다. 이 두 가지 최신 릴리스가 무엇을 할 수 있는지 알 수 있는 좋은 개요 기사가 많이 있지만, 이 글에서는 GPT-4 모델이 스포츠에 어떤 영향을 미치는지에 대해 설명합니다. 여기에 공유된 생각은 지난 달 MIT 슬론에서 제가 발표한 내용을 요약한 것입니다(여기에서 요약) 컨퍼런스와 Opta Forum 발표했던 내용을 요약한 것입니다.
GPT-4는 스포츠에서 ' Facts환각' 문제를 해결했을까요?
이전 글에서 스포츠에서 ChatGPT를 사용할 때의 주요 문제점을 강조했습니다: 1) 사실을 착각한다는 점, 2) 훈련된 데이터 세트의 컷오프가 2021년 9월이라는 점입니다. 첫 번째 문제에 대해 논의해 보겠습니다. 이미 언급했듯이 GPT-4가 더 정확할 것으로 예상되므로 이전 글에서 사용한 예시를 살펴보겠습니다(참고로 2019 럭비 월드컵에서 체슬린 콜베가 몇 번의 트라이를 시도했는지 물어봤습니다. 정답은 2번(뉴질랜드 전과 일본 전에서 한 번, 조별 예선에서 이탈리아 전 2번, 결승에서 잉글랜드 전 1번)이었습니다(틀린 답변입니다. 콜베는 3번을 득점했습니다).
위에서 볼 수 있듯이 챗봇에게 동일한 질문이 주어졌을 때 챗봇의 답변은 훨씬 더 제한적입니다. 따라서 럭비 월드컵에서 3번의 시도를 했다는 답변은 정확하지만 이전 답변에서 제공된 세부 정보 수준이 부족합니다. 더 자세한 정보를 요청하자 다음과 같은 답변이 나왔습니다:
그 결과 일부 문제(이탈리아전 2번 시도)는 정답을 맞혔지만 다른 부분(캐나다전에서는 득점하지 못했고, 잉글랜드와의 결승전에서는 득점함)은 틀리게 맞혔습니다. 따라서 GPT-4가 환각 문제를 해결하는 것과 관련해서는 이러한 인공지능 모델의 자동 회귀적 특성(즉, 모델은 이전 단어가 주어진 시퀀스에서 다음 단어를 예측하며 현실에 대한 지식과 관련이 없음)으로 인해 여전히 문제가 되고 있으며 앞으로도 오랫동안 문제가 될 가능성이 높습니다.
지난주 뉴욕대학교에서 열린 프레젠테이션에서 AI 분야의 저명한 인물 중 한 명인 얀 르쿤은 이 문제를 강조하며 현재의 LLM 접근 방식은 이 환각 문제를 결코 해결할 수 없기 때문에 실패할 운명이라고 말했습니다. 이러한 모델은 어떤 식으로든 현실과 연결되어야 합니다(여기 슬라이드 데크 참조), 이는 이전 글에서 언급한 바와 같이 결과물을 현실 세계에 근거해야 한다는 점과도 일치합니다. 스포츠에서 진실의 출처는 Stats Perform 같은 신뢰할 수 있는 스포츠 데이터 제공업체로부터 오는 것이 중요합니다. 이러한 문제와 피해 및 잘못된 정보의 가능성에 대한 우려로 1,000명이 넘는 기술 리더들이 "사회와 인류에 심각한 위험"을 초래할 수 있으므로 이러한 LLM 개발을 중단하라는 공개 서한을 보내기도 했습니다.LINK]. 자세한 내용은 마지막에 자세히 설명합니다.
최신 데이터 세트는 어떤가요? 그 측면에서 달라진 점이 있나요?
예, 아니오. 환각 문제는 지속될 것이지만, 앞서 언급했듯이 지난 주 OpenAI는 챗봇이 3rd 파트 API [LINK]. 이러한 플러그인의 발전으로 개발자는 기존 코드 스택에 ChatGPT 기능을 통합하여 실시간 정보 호출을 검색할 수 있습니다. 이 공간을 지켜보세요.
또한 ChatGPT와 같은 인공지능 기술을 실제 환경에서 어떻게 사용할 수 있는지에 대한 의문이 제기됩니다. 일반적으로 사람들이 갖는 대부분의 질문은 변경되지 않는 정적인 지식 기반을 기반으로 합니다. 하지만 스포츠는 특히 라이브 경기의 경우 상황이 다릅니다. 물론 "누가 이기고 있나요?" 또는 "누가 득점했나요?"와 같은 간단한 질문을 할 수도 있지만, 이러한 답변은 현재 "사전 ChatGPT" 챗봇을 통해 이미 제공되고 있습니다. 더 깊은 인사이트를 얻기 위해 실시간으로 쿼리하는 기능은 게임의 특정 요소에 대한 쿼리를 입력하는 데 걸리는 시간 동안 이미 다른 일이 발생하여 해당 쿼리의 가치나 흥미가 떨어질 수 있기 때문에 어렵습니다. 따라서 흥미로운 이벤트에 의해 트리거되는 자동 쿼리 또는 '하이라이트 감지' 기능이 필요합니다. 저희는 PressBoxLive 플랫폼에 이 기능을 탑재하여 골과 같은 흥미로운 이벤트가 발생하면 이에 대한 흥미로운 인사이트를 즉시 자동으로 생성할 수 있습니다. 이 기능의 장점은 확장이 가능하다는 점입니다. 예를 들어, 최근 독일 분데스리가 2부 리그인 아르미니아 빌레펠트와 뉘른베르크의 경기에서 골이 터지면 1부 리그와 마찬가지로 해당 경기에 대한 인사이트를 생성할 수 있었는데, 이는 스포츠에서 AI 가치인 확장성(그리고 이를 실시간으로 수행할 수 있는 능력)을 강조하는 사례입니다. 이는 텍스트 인사이트에 국한되지 않고 동영상에 자동 오버레이를 생성하여 퍼포먼스에 추가적인 색채를 부여할 수 있으며, 최근 테니스에서 이러한 작업을 수행하고 있습니다.
이미지와 그림을 입력할 수 있는 기능이 멋졌어요 - 스포츠 이미지나 그림을 ChatGPT에 입력하면 출력을 받을 수 있나요?
이전 글에서 언급했듯이, Stats Perform 플레이를 그려서 유사한 플레이를 검색하거나 해당 플레이에 대한 분석을 수행할 수 있는 대화형 스포츠 분석 영역을 개척했습니다.LINK], 또는 고스팅 작업을 통해 주어진 상황에서 플레이어가 어디에 있었어야 했는지 예측할 수도 있습니다.LINK]. 하지만 GPT-4 데모에서는 약간 다르게 작동합니다. 텍스트 대 이미지 또는 이미지 대 텍스트 트랜스포머 네트워크는 방대한 양의 텍스트 대 이미지 쌍(즉, 각 이미지마다 캡션과 같은 텍스트 설명이 있음)으로부터 학습합니다. 이 훈련 세트에서 트랜스포머는 텍스트 설명과 이미지의 일부 간의 상관관계를 학습합니다. 이러한 초대형 신경망의 새로운 동작으로 인해 이미지의 특정 요소에 대한 추론(예: 특정 이미지가 왜 웃기는가?)을 수행할 수 있습니다.
스포츠의 경우, 플레이의 캡션이라고 할 수 있는 이벤트의 어휘를 계속 확장하고 있습니다. 단순히 이벤트 스트림을 확보하는 것만으로는 충분하지 않으며, 메트릭과 머신 러닝 모델을 사용하여 액션의 품질(예: xG를 사용한 슛 또는 축구에서 소유권 값을 사용한 패스)을 감지할 수 있습니다. 어휘를 확장하는 것도 중요하지만 데이터의 양을 확장하는 것도 또 다른 과제입니다.
그렇기 때문에 Opta Vision 프로젝트가 중요한 이유는 a) 축구의 이벤트 어휘를 확장하고 b) 이 풍부한 어휘를 사용할 수 있는 경기 수를 확장하는 두 가지 작업을 수행하기 때문입니다.
또한, 확장된 이벤트 스트림(캡션으로 볼 수 있는)을 추적 데이터와 페어링하면 이 페어링된 데이터 세트(즉, 확장된 어휘와 추적 데이터)를 통해 각 플레이에 대한 추론을 수행할 수 있는 기능을 추가할 수 있습니다. 우리는 현재 다음 단계의 스포츠 분석으로 이어질 티핑 포인트에 와 있습니다.
LLM: 신뢰, 혁신, 사회에 미치는 영향
위에서 언급한 바와 같이, LLM 기술의 놀랍고 빠른 발전으로 인해 전 세계의 많은 저명한 사람들이 이 기술이 사회에 미칠 영향과 잠재적 피해에 대해 극도로 경계하고 있으며, 이에 따라 이 기술을 중단할 것을 촉구하고 있습니다. 이는 매우 중요한 주제이지만, 스포츠와 관련하여서는 제 개인적인 견해 현재 이 문제를 어떻게 바라보고 있는지 말씀드리겠습니다:
- 보조 도구로서 LLM 기반 AI 챗봇은 학습 지원과 효율성 측면에서 획기적인 변화를 가져올 것입니다. 모든 기술이 그렇듯, 어떤 것이 가능하고 어떤 것이 불가능한지 알아야 합니다. 제 생각에 이러한 AI 도구는 궁극적인 보조 도구이며 초보자가 더 높은 수준의 효율을 달성하는 데 도움이 될 수 있으며, 이는 최근 MIT 연구진의 연구에서 강조된 바 있습니다.LINK]. 또 다른 연구에 따르면 GitHub Copilot을 사용한 개발자는 대조군보다 55.8% 더 빨리 작업을 완료한 것으로 나타났습니다.LINK]. 지식 기반이 정적이고 신뢰할 수 있으며 최신 상태인 경우 특정 지식에 대해 질문하고 드릴다운할 수 있다는 것은 놀라운 일입니다(하지만 중요한 것은 올바른 질문을 하고 그 답변이 해결하려는 문제와 관련이 있는지 이해하는 것입니다).
- 그러나 가드레일이 있어야 합니다. 신뢰할 수 있고 신뢰할 수 있는 데이터(예: Stats Perform 보유한 데이터)라면 이러한 목적으로 데이터를 활용하는 데 큰 문제가 없지만, 사실을 보존해야 합니다(환각이 아닌). 사실과 허구가 혼재되어 있는 스포츠 이외의 영역에서는 잘못된 정보가 전파될 수 있으므로 이러한 일이 발생하지 않도록 견제 장치를 마련해야 합니다. 또한 개인 정보 및 민감한 정보는 일단 LLM에 들어가면 전파되는 것을 막는 것이 거의 불가능하기 때문에 이를 보호하는 것이 중요합니다.
- 스포츠에는 이러한 자연스러운 보호 장치가 마련되어 있습니다. 예를 들어, Stats Perform 경기 데이터의 공개 기록을 관리하지만 선수의 의료, 심리, 훈련 및 계약 정보와 같은 개인 정보는 보유하고 있지 않으며, 앞으로도 보유할 계획이 없습니다. 이러한 자연스러운 보호 장치가 선수들을 보호합니다. 또한 선수/클럽/고객이 경기 수준 분석/모델을 입력 중 하나로 사용할 수 있는 기회를 제공하며, 이를 보유한 개인 데이터와 병합할 수 있습니다.
- 또한 인간이 최종 의사 결정권자가 되어야 하며, 기술이 언제 오류가 발생하고 언제 신뢰할 수 있는지를 알 수 있어야 합니다. 이를 비행기의 조종사라고 생각하면 됩니다. 지난 100년 동안 상업용 항공 여행의 역사에서 조종사의 수는 변하지 않았습니다. 하지만 비행기의 기술은 비약적으로 발전하여 비행기 여행의 의사 결정, 안전 및 효율성이 향상되었습니다. 그럼에도 불구하고 조종사의 수는 여전히 동일하게 유지되고 있습니다. 기본적으로 스포츠 분야에서 AI 기술이 하는 일은 분야 전문가가 최선의 결정을 내리고 최대한 효율적으로 일할 수 있도록 돕는 보조 기술을 만드는 것입니다.
- 또한 세상은 자연어나 스포츠 데이터로만 존재하지 않습니다. 선수가 전날 밤 숙면을 취했는지, 연인과 싸웠는지, 아이가 아프거나 화를 냈는지, 선수들 간의 상호작용 등 아직 디지털화할 수 없는(그리고 위에서 언급한 공공 데이터와 개인 데이터로 인해 디지털화할 수 없는) 많은 것들이 있습니다. 의사 결정권자는 다양한 센서 입력을 통해 이를 디지털화할 수 있으며, 이를 통해 가장 관련성 높은 정보를 바탕으로 최선의 결정을 내릴 수 있습니다. 우리의 역할은 우리가 이용할 수 있는 데이터에 대한 최상의 정보를 그들에게 제공하는 것입니다.
인공 지능 분야는 매일 변화하고 있으며, 저희는 이 분야의 발전 상황과 그것이 저희와 어떤 관련이 있는지 여러분께 최신 정보를 제공하기 위해 최선을 다할 것입니다. 다음 글에서는 Opta Vision 프로젝트에 대해 자세히 알아보고, 이 프로젝트가 자율주행차 영역에서 일어나고 있는 일과 어떤 유사점을 가지고 있는지 살펴보겠습니다. 계속 소식을 전해드리겠습니다.
패트릭 루시 박사는 스포츠 데이터 대기업인 Stats Perform 수석 과학자로, 회사의 방대한 스포츠 데이터의 가치를 극대화하는 것을 목표로 AI 팀을 이끌고 있습니다. Patrick은 지난 20년간 AI 분야에서 연구하고 일해 왔으며, 디즈니 리서치와 카네기멜론대학교 로봇공학연구소에서 연구직을 맡았고, 박사 학위를 취득하는 동안 IBM의 TJ 왓슨 연구 센터에서 시간을 보냈습니다. Patrick은 호주 출신으로 서던퀸즐랜드대학교에서 공학사(EE) 학위를, 퀸즐랜드공과대학에서 박사 학위를 받았습니다. 그는 100편 이상의 동료 심사 논문을 저술했으며, MIT 슬론 최우수 연구 논문 트랙의 공동 저자로 2016년 최우수 논문, 2017년과 2018년에는 준우승을 차지했습니다.