주요 콘텐츠로 건너뛰기
방송사 및 커넥티드 TV, 연맹 및 권리 보유자, 프로 클럽 및 대학

스포츠에서의 제너레이티브 AI의 활용: 1분기 업데이트

작성자: 작성자: 패트릭 루시

수석 과학자 패트릭 루시가 제너레이티브 AI의 최근 발전과 스포츠 산업에서의 적용에 대해 설명하는 Stats Perform 최신 스포츠 AI 트렌드 시리즈 최신판에 오신 것을 환영합니다.

2월의 슈퍼볼은 AI와 스포츠 업계에 종사하는 사람들에게 경기장 안팎에서 큰 즐거움을 선사했습니다.

경기장과 스크린에서 우리는 팀 분석가들이 머신러닝의 도움을 받아 고안한 플레이를 사용하는 선수들을 보았고, 아나운서들이 맥락과 의미를 이해하는 데 도움이 되는 AI 기반 인사이트를 제공하는 것을 들을 수 있었습니다.

경기장 밖에서 슈퍼볼에서는 Microsoft의 Copilot 광고, Google이 픽셀 폰에서 AI의 성능을 보여주기 위해 AI를 사용한 광고 등 주요 소비자 제품의 기능으로서 AI에 초점을 맞춘 광고가 등장했습니다.

슈퍼볼 전후로 짧은 기간 동안 구글의 제미니, 애플의 비전 프로 정식 출시, 최근 OpenAI의 멀티모달 텍스트2비디오 툴 '소라' 출시 등 굵직한 소식과 함께 AI 에이전트 출시 및 검색 증강 세대(RAG) 활용도 증가에 대한 소문도 있었습니다.

이 글에서는 제너레이티브 AI의 세계에서 이러한 발전 중 일부를 처리하고 RAG와 멀티모달 LLM에 대해 설명합니다. 그리고 이러한 기술이 스포츠(팬과 프로팀 애플리케이션 모두)에서 우리와 어떤 관련이 있는지 간략히 살펴보고, 새로운 변화에도 불구하고 GenAI 모델을 지원하는 기본 데이터의 가치가 어떻게 변하지 않는지에 대해 논의할 것입니다.

요약: ChatGPT 12개월 이상 사용 후

ChatGPT가 출시된 지 1년여가 지난 지금, 일각에서 우려했던 것처럼 생성 AI 기술이 인간을 대체하는 것이 아니라 인간이 더 많은 일을 할 수 있도록 돕는다는 사실을 확인할 수 있습니다.

ChatGPT와 그 뒤를 이은 LLM 기반 기술은 일부 작업을 좀 더 빠르고 효과적으로 수행할 수 있도록 도와주는 다양한 'AI 보조' 도구를 제공했습니다.

예를 들어, 고객 서비스, 언어 번역, 문서(공개 문서이든 비공개 문서이든) 검색 및 심문 등이 모두 이전보다 훨씬 더 효율적이고 대규모로 수행되기 시작했습니다. 또한 텍스트, 오디오, 이미지 및 비디오(또는 이들의 조합) 등 새로운 콘텐츠를 만들 수 있습니다.

궁극적으로 이러한 영역의 발전(그리고 Copilot, Gemini, Sora의 원동력)은 GenAI가 데이터에서 가치를 추출하는 능력을 극대화했기 때문입니다. 기본 데이터는 여전히 GenAI 생태계에서 가장 중요한 요소입니다.

제너레이티브 AI의 세 번째 물결: 차별화된 데이터

Vista 에퀴티 파트너스의 회장 겸 CEO인 로버트 스미스는 최근 "생성적 AI의 3가지 물결"에 대한 훌륭한 요약본을 발표했습니다..

첫 번째 물결에서 그는 지속적인 가치는 하드웨어 공급업체(예: NVIDIA)에게 돌아갈 것이라고 설명했습니다.

두 번째 물결에서 그는 지속적인 가치는 슈퍼 스케일러(예: 클라우드 제공업체)에게 돌아갈 것이라고 말했습니다.

그리고 세 번째 물결에서는 제품을 판매하는 특정 시장에서 이러한 역량을 활용할 수 있는 기업에게 지속적인 가치가 제공될 것이라고 말했습니다. 즉, 특정 영역(예: 스포츠 분야에서 독보적으로 깊고 광범위한 데이터)에서 핵심적인 차별화가 있다면 제너레이티브 AI는 해당 분야의 제품과 서비스를 '슈퍼 부스트'할 수 있습니다.

현재 첫 번째와 두 번째 파동이 진행되고 있습니다.

첫 번째는 GenAI에 사용할 수 있는 칩에 대한 갈증이 해소되지 않는 것처럼 보이는 칩 제조업체의 수혜입니다. 이는 클라우드 제공업체가 GenAI 솔루션을 확장하고 일반 솔루션에 번들로 제공하는 데 필요한 스토리지와 컴퓨팅을 갖춘 두 번째 물결로 흘러들어가고 있으며, 현재도 이러한 현상이 일어나고 있습니다.

그러나 장기적으로 지속되는 가치는 특정 시장의 특정 사용 사례에 맞는 솔루션이 필요한 제3의 물결에 있을 것입니다.

스포츠에서 제네레이티브 AI 애플리케이션에 데이터가 여전히 중요한 이유는 무엇인가요?

가장 정확한 결과를 얻기 위해서는 제너레이티브 AI 시스템에 가장 정확하고 신뢰할 수 있으며 균일한 데이터 입력이 필요하다는 점을 기억할 필요가 있습니다. 양질의 입력이 없으면 잘못된 출력이나 잘못된 정보가 전파될 수 있으며, 특히 특정 분야에서 사용할 경우 AI의 적용이 심각하게 제한될 수 있습니다.

따라서 모든 것이 진화하고 변화하는 것처럼 보이지만, 모든 정보와 인사이트는 신뢰할 수 있고 정확한 데이터를 기반으로 하기 때문에 핵심은 여전히 동일합니다.

스포츠나 의학처럼 선수 분석 및 경기력 예측, 증상 진단 및 치료 평가와 같은 구체적인 사용 사례가 있는 특정 분야에서는 사실을 틀릴 수 없습니다. 그렇게 되면 하위 분석, 예측 및 진단도 틀릴 수 있습니다.

또한 데이터가 더 상세하고 일관적일수록 더 구체적이고 관련성이 높으며 유용한 결과와 응답을 얻을 수 있습니다.

예를 들어, 13,500개 이상의 프로 남녀 팀에 대한 상세한 옵타 데이터를 보유하고 있는 축구의 경우, 일부 리그뿐만 아니라 모든 경기에서 동일한 데이터와 측정값이 생성되도록 보장합니다.

따라서 축구의 모든 리그에서 패스와 슛은 각각 동일하게 정의되고 수집됩니다. 모든 이벤트는 이름, 타임스탬프, 위치 좌표와 같은 메타데이터에 동일한 프로토콜을 사용합니다.

실시간으로 수집되는 데이터의 균일한 분류와 구조는 제너레이티브 AI 모델이 과거 데이터와 인플레이 통계 등 방대한 양의 데이터를 학습할 수 있다는 것을 의미합니다.

이렇게 하면 검색 기능이 향상되고 데이터 세트의 상관관계와 패턴을 더 쉽게 식별할 수 있을 뿐만 아니라 효율성이 향상됩니다.

데이터가 균일하게 수집되고 배포되지 않으면 통계와 파생된 결과물은 인간과 GenAI 모델 모두에게 의미가 없습니다.

제너레이티브 AI는 인간의 육안만으로는 발견할 수 없거나 묻혀 있던 가치 있는 인사이트를 발견하는 데 도움을 줍니다. 기본 데이터의 가치를 극대화하는 데 도움이 됩니다. 데이터가 상세하고 균일하며 객관적이라면 그 가치는 더욱 높아질 수 있습니다.

소스 데이터 세트가 깊을수록 GenAI가 생성하는 패턴에 대한 인사이트와 예측 정확도가 높아지고, 스포츠와 같은 특정 애플리케이션 및 분야에 대한 활용도가 높아집니다.

데이터의 품질, 깊이, 폭, 일관성은 AI 시스템(특히 GenAI 시스템)이 번창하기 위한 핵심 요소입니다.

한편, 선거에 영향을 미칠 수 있는 딥페이크에 대한 언론 보도가 증가하면서 스포츠의 무결성을 위협할 수 있는 딥페이크 동영상의 악의적 사용 가능성에 대응하기 위해 독립적이고 신뢰할 수 있는 스포츠 데이터의 가치에 대해서도 고민하게 되었습니다.

몇 년 전 소셜 미디어에 올라온 유명한 마이클 조던이 크레이그 엘로에게 총을 쏜 가짜 '대체 역사'를 기억하는 분들도 계실 겁니다.s 전에. 이 영상은 조던이 실제로 성공했던 우승 슛을 놓치는 장면을 보여주며 많은 관중을 속였습니다. 텍스트2비디오 LLM이 점점 더 효과적으로 사용됨에 따라 딥페이크가 스포츠에 침투할 가능성도 커지고 있습니다.

스포츠계의 신뢰할 수 있는 기록 보관소로서 Stats Perform역할을 매우 중요하게 여기고 데이터의 무결성을 위해 밤낮으로 집중하는 놀라운 데이터 운영팀에 감사하는 또 다른 이유는 옵타의 데이터처럼 신뢰할 수 있고 독립적이며 검증 가능한 출처가 딥페이크의 미래에서 더욱 중요해질 가능성이 높기 때문입니다.

RAG란 무엇인가요?

검색 증강 생성(일명 RAG)은 '비기술 전문가'가 지식 베이스를 검색하고 질문할 수 있도록 하는 생성 AI 분야의 또 다른 비교적 최근 개발 기술입니다., 데이터를 가져오는 데 엔지니어나 데이터베이스 전문가에게 의존하지 않고도 지식 기반을 검색하고 질문할 수 있게 해줍니다.

견고하고 정확한 데이터의 기반이 있다면 RAG는 해당 정보를 최신 LLM 기반 기술로 감쌀 수 있습니다.

이 GenAI 기술을 통해 사람들은 더 많은 일을 할 수 있고, 더 빠르게 반복하고 더 빠르게 지식을 얻을 수 있습니다. 어떤 면에서는 전문가가 항상 곁에서 답을 알려주는 것과 같은 궁극의 비서라고 할 수 있습니다(i시스템이 가장 정확한 최신 데이터에 액세스할 수 있는 경우).

광범위한 정보 지식 기반이 있는 곳이라면 어디에서든 GenAI를 사용하여 스포츠 정보를 검색하고 질문할 수 있으며, RAG를 사용하면 도메인별 지식에 액세스해야 하는 시스템에서 이를 더 쉽게 수행할 수 있습니다.

다시 말하지만, 환각과 오래된 정보가 전파될 수 있으므로 여전히 많은 주의가 필요합니다. 기본 소스 데이터의 품질과 신뢰가 필수적입니다.

하지만 보호 장치와 감독을 통해 올바르게 사용한다면 스포츠 분야에서 콘텐츠와 치료법을 개인화하는 데 엄청난 가치를 발휘할 수 있습니다.

다음 글에서는 이 주제에 대해 더 자세히 살펴보겠습니다.

비디오, 이미지 및 멀티모달 LLM을 사용한 개발

스포츠의 언어는 온볼 데이터와 오프볼 움직임 데이터를 모두 수집합니다. 이를 멀티모달이라고 부르는데, 이는 이미지나 비디오에 텍스트 캡션을 넣어 상황을 설명하는 것과 같이 상호 보완적인 두 가지 모드의 정보를 캡처하기 때문입니다(GPT-4, Gemini 및 Sora는 텍스트2이미지 및 텍스트2비디오 생성을 수행할 수 있습니다).

스포츠용 LLM에서 비디오를 효과적으로 활용하는 한 가지 방법은 오프볼과 온볼 선수 및 공 데이터를 모두 캡처하고 결합하는 것입니다. 이렇게 하면 전체 경기력을 측정하고 인터랙티브 애플리케이션을 구축할 수 있습니다.

최근의 발전으로 방대한 옵타 데이터베이스와 멀티모달 LLM을 사용하여 비디오에서 볼 수 없는 누락된 선수의 위치를 부분적으로 또는 전체적으로 추정할 수 있게 되어 모든 패스와 결정을 다른 플레이어의 위치와 그들이 무엇을 하고 있는지 전체 맥락에서 분석할 수 있게 되었습니다.

저희는 최근 스포츠 분야에서 제너레이티브 AI의 고급 애플리케이션을 선보였습니다. 2024 MIT 슬론 스포츠 애널리틱스 컨퍼런스. 하지만 이것은 시작에 불과하며, 이 기초 모델에서 수많은 추가 애플리케이션이 탄생할 것입니다. 앞으로 이 분야에서 더 많은 업데이트를 기대해 주세요.

최근의 제너레이티브 AI의 발전은 프로 스포츠 분석과 어떤 관련이 있을까요?

또한 스포츠 전용 LLM을 사용하면 이전에는 정확하게 모델링할 수 없었던 예측을 생성할 수 있어 팀 분석가와 코치에게 매우 강력한 보조 도구가 될 수 있습니다.

예를 들어, 축구 선수의 개별 선수 통계를 모델링하는 것은 매우 어려운 것으로 악명이 높은데, 이는 선수가 어떤 팀 동료와 함께 뛰고 있는지, 어떤 상대와 함께 뛰고 있는지, 실시간 예측을 위한 경기 상태(예: 팀이 이기고 있는지/지고 있는지, 선수 퇴장 여부 등)에 따라 달라지기 때문입니다.

그러나 ChatGPT와 Gemini를 구동하는 모델을 훈련하는 데 사용되는 동일한 생성 AI 방법(즉, 트랜스포머 신경망)을 사용하여 동일한 모델에서 모든 선수(및 팀)에 대한 예측을 생성할 수 있으며, 이는 스포츠 예측 수행 방식의 패러다임 전환입니다.

이러한 접근 방식의 힘은 보다 정확한 예측을 제공할 뿐만 아니라 "가상 보조 코치"와 같은 새로운 애플리케이션을 가능하게 하는데, 사용자가 "선수 X를 빼고 선수 Y를 투입하면 경기 결과가 어떻게 달라지거나 슛이 더 많이 또는 적게 나올 수 있는가?"라고질문할 수 있습니다. 또는 "그 상황에서 수비수가 어디에 있어야 슛을 막을 수 있었을까?" 또는 "선수가 다음에 어디로 공을 칠까? " 같은 질문을 할 수도 있습니다.

이는 비디오 게임에만 국한되었던 스포츠와 상호작용하는 새로운 방식이 될 수 있으며, 지난 2024년 1월에 열린 호주 오픈에서 테니스 오스트레일리아의 훌륭한 파트너와 함께 이 작업을 수행한 바 있습니다. 실제로 작동하는 모습은 여기에서 확인할 수 있습니다.

다른 AI 비서와 마찬가지로 스포츠 분석가와 코치들은 더욱 정교한 전략과 전술을 개발할 수 있게 되며, 이를 통해 경기를 지켜보는 팬들에게 더 많은 '와우-모먼트'를 선사할 수 있게 될 것입니다.

스포츠 데이터와 LLM은 혼합 현실(예: Apple Vision Pro)의 발전에 어떤 역할을 하나요?

애플 비전 프로 출시 영상에서 스포츠 시청과 상호작용은 중요한 부분을 차지합니다.

사용자는 다양한 각도에서 경기를 시청하는 것 외에도 오디오 쿼리나 제스처를 통해 시청 에코시스템 내에서 원하는 모든 데이터와 인사이트를 얻을 수 있습니다. 또한 모듈과 상호 작용하여 하이라이트, 다른 게임, 친구와 채팅 또는 전문가(또는 문맥 광고)와 같은 인접 콘텐츠를 소비할 수 있습니다.

궁극적으로 게임의 모든 디테일을 더욱 흥미롭고 재미있게 만들어 팬과 선수, 팀, '방송사' 및 스폰서를 더욱 가깝게 연결해주는 360도 경험을 제공하겠다는 야심찬 목표를 가지고 있습니다.

양질의 스포츠 데이터는 눈에 보이는 방식과 보이지 않는 방식 모두에서 이러한 많은 경험을 뒷받침합니다.

이러한 비하인드 스토리에는 다음과 같은 방법이 있습니다. 예측을 지원하는 LLM, 하이라이트를 포함한 최고의 콘텐츠와 광고를 최적의 시간에 보여줄 수 있도록 큐레이션, 경기 상태와 선호도에 따라 사용자가 보고, 듣고, 느끼는 것을 개인화, 게임화 기회를 강화, 선수의 기술을 더욱 기억에 남도록 놀라운 맥락의 레이어를 추가하고 전반적으로 이벤트의 스토리텔링 능력을 심화하여 팬과 스폰서에게 가치를 더하는 것 등이 있습니다.

분석가와 코치에게 제공하는 전술적 인사이트는 말할 것도 없고, 현장 엔터테인먼트의 수준을 한층 더 끌어올릴 수 있습니다!

슬론 스포츠 애널리틱스 컨퍼런스 2024

이번 업데이트를 마무리하기 위해 저는 며칠 전 슬론 스포츠 애널리틱스 컨퍼런스에서 흥미로운 시간을 보내고 돌아왔습니다. 앞서 언급했듯이, 유니티는 고품질 소스 데이터가 주어졌을 때 스포츠의 특정 애플리케이션, 즉 중계에서 시각적으로 인식되지 않는 축구 선수의 정확한 위치를 예측하기 위해 생성형 AI를 활용하는 방법에 대한 논문을 발표했습니다(아래 링크). 다른 패널과 프레젠테이션에서는 고객 서비스 및 검색과 같은 스포츠 단체의 업무에서 광범위한 GenAI 적용 사례에 대해 논의했습니다. 향후 기사에서 이러한 사례와 기타 구체적인 활용 사례에 대해 다뤄보겠습니다.


패트릭 루시 는 Stats Perform 수석 과학자입니다. 스포츠에서 ChatGPT와 대규모 언어 모델이 하는 역할과 앞으로 주목해야 할 사항에 대한 그의 다른 의견과 인사이트를 읽어보세요.

곧 Patrick의 기사에서 다음 내용을 다룰 예정입니다. Stats Perform2024년 논문 에 대해 자세히 설명하고, 제너레이티브 AI가 스포츠에서 비디오 판독(VAR)의 적용을 개선할 수 있는지, AI 에이전트가 스포츠에서 유용할지, 스포츠 방송과 스폰서십을 개선하기 위한 제너레이티브 AI의 적용에 대해 자세히 설명합니다. 또한 2050년까지 완전 자율 휴머노이드 로봇이 실제 야외 경기장에서 세계 최고의 인간 축구팀을 이기는 것을 목표로 하는 RoboCup의 원래 목표도 새롭게 살펴볼 예정입니다!