스포츠가 차세대 게임 변화의 물결을 이끌고 있는 GenAI 발전

수석 과학자 패트릭 루시가 스포츠 분야 AI 최신 트렌드 마지막 편으로 돌아왔습니다. 2024. 이번 업데이트에서는 루시 박사가 특화된 기업 GenAI와 스포츠계의 판도를 바꿀 최신 혁신이 어떻게 적용되는지에 대해 설명합니다.

이 시기는 Stats Perform 우리의 2025 스포츠 팬 참여, 수익화 및 AI 트렌드 설문조사 가 발표된 지 2주년이 되는 해이기 때문에 모든 것이 바뀌었습니다. AI 특정 업무에만 사용되는 틈새 도구에서 매주 수억 명의 사람들이 사용하는 범용 유틸리티가 되었습니다(ChatGPT는 최근 전 세계 주간 사용자 수가 3억 명에 달한다고 발표했습니다 ).

아직 환각에 대한 이슈가 남아 있지만, 일반적인 질의응답, 교정, 번역, 브레인스토밍, 코딩 등의 업무에 사용하는 전 세계 대부분의 지식 근로자에게는 이전보다 훨씬 더 많은 일을 할 수 있게 해주는 최고의 보조 도구입니다. 실제로 이번 설문조사의 여러 결과 중 하나는 방송, 팀, 리그, 연맹, 스폰서, 스포츠북 등 다양한 분야의 스포츠 미디어 경영진이 시청자를 늘리고 콘텐츠를 상업화하기 위해 다양한 방식으로 AI 도입하고 있으며, 뒤처진 업체보다 더 쉽게 AI 도입하고 있다는 사실을 보여줍니다.

물론 AI 혁신은 초기 ChatGPT 릴리스에서 멈추지 않았습니다. 마치 매주 새로운 혁신이 나오는 것 같습니다. 예를 들어, 지난 몇 달 동안 몇 가지 놀라운 혁신이 있었습니다. AI 선구자인 제프 힌튼과 데미스 하사비스가 각각 물리학 및 화학 부문에서 노벨상을 수상한 것 외에도 최근 애플 인텔리전스의 제품 출시, 메타의 레이 밴 스마트 글래스 개선 등이 있었습니다. 복잡한 작업을 위한 OpenAI o1의 추론 모델은 놀라웠고, 가장 최근에는 구글의 제미니 2.0이 출시되었습니다.

그러나 OpenAI의 최신 모델인 GPT-5(또는 오리온)의 출시를 앞두고 있는 지금, 더 많은 데이터와 더 큰 모델을 사용하여 초기의 빠른 개선이 한계에 도달한 것처럼 보이는 벽에 부딪혀 혁신이 고갈되고 있다는 소문이 점점 더 커지고 있습니다. Google의 CEO는 이러한 분위기를 반영하여 현재의 LLM을 통한 AI 발전은 "언덕이 더 가파르다" 고 말했습니다.

하지만 처음에 생각했던 것과는 달리, 이것이 GenAI 분야의 혁신이 끝났다는 것을 의미하지는 않습니다. 그와는 거리가 멀죠!

대신 GenAI 혁신의 새로운 국면을 예고하는 것이라고 생각합니다. 바로 엔터프라이즈 사용 사례를 중심으로 한 새로운 단계, 즉 엔터프라이즈 GenAI입니다. 이 글에서는 이것이 무엇을 의미하는지, 그리고 스포츠 업계에 어떻게 적용될 수 있는지를 중점적으로 살펴봅니다.

현재 LLM은 벽에 부딪히고 있나요? 왜 그럴까요?

현재 텍스트 기반 LLM 사용 사례(예: ChatGPT)는 어느 정도 한계점에 도달하고 있습니다. 그 이유는 간단합니다. 모델이 학습할 새로운 데이터가 부족하기 때문입니다.

오늘날 인기 있는 Gen AI 애플리케이션에서 사용되는 대규모 언어 모델(LLM)은 대부분 텍스트이지만 대부분 인터넷에서 가져온 오디오, 이미지 및 비디오로 보강된 방대한 양의 데이터로 학습되지만, 이러한 모델은 이 데이터에서 가능한 한 많이 학습하는 것에 가깝고 의미 있는 새로운 공공 데이터 소스가 대규모로 존재하지 않습니다.

기본적으로 이러한 모델은 이러한 공개 데이터 소스에서 얻을 수 있는 것을 극대화했습니다.

하지만 인터넷에서 찾을 수 있는 텍스트와 이미지 데이터 외에도 훨씬 더 많은 정보가 있습니다.

모델 애플리케이션 및 성능 확장

이제 기업들은 더 큰 모델을 학습시키는 대신 현재 모델을 더 효율적이고 빠르게 만드는 동시에( Meta의 Llama 3.3 릴리스 참조), 새롭고 보완적인 도메인별 데이터 소스를 사용하여 이러한 모델이 수행할 수 있는 작업의 유형을 확장하는 방법을 모색하고 있습니다. 이러한 새로운 데이터 소스를 통해 새로운 작업과 솔루션을 만들 수 있습니다.

이는 예를 들어 OpenAI가 최근 'o1' 모델을 통해 그랬던 것처럼 이제 LLM이 수학/기하학 및 물리학의 더 복잡한 영역으로 진출할 수 있다는 것을 의미합니다. o1 모델은 물리학, 생물학, 화학 문제 벤치마크에서 박사급 정확도를 넘어섰을 뿐만 아니라 미국 수학 올림피아드 예선에서 미국 내 상위 500명 학생 중 한 명으로 선정되기도 했습니다. 또한 Google의 새로운 Gemini 2.0 모델은 AI 비서가 '심층 연구' 도구를 통해 웹 검색 및 상세 보고서 작성과 같은 작업을 수행할 수 있도록 지원합니다.

이와 같은 새로운 작업은 대부분의 작업보다 훨씬 더 복잡하기 때문에 모델이 이를 해결할 수 있도록 현재의 접근 방식을 발전시켜야 합니다. 수학/기하학/물리학 문제를 풀거나 복잡한 주제를 연구하는 경우, 모델은 답을 제공하기 전에 일련의 단계("생각의 연쇄"라고 함)를 매핑해야 합니다.

이러한 유형의 모델은 인간이 대답하기 전에 '생각하는' 방식을 모방한 것처럼 보이기 때문에 '추론' 모델이라고 합니다(최근 뉴욕 컬럼비아 대학교에서 열린 강연에서 얀 르쿤이 강조한 것처럼 이러한 모델은 여전히 효과적인 계획 능력이 부족하고 근사치에 가깝습니다).

하지만 위와 같이 추론 모델은 더 지능적으로(즉, 동일한 데이터에서 새로운 작업을 학습하는 것이 아니라) 해당 작업(예: 수학/물리/화학)에 특화된 새로운 데이터 세트를 먼저 포함함으로써 새로운 작업으로 확장되고 있을 뿐입니다.

그런 다음 일련의 벤치마크 테스트에서 최고 성능에 도달하도록 최적화합니다.

따라서 기본적으로 모델이 수행할 수 있는 작업 유형이나 인지된 성능을 개선하려면 새로운 데이터 세트에 대해 기존 모델을 학습시킨 다음 새로운 작업에 맞게 최적화하는 것이 핵심입니다.

이러한 현상은 컴퓨터 vision 영역에서 다양한 세분화 모델을 통해 확인할 수 있는데, 여기에는 상세한 세분화 맵 (즉, 학습 세트에서 각 픽셀에 레이블이 지정된 개체/세그먼트가 할당된 레이블)이 필요하거나, 다음에 수행할 작업을 제안할 수 있는 비디오 게임 에이전트 또는 모델이 클릭/타이핑을 캡처하는 방식을 추가하는 구현 컴퓨팅이 시작되고 있습니다.

그리고 오늘날의 대규모 언어 모델의 기능을 개선하거나 확장할 수 있는 유일한 방법은 차별화된 데이터를 사용하는 것입니다.

그렇다면 이러한 새로운 차별화 데이터 세트는 어디에 존재할까요?

한 가지 영역은 "소버린 AI"로, 국가가 고유한 데이터(의료, 교통, 국방 등)에 액세스하고 해당 데이터를 연료로 사용하여 국가별 문제를 해결할 수 있는 모델을 구축할 수 있습니다. 또 다른 영역은 비즈니스 세계로, 기업 또는 '엔터프라이즈'가 고유한 데이터를 보유하고 있으며 기업별 질문을 해결할 수 있으므로 '엔터프라이즈 GenAI'라고 합니다.

엔터프라이즈 GenAI

IBM에 따르면, 엔터프라이즈에서 사용할 수 있는 데이터의 1% 미만(즉, 기업이 일상적으로 수집하는 데이터)은 인터넷에서 사용할 수 있습니다. (즉, 기업이 일상적인 업무의 일부로 수집하는 데이터)에서 사용할 수 있는 데이터는 인터넷에서 사용할 수 있는 데이터의 1% 미만입니다.

물론 나머지 99%의 기업 데이터는 매우 풍부한 패턴과 인사이트를 포함하는 방대한 정보 풀로, 새롭고 구체적인 작업을 수행하고 인간의 혁신을 보다 효율적이고 효과적으로 촉진하는 데 잠재적으로 사용될 수 있습니다.

따라서 엔터프라이즈 데이터는 비옥한 땅이며, 제너레이티브 AI 엔터프라이즈 데이터를 사용하는 것이 이 분야의 성장을 지속할 수 있는 가장 가능성 있는 경로로 보입니다.

엔터프라이즈 GenAI 애플리케이션의 경우, 데이터 유형에 따라 두 가지 주요 사용 사례가 있습니다:

일반 기업 데이터: 이는 비즈니스에 비공개인 일반적인 유형의 텍스트, 오디오, 이미지/비디오 데이터를 의미합니다. 텍스트 데이터의 경우 내부 커뮤니케이션, 고객 상호 작용, 운영 문서, 영업 및 마케팅 자료, 제품 및 기술 문서, 법률 및 재무 기록, 인사 데이터, 외부 커뮤니케이션 등이 여기에 포함됩니다. 검색 증강 생성(RAG) 기술로 강화된 현재의 텍스트 기반 LLM은 이러한 문서를 조사, 액세스, 검색 및 번역할 수 있는 훌륭한 출발점을 제공합니다. 이러한 기능은 모델 미세 조정을 통해 더욱 향상될 수 있습니다. 마찬가지로 현재 LLM은 오디오 전사 및 요약에 사용할 수 있으며, 시각 언어 모델(VLM)은 이 데이터 범주 내에서 일반 객체 감지와 같은 작업을 처리할 수 있습니다.
전문화된 엔터프라이즈 데이터: 여기에는 센서에서 생성된 데이터, 시공간 데이터(예: GPS 좌표 또는 이벤트 추적), 기계, 엔진 또는 기타 장비의 데이터와 같이 비즈니스 또는 비즈니스 운영에 고유한 데이터 유형이 포함됩니다. 아래에서 이러한 데이터 중 일부를 자세히 살펴봅니다. 이러한 데이터 세트에는 종종 특수 처리 및 분석 기술이 필요합니다. 일반 데이터와 달리 특수 데이터는 도메인별 특성이 강하고 회사의 운영 또는 산업적 상황에 맞게 맞춤화되어 있으며, 종종 회사의 더 가치 있는 IP를 나타냅니다. 이러한 데이터를 활용하는 단계는 i) 데이터 수집, ii) 데이터의 언어 변환, iii) 해당 언어의 활용으로 구성됩니다.

이 글의 나머지 부분에서는 전문화된 엔터프라이즈 데이터를 활용하는 GenAI 애플리케이션에 초점을 맞추겠습니다.

스포츠는 전문화된 기업 데이터와 어떤 관련이 있나요?

스포츠에도 일반적인 데이터가 존재하지만, 경기장/코트에서 선수들의 생생하고 역동적인 퍼포먼스를 포착하는 스포츠 데이터는 세상에서 가장 흥미롭고 독특하며 '전문화된' 데이터 세트 중 하나입니다. 역동적이고 실시간으로 액세스할 수 있다면 엄청난 가치를 지니지만, 모델링에 효율적이고 효과적으로 사용하려면 광범위하고 심층적이며 균일하고 일관성이 있어야 하며, 물론 정확해야 합니다. 이 데이터의 가치는 성과에 대한 스토리를 객관적으로 재구성한다는 점이며, 데이터가 더 세분화될수록 재구성이 더 잘 이루어집니다. 다른 관점에서 보면 이 데이터는 스포츠의 보편적인 언어로 볼 수 있으며, Stats Perform 이러한 언어를 만들었습니다.

대부분의 정교한 언어와 마찬가지로 스포츠의 언어도 다중 모드를 사용합니다. 대표적인 모드는 '이벤트 데이터'와 '공/선수 추적 모션' 데이터입니다(자세한 설명은 이전 스포츠 AI 최신 트렌드 파트 1과 파트 2 참조).

스포츠는 매일 인터넷 검색의 10% 이상을 차지하지만, 현재 웹에 모델 훈련에 활용할 수 있는 형태로 존재하는 데이터는 오래되고 파편화되어 있으며 그 범위가 얕고 협소한 경우가 많습니다.

반면에 Stats Perform방대한 Opta 데이터베이스와 같은 독점적인 '엔터프라이즈' 데이터 세트는 최신의 완전하고 폭과 깊이 면에서 포괄적이며 지속적으로 수집되고 매우 상세한 이벤트 데이터와 오프 더 볼 위치 및 움직임 데이터 등 다른 곳에서는 얻을 수 없는 정보를 대규모로 포함하고 있습니다.

이러한 특성으로 인해 "전문화된" 스포츠 데이터 세트는 물류, 제조, 운송, 자율주행차, 날씨 및 생물학 영역에서 수집된 데이터와 유사하며, 미래 AI 애플리케이션의 차세대 물결을 위한 연료가 될 수 있습니다.

스포츠 외의 전문화된 기업 GenAI의 사례에는 어떤 것이 있나요?

생성형 AI 첫 번째 물결(예: ChatGPT)에서 이 물결을 이끈 연료는 대량의 일반 텍스트 데이터였습니다. 텍스트 데이터는 공개적으로 사용할 수 있는 엄청난 양의 데이터가 존재하고, LLM이 성공하기 위한 두 가지 핵심 속성인 순차적이라는 점에서 시작하기에 좋은 곳입니다. 스포츠 외에도 LLM이 번창할 수 있는 방대한 양의 순차적 데이터를 보유하고 있는 많은 영역이 존재하며, 이러한 영역은 잠재적으로 세상을 바꿀 수 있는(또는 이미 세상을 바꾸고 있는) 분야입니다. 아래에서는 그 중 네 가지를 강조했습니다.

첫 번째 예로, 현재 미국 일부 도시에서 무인 택시로 활용되고 있는 자율주행 차량을 들 수 있는데, 가장 최근에는 지난달 로스앤젤레스에서 출시되었으며 곧 마이애미에서도 출시될 예정입니다.. 6세대 웨이모 드라이버에는 13개의 카메라, 4개의 라이더, 6개의 레이더 장치, 다양한 외부 오디오 수신기, 고해상도 지도가 포함되어 있어 주변 환경을 모니터링하고 안전하게 자율 주행할 수 있습니다. 이 로보택시는 이러한 풍부한 입력 데이터 소스에서 자율주행 차량 전용 기반 모델을 사용하여 모든 정보 소스를 하나의 모델로 매핑하여 자율주행 차량의 세계에 특화된 행동을 측정하고 예측합니다..

두 번째 예는 날씨 예측에 관한 것입니다. 정확한 날씨 예측은 교통, 농업, 공공 안전, 일상 생활 등 모든 산업에 필수적입니다. 현재의 날씨 예측 방법에는 복잡한 물리 방정식을 풀기 위해 슈퍼컴퓨터가 필요하며, 이는 많은 시간과 계산이 소요됩니다. 또한 가장 정확한 예측을 위해서는 고해상도 이미지가 필요하지만 대규모로 확보하기 어렵습니다. 그러나 최근의 연구에 따르면 계산이 덜 필요하면서도 저해상도 입력을 활용하고 동일한 정확도를 달성할 수 있는 기초 모델을 사용하여 정확한 예측을 할 수 있습니다.. 이번 주에 구글의 딥마인드는 현재 사용 중인 최고의 시스템보다 더 정확하게 날씨를 예측할 수 있으며, 현재 모델이 예측을 생성하는 데 걸리는 시간인 몇 시간에 비해 몇 분 만에 예측을 수행하는 GenCast라는 모델을 출시했습니다..

이는 로봇 공학에 관한 세 번째 사례와 잘 연결됩니다. 하나의 로봇 팔이 패키지를 식별, 분류 및 처리하는 로봇이든로봇이 농장을 모니터링하고 최적의 수확량으로 과일이나 채소를 식별하고 수확하는 로봇이든등, 정확한 날씨 예측과 같은 다른 입력 정보 외에도 영역별 속성을 측정하는 센서의 능력으로 인해 중요한 혁신이 일어나고 있습니다. 이러한 작업의 효과는 택배가 적시에 정확하게 배송될 수 있고(즉, 더 저렴하고 더 적시에 받을 수 있게 됨), 최적의 시간에 식품을 수확할 수 있을 뿐만 아니라 낭비 없이 더 많은 식품을 생산할 수 있게 된다는 것입니다.

네 번째 예는 화학과 생물학에 관한 것입니다. 이 글의 서두에서 언급했듯이, 딥마인드 팀의 수석 과학자는 몇 년이 아닌 몇 시간 만에 단백질의 3D 구조를 정확하게 예측하는 알파폴드(를 개발하여 몇 년이 아닌 몇 시간 만에 단백질의 3D 구조를 정확하게 예측한 공로로 노벨 화학상을 수상했습니다. 이 방법은 질병에 대한 약물 개발뿐만 아니라 현재 방법으로는 불가능하고 따라서 주요 단점인 사람의 다양한 상황적 요인을 활용하여 표적 약물 요법에 사용할 수 있기 때문에 중요합니다.. 이러한 방법의 잠재력은 깨끗하고 재생 가능한 방식으로 에너지 부족 문제를 해결하거나 현재 지구의 문제인 플라스틱과 같은 폐기물을 분해하기 위해 새로운 청정 바이오 연료를 만드는 데에도 적용될 수 있습니다.

이 네 가지 예의 공통점은 방대한 양의 순차적 데이터에 의존한다는 점입니다. 자율 주행 차량의 경우, 입력은 텍스트가 아니라 LIDAR의 포인트 클라우드, RGB 카메라의 이미지, 세분화된 지도, 차량 내부의 정보입니다. 날씨의 경우 다양한 센서 입력이 입력되며 로봇 공학에서는 깊이 센서, 로봇 센서 및 가능한 제품 사전, 생물학에서는 단어 대신 단백질 구조 및/또는 DNA, RNA가 입력됩니다. 각 도메인에는 고유한 언어가 있으며, 해당 언어가 확립되면 언어 모델링(가급적 대규모 언어 모델링(LLM))을 수행할 수 있습니다. 그러면 이러한 모델은 이러한 특정 '전문 기업' 세계에서 일어나는 일을 정확하게 표현, 설명 및 예측할 수 있습니다.

트랜스포머 - 만능 학습자: "순차적 데이터만 추가하기"

대량의 순차적 데이터를 확보했다면, 이 데이터로부터 학습하기 위해 적절한 기계를 사용해야 합니다. 이 기계의 핵심은 '트랜스포머 신경망'으로, 이전의 머신러닝 방법보다 훨씬 더 효과적으로 정보를 맥락화할 수 있습니다. ChatGPT와 다른 LLM은 트랜스포머가 일반적인 순차 데이터(예: 텍스트, 이미지/비디오, 오디오)를 잘 학습한다는 것을 보여주었습니다. 그러나 종종 놓치는 것은 이러한 모델이 스포츠 데이터와 같은 다른 형태의 순차적 데이터에서도 작동할 수 있다는 점인데, 이에 대해서는 나중에 설명하겠습니다.

하지만 이러한 트랜스포머가 어떻게 작동하는지 직관적으로 이해하기 위해 텍스트 데이터를 사용한 두 가지 예문을 사용해보겠습니다(이 예는 블로그 게시물에서 수정한 것입니다. 에서 소개한 "주의력만 있으면 종이가 필요없다"를 각색한 것입니다.)

"남자가 은행에 돈을 입금했다"
"그 남자는 강둑에 앉았다"

컴퓨터가 문장을 이해하도록 하려면 먼저 단어(또는 하위 단어)를 숫자로 변환하는 문장을 토큰화합니다. 트랜스포머 이전에는 이 단어들을 독립적으로 표현했는데, 이는 컴퓨터가 '은행'이라는 단어를 동일한 숫자로 표현한다는 것을 의미합니다.

그러나 문장에서 "은행"이라는 단어 주위에 있는 단어를 보면", 우리는 그 단어가 다른 의미를 가지고 있다는 것을 이해합니다. 트랜스포머 모델을 사용하면 효과적으로 학습할 수 있습니다. 에서 관심 단어 주변에 있는 단어. 이 경우 모델은 이러한 단어가 서로 다른 의미를 가지고 있다는 것을 학습하므로 해당 단어를 나타내는 숫자 를 나타내는 를 나타내는 숫자가 달라집니다 ( 아래).

스포츠 전문 기업 GenAI: 스포츠 데이터의 순차적 특성 활용하기

이제 위의 예가 스포츠에서 어떻게 중요할까요? 우선, 우리의 전문 스포츠 데이터 세트는 순차적이라는 점입니다. 맨체스터 시티와 같은 팀의 선발 라인업을 보면, 팀은 본질적으로 하나의 문장과 같습니다. 각 선수는 하나의 단어이며, 골키퍼부터 스트라이커까지 그 단어의 순서를 정할 수 있습니다. 얼링 할랜드처럼 어떤 선수(즉, 단어)는 다른 선수보다 더 강한 영향력을 발휘합니다. 그가 플레이할 때 다른 선수들의 행동에 영향을 미치고(즉, 선수들이 그에게 득점 기회를 주려고 노력할 것입니다), 상대 선수들의 행동에도 영향을 미칩니다. 그러나 할랜드가 휴식을 취하거나 부상을 당하고 잭 그릴리쉬가 출전한다면(아래 참조), 그는 선수들의 플레이 방식에 영향을 미칠 것입니다(즉, '단어' 하나가 문장의 의미나 해당 팀의 플레이 방식에 큰 영향을 미칩니다). 앞서 강조한 날씨의 예처럼, 선수의 경기력을 순차적으로 표현하는 트랜스포머를 사용하면 선수를 독립적으로 예측하는 현재의 접근 방식에 비해 미래 선수의 경기력을 훨씬 더 잘 예측할 수 있습니다.

또한, 공에서 일어나는 일을 포착하는 이벤트 데이터는 공에서 일어나는 일을 포착하는 문장과 같지만, 단어 대신 플레이어가 취한 행동(예: Player A, X,Y 위치에서 시간에 T) 그리고 하프 또는 경기가 끝날 때까지 이러한 이벤트의 시퀀스가 있습니다. 매 프레임마다 선수와 공의 위치와 움직임을 캡처하는 트래킹 데이터도 공간과 시간 측면에서 공간과 시간 모두 순차적입니다. 트랜스포머를 사용하면 데이터의 순차적 특성을 훨씬 더 효과적으로 모델링하는 데 도움이 될 뿐만 아니라 그것 또한 동일한 참조 프레임에서 두 정보 스트림을 모두 가져올 수 있으므로 다음과 같은 작업을 수행할 수 있습니다. 궤적 생성과 같은 작업을 수행할 수 있습니다. (아래 아래).

이러한 '기초' 모델을 설정한 후에는 이 모델에 다른 정보 소스나 모드를 추가할 수 있습니다. 우리가 스포츠 분야에서 하고 있는 일은 전문화된 엔터프라이즈 데이터를 활용하는 방법의 좋은 예이며, 이는 전문화된 엔터프라이즈 언어 모델로 이어져 더 나은 예측, 시뮬레이션 및 더 나은 성과 측정에 도움이 되고 궁극적으로 스포츠 팬들에게도 도움이 됩니다.

2024년은 흥미진진한 한 해였으며, 2025년에는 더욱 흥미로운 발전이 기다리고 있습니다. 이 글을 읽어주셔서 감사드리며, 처음 읽어보신다면 스포츠에서의 AI 대한 이전 업데이트의 파트 1과 2를 확인하고 여기에서 2025 스포츠 팬 참여, 수익화 및 AI 트렌드 설문조사에 대한 액세스를 요청하세요.

스포츠가 게임 판도를 바꾸는 차세대 GenAI 발전의 물결을 주도하는 방법