주요 콘텐츠로 건너뛰기
2018 러시아 월드컵 러시아와 사우디아라비아의 경기 중 루즈니키 스타디움에서 환호하는 팬들
클럽 미디어, 대학 미디어, 연맹 및 권리 보유자, 출판사

스포츠 취재의 미래: 1부

Stats Perform수석 과학자, 패트릭 루시가 말하는 스포츠에서의 ChatGPT, 딥 러닝 및 AI 기술.

작성자: 작성자: 패트릭 루시

OpenAI의 ChatGPT는 2022년 말에 출시되었습니다. 방대한 양의 인터넷 텍스트로 학습된 이 '대화형 챗봇'은 일상적인 AI 기술 활용에서 새로운 돌파구를 경험하고 싶어 하는 수백만 명의 사용자를 빠르게 확보했습니다.

그렇다면 ChatGPT는 스포츠와 관련이 있을까요? 방대한 양의 스포츠 데이터로 학습된 Stats Perform자체 머신러닝 모델을 보완하거나 경쟁할 수 있을까요?

스포일러: ChatGPT는 Stats Perform AI 팀에서 사용하는 것과 동일한 딥러닝 접근법을 일부 활용하지만, 다른 입력과 다른 목적을 위해 사용됩니다. 사실 이러한 AI 기술은 기술 업계 전반에 걸쳐 수많은 문제를 해결하고 있습니다. 여기서는 ChatGPT를 사용하여 이러한 기본 AI 기술과 ChatGPT의 가치, 한계, 그리고 스포츠 업계에서 관련성이 있을 수 있는 분야에 대해 설명하겠습니다.

후속 기사에서는 스포츠 문제 해결을 위해 Stats Perform 현재와 미래에 유사한 딥 러닝 방법을 사용하는 몇 가지 사례에 대해서도 다룰 예정입니다. 

ChatGPT란 무엇인가요?

ChatGPT는 인터넷에 있는 대부분의 텍스트를 읽고 단어, 문장, 단락의 구조를 이해하여 질문을 텍스트 입력으로 받아들이고 대화형 텍스트 출력의 형태로 일관성 있는 답변을 생성할 수 있는 모델입니다.

'생성 AI'를 사용하여 다음 단어에 대한 시퀀스의 다음 단어에 대한 예측을 생성합니다. 통계적으로 가능성이 높은 다음 단어를 예측합니다, 이전 단어의 문맥을 기반으로 다음 단어를 예측합니다. 그 결과 은 유창하고 자연스러운 텍스트 응답의 형태를 취합니다.

기술적인 측면에서 ChatGPT는 프롬프트 엔지니어링을 사용하여 대화와 유사한 동작을 생성하도록 유도하는 생성형 사전 학습 트랜스포머(GPT) LLM(대규모 언어 모델)의 변형입니다.

언어 모델은 새로운 것은 아니지만, ChatGPT에서 사용하는 GPT-3 LLM의 놀라운 점은 다음과 같습니다. 정말 학습되는 데이터(즉, 인터넷의 모든 텍스트 데이터)뿐만 아니라 사용하는 매개변수의 수(1,750억 개)가 엄청나게 많다는 점입니다. 이 방대한 텍스트 저장소에서 초인적으로 보이는 상관관계와 패턴을 학습하기 위해 트랜스포머 네트워크 접근 방식을 사용합니다.

필요한 내용과 응답 스타일을 설명하도록 입력 질문을 영리하게 제작하는 것을 말합니다. 프롬프트 엔지니어링을 통해 ChatGPT는 학습된 소수의 텍스트 샘플을 선택하여 필요한 스타일과 내용을 표시하고 이러한 샘플을 합성하여 에세이와 같은 텍스트 출력물, 즉 인간의 언어를 모방한 방식으로 질문에 대한 글과 답변을 생성할 수 있습니다.

제너레이티브 AI 또 다른 기능은 무엇인가요?

대규모 언어 모델은 생성형 AI 모델의 한 유형입니다. 또한 텍스트 입력을 받아 이미지와 같은 다른 출력을 생성하라는 메시지를 표시할 수도 있습니다(예: OpenAI의 DALL-E-2) ) 및 비디오(예: Meta의 MakeAVideo). 로봇 공학에서도 이 기술을 활용하고 있습니다. RT-1은 자연어 텍스트 명령과 이미지를 입력으로 받아 실제 로봇 작업을 직접 출력으로 생성하도록 유도하는 트랜스포머입니다.

LLM은 특정 도메인에 대한 콘텐츠 이해/번역/질문 답변(예: 추출, 요약, 요약 및 임상 기록 인코딩또는 법률 문서) 및 고객 서비스. LLM은 코딩을 위한 보조 도구를 지원합니다. 깃허브의 코플리엇와 같이 오류를 표시하고 코드를 생성하거나 자동 완성할 수 있습니다. 코드 작업 중인 특정 API에 따라 컨텍스트에 기반하여.

ChatGPT의 한계

제너레이티브 AI 라벨에 표시된 대로 예측을 생성합니다.

ChatGPT는 단어에 대해 알고 있으며, 문장에서 어떤 단어가 어떤 순서로 함께 나타날 가능성이 높은지 알고 있습니다. 전체 문장에서 단어가 그럴듯하게 들리기만 하면 최종적으로 선택하는 실제 단어는 중요하지 않지만, 문제는 사실인 단어 중 일부를 '환각'하는 경우가 많다는 점이며, 사실은 변할 수 없습니다.

환각 문제 외에도 ChatGPT는 특히 비전문가에게 오답이 그럴듯하게 들릴 수 있도록 권위 있는 방식으로 답변을 작성합니다.

이는 ChatGPT뿐만 아니라 생성형 AI 도구 전반의 문제입니다. 실제 콘텐츠(예: 이미지, 비디오 및 오디오의 딥페이크)를 가짜로 만드는 데 매우 능숙합니다. 모든 도구와 마찬가지로 기술이 무엇을 할 수 있는지, 그리고 가장 중요한 것은 무엇을 할 수 없는지 알아야 합니다.

스포츠에서 ChatGPT는 무엇을 할 수 있나요(그리고 무엇을 할 수 없나요)?

첫째, ChatGPT는 2021년 9월까지 단어에 대해서만 학습되었기 때문에 최근의 답변은 제공하지 못합니다. 둘째, GPT-3는 입력으로 텍스트가 필요합니다. 스포츠의 언어는 텍스트와 다르며, Stats Perform AI 구동하는 '스포츠의 언어'를 만들었습니다. 마지막으로 중요한 것은 ChatGPT가 예측하는 '답'이 실제로 정확한지 확인하기 위해 최적화되어 있지 않다는 점입니다.

ChatGPT는 럭비나 크리켓, 농구나 축구, 국가, 컵, 배트, 공 또는 전 세계에 대한 어떤 정보도 알지 못합니다. 사실과 통계에 대해 학습하거나 예측을 생성하기 위한 정확한 정보를 인식하도록 훈련받은 적도 없습니다. 단어의 순서만 알고 있을 뿐입니다.

특히 뉴스나 스포츠와 같이 결과가 결과이고 통계가 통계인 영역에서는 ChatGPT가 믿을 수 있어 보이지만 실제로 일어난 일에 근거하지 않은 매우 잘 작성된 기사를 생성할 수 있기 때문에 제한적입니다.

2019 월드컵 럭비 선수에 대한 질문과 같이 매우 구체적인 질문을 하면 이를 확인할 수 있습니다:

이 잘 쓰여진 답안의 처음 두 문장은 사실 틀렸습니다. 체슬린 콜베는 조별 예선에서 이탈리아를 상대로 2번, 결승전에서 잉글랜드를 상대로 한 번 시도하여 득점했습니다.

스포츠에서 ChatGPT의 역할이 있나요?

P구조화되고 정확한 최신 데이터와 콘텐츠 피드 덕분에 향후 버전의 ChatGPT는 이론적으로 '내일의 모든 경기에 대한 프리뷰를 작성해 주세요'와 같은 텍스트 질문으로 트리거된 팬 업데이트용 텍스트 기사를 신속하게 생성할 수 있습니다.

하지만 이와 같은 자동화된 기계 작성 기사는 이미 존재합니다. ChatGPT가 제공하는 것과 동일한 '대화형' 프로세스를 사용하지는 않지만 사실 정확합니다.

미묘한 차이이긴 하지만 ChatGPT는 내러티브와 내러티브 내의 정보를 모두 생성합니다. 따라서 생성형 AI 스포츠 보도를 포함한 뉴스 보도를 합성하는 데 문제가 있습니다.

대신 Stats Perform자동화된 경기 미리보기와 같은 구체적인 사실 기반 제품은 먼저 스포츠 데이터 피드의 통계와 사실을 스토리의 씨앗으로 사용한 다음, 구체적인 정보를 중심으로 내러티브를 구축합니다.

저희 도구는 데이터 피드에서 시작하며, 이러한 데이터 피드는 체계적이고 정확하기 때문에 작성되는 기사는 변경되지 않으며 '생성된' 예측이 아니라 실제 일어난 일이라는 의미입니다.

데이터 피드를 기반으로 하는 다른 자동화된 스포츠 리포트 스타일의 서비스에는 TV 해설자를 위한 실시간 인사이트를 생성하는 'Pressbox Live'와 골, 터치다운 또는 바스켓이 득점될 때마다 소셜 미디어나 블로그에 자동 이미지를 생성하는 'Pressbox Graphics'가 있습니다.

다음 단계는 무엇인가요?

2부에서는ChatGPT의 기반이 되는 AI 살펴보고, 특히 고성능 스포츠 분야에서 스포츠 경험을 향상시키는 데 어떻게 활용되고 있는지 살펴봅니다.

3부에서는 최신 ChatGPT-4 모델의 의미와 이 모델이 스포츠에 미치는 변화에 대해 다룹니다.