LLM 에이전트가 '오락'의 게임을 플레이하는 모습. / 사진=크래프톤 제공
LLM 에이전트가 '오락'의 게임을 플레이하는 모습. / 사진=크래프톤 제공

크래프톤은 대규모 언어 모델(LLM)을 기반으로 한 AI 에이전트의 게임 수행 능력을 평가할 수 있는 벤치마크 '오락(Orak)'을 공개했다고 16일 밝혔다.

Orak은 '오락'에서 착안한 이름으로 게임 환경에서 AI의 상황 인식과 판단, 행동 결정 과정을 정량적으로 분석할 수 있는 평가 체계다. 액션, 어드벤처, RPG, 시뮬레이션, 전략, 퍼즐 등 총 6개 장르의 대중적인 게임을 기반으로 설계됐다.

이 체계에는 크래프톤과 엔비디아가 공동 개발한 CPC를 통해 축적한 AI 설계 경험이 반영됐다. 이를 바탕으로 LLM 기반 AI 에이전트가 복잡한 게임 맥락 속에서 상황을 해석하고 결정하는 능력을 평가한다. 오락을 통해 CPC를 포함한 AI 에이전트의 게임 능력을 반복적으로 검증할 수 있어, AI와 함께 플레이하는 새로운 게임 경험의 혁신을 가속화할 것으로 기대된다

이를 통해 크래프톤은 AI 기술 연구의 새로운 기준을 제시하고, 게임 산업을 넘어 다양한 산업 분야로 연구를 확장할 예정이다. 또 LLM 파인튜닝용 데이터셋도 함께 제공한다. 연구자들은 이를 활용해 사전 학습된 LLM을 실제 게임 환경에 맞게 적용하고 최적화할 수 있다.

이강욱 크래프톤 딥러닝 본부장은 "오락은 크래프톤의 선행 연구와 노하우가 집약된 게임 특화형 LLM 벤치마크"라며 "이를 기반으로 향후 LLM 에이전트 설계 역량을 겨루는 대회도 기획 중"이라고 말했다. 이어 "앞으로도 게임 분야에 최적화된 LLM 기술을 지속적으로 고도화해 AI를 통한 게임 플레이 경험의 혁신을 주도해 나갈 것"이라고 밝혔다. 

조성준 기자 csj0306@techm.kr

관련기사