카카오가 자체 개발 언어모델 '카나나'에 대한 연구를 지속하며 인공지능(AI) 기술에 대한 경쟁력을 드러내고 있다. 카나나 고도화는 물론, 오픈 소스 공개를 통해 AI 생태계에서 영향력을 드러내는 모습이다.
27일 카카오는 카나나의 연구 성과를 담은 테크니컬 리포트를 아카이브(ArXiv)에 공개, 카카오의 AI 자체 개발력을 대내외에 홍보했다. 이와 함께 언어모델 라인업 중 '카나나 나노 2.1B' 모델을 오픈소스로 깃허브(GitHub)에 배포, AI 생태계 활성화에 앞장서겠다는 의지를 드러냈다.
이날 공개된 테크니컬 리포트는 매개변수와 학습 방법, 학습 데이터 등 세부 사항을 담아낸 AI 논문이다. 카카오는 이번 리포트에 다양한 사이즈에 이르는 카나나 언어모델 전체의 프리-트레이닝(Pre-training)부터 포스트-트레이닝(Post-training)까지 전 과정을 자세히 담았다. 카나나 모델의 구조, 학습 전략, 그리고 글로벌 벤치마크에서의 성과도 확인할 수 있다.
카카오의 초거대 언어모델 '카나나 플래그(Kanana Flag)'는 지난해 말 학습을 완료했다. 이로서 카카오는 작년 10월 개발자 컨퍼런스 '이프 카카오 2024'에서 공개한 '카나나 언어모델' 전체 라인업을 모두 구축하게 됐다. '카나나 플래그'는 글로벌 최고 수준의 한국어·영어 성능을 달성한 모델이다. 한국어 성능을 평가하는 '로직(Logic)Kor', 'KMMLU' 벤치마크에서 타 모델을 압도하는 처리 능력을 입증했다. 영어 성능을 평가하는 'MT-bench', 'MMLU' 벤치마크에서는 경쟁 모델과 유사한 성과를 기록했다. 또 학습 자원 최적화를 통해 유사 사이즈의 모델 대비 50% 이상 비용을 절감하며 SOTA(State-of-the-Art) 수준의 효율성과 성능을 동시에 구현해냈다.
카카오는 대규모 언어모델의 학습 효율을 극대화하고자 ▲스테이지드 프리-트레이닝(Staged pre-training) ▲모델 구성 요소를 가지치기해 중요 요소만 남기는 기법인 'Pruning' ▲큰 모델의 지식을 더 작은 모델로 전달하는 증류 기법 'Distillation' ▲깊이 업스케일링 'DUS(Depth Upscaling)' 등 혁신적 학습 기법을 적용했다. 이를 통해 경량 모델 '카나나 나노 2.1B'부터 초거대 모델 '카나나 플래그 32.5B'까지 다양한 사이즈의 고성능 모델을 효율적으로 개발, 글로벌 유사 크기 모델 대비 절반 이하의 학습 비용을 실현했다.
카카오는 향후 카나나 모델에 강화 학습과 연속 학습 기반의 최신 기술을 접목해 추론, 수학, 코딩 능력을 강화하고, 정렬 기술을 고도화해 사용자 요청의 수행 정확도를 높일 계획이다. 이를 통해 음성, 이미지, 영상 등 다양한 형태로 소통 가능하도록 지속적 모델 고도화를 이어가며 일상에 실질적인 가치를 더하는 기술로 자리잡을 수 있도록 기술 경쟁력을 강화해 갈 예정이다.
여기에 오픈AI와의 협력을 가속화하면서 카나나 모델의 고도화는 물론, 이용자가 일상 속 편리함을 경험할 수 있는 기능 또한 확대될 것으로 보인다. 카나나와 카카오톡 등 카카오 주요 서비스에 오픈AI의 API가 활용될 예정이기 때문이다. 카카오는 카나나의 올해 출시를 목표로 지난해 연말 사내 CBT를 진행하는 한편, 논문 내용과 같은 기술 고도화를 위한 작업을 꾸준히 추진 중이다.
카카오는 AI 생태계에서 비중 확대에도 나섰다. 자체 개발 경량 모델인 '카나나 나노 2.1B'를 깃허브(GitHub)에 오픈소스로 공개한 것이다. 카나나 나노 2.1B'는 연구자와 개발자가 활용하기 적절한 크기의 모델이자 온디바이스(On-device) 환경에서도 활용 가능한 고성능의 경량 모델로, 비교적 작은 규모임에도 유사한 크기의 글로벌 모델에 견줄 만한 성능을 자랑한다. 카카오는 이번 오픈소스 공개를 통해 AI 기술의 접근성을 높이고자 하며 연구자와 개발자들이 해당 모델을 토대로 다양한 응용을 시도할 수 있도록 모델의 업데이트를 지속 지원할 계획이다.
이처럼 카카오는 자체 AI인 카나나의 지속적인 연구·개발을 통해 'AI 지각생'이라는 별명을 지우는 것은 물론, AI 사업 확장에도 빠른 속도를 보이고 있다. 카카오는 이를 기반으로 AI 경쟁력을 강화해 나갈 예정이다.
김병학 카카오 카나나 성과리더는 "모델 최적화와 경량화 기술을 바탕으로 라마, 젬마 등 글로벌 AI 모델과 견줄 수 있는 고성능의 자체 언어모델 라인업을 효율적으로 확보하게 됐으며, 이번 오픈소스 공개를 통해 국내 AI 생태계 활성화에 기여할 수 있을 것으로 기대한다"며 "앞으로도 효율과 성능 중심의 실용적이고 안전한 AI 모델을 개발해가며, 지속적 기술 혁신을 통해 AI 경쟁력을 강화해 갈 계획"이라고 말했다.
배수현 기자 hyeon2378@techm.kr
관련기사
- "T1-젠지 등 명문 게임단 한자리에"...FC온라인, '프랜차이즈' 첫 발
- 그렉 롬바르도 넷플릭스 VP "콘텐츠 몰입도 높이는 '더 익스피리언스' 확대할 것"
- 엔비디아, '깜짝실적'…젠슨 황 CEO, "블랙웰 순항"
- [테크M 피플] 유병한 게임문화재단 10대 이사장 취임...핵심 키워드는 공공·전문성 제고
- 진정희의 야심작 '블소 네오' 북미·유럽 출격...글로벌 진출 속도내는 엔씨소프트
- [테크M 리포트] "BTS 완전체가 온다" 예열 끝낸 하이브, 올해 퀀텀점프 '청신호'
- KT-래블업, GPU 구독 서비스 '맞손'
- 정부, 양자내성암호 전환 시범사업 추진..."국가암호체계 대전환 첫걸음"
- 과기정통부, SW 보안취약점 신고포상제 운영...AI 서비스 취약점 집중 발굴
- 퀄컴, '버티컬 AI 초격차 챌린지' 참여
- 별도 앱 나오는 네이버 커머스, '네이버 생태계' 앞세워 커머스 강자 쿠팡에 '도전장'
- [MWC25] LG유플러스, AIDC '액체 냉각' 도입
- AI로 탄력 받은 SaaS 기업들...실적 호조 속 주가도 상승세
- "웹에서 무료로 코딩학습 하세요"...넥슨, '헬로메이플' 웹버전 출시
- 과기정통부, '저궤도 위성통신 기술개발' 공모
- "출석 체크하고 한정판 영웅 받아요"...엔씨, '호연' 이벤트 진행
- [미리보는 MWC25] 6G와 AI 결합·푹증한 트래픽 부담 분산...MWC서 해법 찾을까
- 글로벌 5주년 맞은 '일곱 개의 대죄'...넷마블, 성전 페스티벌 업데이트
- '레전드 오브 이미르' 소통의 끝은 어디인가...라이브 방송 통해 3월 로드맵 발표
- 신학기 준비, 아직 늦지 않았다...쿠팡-이마트-현대백화점 기획전에 '주목'
- 자녀당 1억원 지급하고 육아휴직 2년까지...크래프톤, 저출생 극복 위한 지원책 신설
- [글로벌] 애플, DEI 프로그램 지킨다…주총서 폐지안 부결
- [글로벌] 테슬라, 유럽 판매량 45% 급감…BYD에 밀린 英 시장
- 소닉, 메인넷 '뫼비우스' 출시…"솔라나 첫 SVM 체인 확장"
- 크래프톤 '인조이' 온라인 쇼케이스 3월 19일 개최...콘텐츠·로드맵·DLC 띄운다
- 그라비티, 스크린골프 브랜드 '골프 몬스터즈' 플래그십 스토어 대만 오픈