보이스 AI 유니콘 일레븐랩스, 한국 상륙...'K콘텐츠 언어 장벽 없앤다'

2025-11-21     남도영 기자
홍상원 일레븐랩스 한국지사장은 21일 서울 서초구 JW메리어트호텔에서 열린 기자간담회에서 인사말을 하고 있다. /사진=남도영 기자

글로벌 음성 인공지능(AI) 분야 선도기업인 일레븐랩스가 한국에 진출해 'K콘텐츠 글로벌화'에 동참한다.

홍상원 일레븐랩스 한국지사장은 21일 서울 서초구 JW메리어트호텔에서 열린 기자간담회에서 "K콘텐츠가 세계를 사로잡았지만 언어 장벽은 여전하다"며 "우리의 새로운 텍스트 음성 변환(TTS) 모델 '일레븐 v3'는 이 장벽을 완전히 제거할 것"이라고 밝혔다.

이날 일레븐랩스는 한국 시장 진출을 알리며 게임, 음악, 드라마 등 국내 콘텐츠 분야를 핵심 시장으로 꼽았다. 이미 크래프톤, SBS 등의 국내 기업들과의 협업이 진행 중이다.

홍 지사장은 "70개 이상의 언어를 지원해 원작의 감정과 뉘앙스를 거의 완벽히 재현한다"며 "단순 번역이 아니라 웃음, 한숨, 감탄사, 숨소리까지 그대로 전달하고 제작 효율성도 획기적으로 개선된다"고 설명했다.

일레븐랩스는 음성 에이전트 기반의 고객 경험 혁신에도 자신감을 드러냈다. 홍 지사장은 "500밀리초 이하 응답속도의 초저지연 음성 에이전트가 24시간 다국어로 응대한다"며 "AI가 반복 문의의 70%를 처리할 수 있다"고 말했다.

일레븐랩스는 AI 수용도가 높은 한국을 아시아 시장의 핵심 거점으로 삼는다는 계획이다. 홍 지사장은 "한국은 혁신을 가장 빠르게 수용하는 시장"이라며 "23%의 얼리어답터 비율, K팝과 K드라마로 입증된 글로벌 콘텐츠 파워, 세계에서 가장 까다로운 서비스 기준이 한국 시장을 최적의 시장으로 만들고 있다"고 말했다.


글로벌 5000만 MAU 확보한 음성 AI 유니콘

마티 스타니셰프스키 일레븐랩스 공동 창업자 겸 최고경영자(CEO)는 "일레븐랩스는 기술에 목소리를 부여하고 세상의 지식과 이야기, 그리고 에이전트에 생명을 불어넣는 음성 AI 크리에이티브 기업"이라고 자사를 소개했다.

일레븐랩스는 텍스트 음성 변환(TSS), 음성 텍스트 변환(STT), AI 더빙, 보이스 클로닝, 사운드 효과, 음성 분리, 에이전트 오케스트레이션 등의 기술을 바탕으로  ▲API 파운데이션 ▲크리에이티브 플랫폼 ▲에이전트 플랫폼 등을 제공하고 있다. 현재 5000만명 이상의 월간활성사용자수(MAU)를 확보하고 66억달러(약 9조7000억원)의 기업가치 평가액을 인정 받았다.

마티 스타니셰프스키 일레븐랩스 공동 창업자 겸 최고경영자(CEO)가 회사 설립 배경과 기술에 대해 소개하고 있다. /사진=남도영 기자

스타니셰프스키 CEO는 "한국의 많은 혁신 기업들이 빠르게 기술을 도입하고 있으며 네이버, LG유플러스 등의 투자를 받고 협력하고 있다"며 "크래프톤은 인터렉티브 게임 캐릭터를 소개하고 SBS도 제작과 콘텐츠 현지화를 위해 일레븐랩스와 손을 잡았다"고 말했다.

또 "한국어는 기술적으로 매우 까다롭지만 많은 시간을 들어 세계 최고의 한국어 모델을 만들었다"며 "작년부터 한국어 발음과 억양을 구현하기 위해 많은 개발을 해왔고 향후 선보일 모델은 더 훌륭해질 것"이라고 말했다.

 


"미래는 음성 인터페이스 시대"

일레븐랩스의 음성 AI 플랫폼은 0.5초 미만의 지연 속도로 인간 수준의 자연스러움을 구현했으며, 7000개 이상의 보이스로 32개 언어를 지원한다. 이를 고객관리, 결제, 전화 시스템 등 다양한 업무에 적용할 수 있다. 이날 시연에서 사용자가 AI 보이스의 말을 끊고 질문을 해도 자연스럽게 응대하는 모습을 보여줬다.

스타니셰프스키 CEO는 "1년 전만 해도 불가능했던 기술로 이미 실질적인 성과를 내고 있다"며 "3000만명 이상의 고객을 둔 한 대형 디지털은행은 에이전트 처리 시간을 85% 단축하고 신용카드 관련 문의의 50%를 AI 처리하고 있으며 평균 문제 해결 시간을 15분에서 2분으로 줄였다"고 말했다.

그는 "음성은 기술과 상호작용하는 웨어러블부터 자동차에 이르기까지 모든 디바이스의 주요 인터페이스가 될 것"이라며 "AI 오디오가 언어의 장벽을 허물어 실시간 번역과 더빙을 통해 전 세계 어디서나 콘텐츠에 접근 가능하게 만들 것"이라고 말했다.

또 "미래에는 오디오를 넘어 이미지와 영상까지 아우르는 옴니 크리에이티브 경험이 제공될 것"이라며 "맥락을 이해하고 감정에 반응하는 에이전트가 모든 접점에서 매끄러운 상호작용을 가능하게 할 것"이라고 덧붙였다.

일레븐랩스는 딥페이크 악용과 저작권 침해 등에 대한 우려에 대해 동의(Consent), 통제(Control), 보상(Compensation) 등 '3C 프레임워크'를 통해 해결하겠다고 설명했다. 철저한 검증과 완벽한 추적 및 차단 시스템, 공정한 수익 창출 생태계 구축이 골자다.

스타니셰프스키 CEO는 "이 문제를 제대로 방지해야 한다는 책임감을 갖고 접근하고 있다"며 "업계 내 다양한 기업, 이해당사자들과 협력해 관련 기술을 개발하고 있다"고 말했다.

남도영 기자 hyun@techm.kr