카카오엔터프라이즈가 한 개의 문장만으로 그 사람의 목소리를 합성할 수 있는 '커스텀 음성 합성' 기술을 선보였다.
8일 카카오 연례 개발자 컨퍼런스 '이프 카카오(if kakao)'에서 정성희 카카오엔터프라이즈 연구원은 '한 문장 녹음으로 일초만에 커스텀 음성 합성기 만들기'라는 주제로 발표했다. 카카오엔터프라이즈 인공지능 랩 앤 서비스(AI Lab & Service)의 기술력이 녹아든 사례다.
커스텀 음성 합성은 누구나 원하는 목소리로 합성기를 쉽게 만들 수 있게 해주는 기술이다. 정 연구원은 "이 기술은 합성기가 새로운 목소리를 지원하기 위해 소량의 데이터만 사용하도록 하고, 녹음해야 하는 문장 수가 적기 때문에 일반인도 합성기를 쉽게 만들 수 있다"고 설명했다.
커스텀 음성합성기는 크게 '적응 기반 커스텀 합성기'와 '제로샷 커스텀 합성기'로 나뉜다. 적응기반 합성기는 3가지 모듈로 구성된 다화자 합성기를 2차적으로 훈련하는 단계가 따른다. 이 과정에서 업데이트된 파라미더(매개변수) 저장 용량이 필요하다. 필요한 데이터가 많은 것이다.
반면 '제로샷 커스텀 합성기'는 오직 한 문장의 데이터만 요구된다. 주어진 레퍼런스 음원에서 바로바로 목소리를 복사하고, 새로운 화자 추가를 위해 추가 훈련할 필요가 없다는 장점을 지닌다. 20문장이 데이터가 요구되는 적응 기반 모델과 달리 오직 1문장이면 음성 합성이 가능해진다.
정 연구원은 "목소리 추가 비용을 줄이려면 다 만들어진 합성기에 목소리만 복사-붙여넣기할 수 있는 합성기가 필요하다"며 "카카오엔터프라이즈는 한문장 녹음으로 새로운 화자를 추가할 수 있다"고 강조했다. 성우의 목소리를 추가할 때도 기간이 짧게 들고 비용이 줄어들게 된다.
이영아 기자 twenty_ah@techm.kr
관련기사
- [이프 카카오] '먹통사태' 재발 막는다...카카오 "시스템 전체, 철저한 이중화 약속"
- [이프 카카오] 남궁훈 카카오 "서비스 안정화는 사회적 책임...반성하고 개선할 것"
- [이프 카카오] 카카오 먹통의 원인..."미흡한 장애 대응 매뉴얼 탓"
- [이프 카카오] 카카오 서비스 안정화 위해 투자금 '3배' 늘린다
- [이프 카카오] 카카오 "시스템 다중화 및 데이터센터 추가 건설 약속"
- [이프 카카오] 카카오 뼈아픈 반성의 시간..."시스템 다중화, 투자 3배 늘릴 것"(종합)
- [이프 카카오] "카카오표 기술 나눔으로 더 나은 세상 만들 것"
- [이프 카카오] 카카오 i 클라우드, AI 대중화 이끈다
- [이프 카카오] 카카오 '먹통 사태' 회고..."다중화 미흡 반성"
- [이프 카카오] 배터리실 설계부터 싹 바꾼다...카카오 "최소 4중화 구조"
- [이프 카카오] 카카오브레인 "콜럼버스처럼 AI 헬스케어 개척할 것"
- [이프 카카오] 카카오픽코마 "카카오 웹툰한류로 유럽 잡는다"
- [이프 카카오] "사회적 약자 챙긴다" 카카오톡, 국민 플랫폼으로 '우뚝'
- [이프 카카오] ESG 힘 주는 카카오 "기술 윤리로 디지털 생태계 지킬 것"
- [이프 카카오] 트랜잭션 처리시간 가장 빠른 클레이튼..."메타버스에 가장 적합"
- [이프 카카오] 진화하는 카카오 데이터, 분석툴로 성장했다
- [이프 카카오] 글로벌 개척 나서는 카카오…'믹스쳐클라우드'로 한계 뛰어넘는다
- [이프 카카오] 크러스트가 알려주는 이종 블록체인 간 자산 교환 방법
- [이프 카카오] '韓 대표 인터넷' 카카오 패밀리, 한목소리로 '기술윤리' 외치다
- [테크M 트렌드] 오픈AI가 선보인 '챗GPT'에 IT업계 '들썩'..."대화 넘어 코딩·원고 작성까지"