수퍼톤, TTS 모델 '수퍼토닉' 오픈소스 공개...'소나 스피치 2t'도 연내 선봬
수퍼톤은 하루 전 온디바이스 기반 텍스트 투 스피치(TTS) 모델 '수퍼토닉'을 누구나 자유롭게 사용하고 수정, 배포할 수 있는 오픈소스로 공개했다고 20일 밝혔다.
수퍼토닉은 일반 노트북이나 모바일 환경에서도 빠른 속도로 구동할 수 있다. 사용자의 기기에서 AI 연산 처리가 되는 온디바이스 모델이다. 클라우드나 네트워크 연결 없이도 텍스트를 고품질 음성으로 바꾼다. 클라우드 서버로의 데이터 송수신에 수반되는 지연 문제나 정보 유출 우려에서 비교적 자유롭다.
6600만개 파라미터(매개변수)의 초경량 구조로 설계돼 교육용 초소형 컴퓨터와 고가의 GPU가 없는 일반 노트북, 모바일 환경에서도 실시간 수준으로 음성을 생성할 수 있다.
수퍼토닉 소스코드는 개발자 협업 플랫폼인 깃허브에서 확인할 수 있다. 또 모델의 학습 결과물인 체크포인트와 모델을 체험해볼 수 있는 데모 페이지는 AI 모델 공유 플랫폼인 허깅페이스에 있다. 소스 코드는 파이썬, C++, 자바스크립트 등 8개 이상 프로그래밍 언어로 지원된다.
'수퍼톤 API'를 통해 '소나 스피치 2t'도 연내 공개 계획이다. 소나 스피치 2t는 수퍼토닉처럼 온디바이스 TTS 모델이지만 API 형태로 제공된다는 차이가 있다. API는 개발자들이 다른 서비스에서 제공하는 데이터나 기능을 가져와 자사 서비스에 내재화할 수 있는 디지털 연결고리 역할을 한다. 소나 스피치 2t는 영어, 한국어, 일본어, 스페인어, 포르투갈어에 대한 TTS가 가능한 형태로 서비스 예정이다.
이교구 수퍼톤 대표는 "수퍼토닉 오픈소스 공개로 온디바이스 TTS 기술의 표준화와 경량화를 선도하고 개발자 커뮤니티와의 협업을 확대할 계획"이라며 "인공지능 컨택센터(AICC), 음성 에이전트, 에듀테크나 이러닝 등 다양한 산업군에서의 음성 AI 기술 활용 범위를 넓혀갈 것"이라고 전했다.
임경호 기자 lim@techm.kr