110여개국에서 사용하는 75종 언어를 450여명의 목소리로 말하는 인공지능(AI)앵커가 등장했다.
이스트소프트는 글로벌방송 아리랑TV의 대표 앵커로 활약했던 데빈을 모델로, 다국어 발화가 가능한 AI 휴먼 서비스를 시작했다고 19일 밝혔다.
이스트소프트가 탄생시킨 'AI 휴먼 앵커 데빈'은 북미, 유럽, 중동, 아시아 권역에 속한 총 110여개국의 75종 언어를 발화하고 450여명의 목소리를 생성해 낸다.
이스트소프트의 AI 클론(AI Clone) 기술에 마이크로소프트의 기술이 더해진 결과다. 구체적으로 인물의 외모, 발화 능력·목소리, 특유의 말투와 동작을 그대로 복제해 생성하는 이스트소프트의 AI 클론기술 중 하나인 STF(Speech-To-Face)에 마이크로소프트의 음성합성 기술인 TTS(Text-To-Speech)를 접목했다.
특히, AI 휴먼 앵커 데빈은 같은 언어라도 사용 국가 간 다르게 표현되는 뉘앙스까지 표현해 낸다. 또한, 한층 더 완성도 높은 서비스를 제공하기 위해 글로벌 시장에 통용되는 수준의 영어를 발화할 수 있도록 제작했다. 이스트소프트는 AI 휴먼 앵커 데빈을 이 회사 AI 휴먼 영상제작 소프트웨어인 'AI 스튜디오 페르소'에 탑재해 제공한다.
변계풍 이스트소프트 AI 사업본부 이사는 "자사의 AI 휴먼과 MS의 음성합성 기술 접목 성공으로 110여 개국에서 사용하는 75종의 언어를 세밀한 뉘앙스까지 살려 AI 휴먼이 발화할 수 있게 됐다"며 "완벽한 다국어 발화가 가능한 AI 휴먼 개발로 자사의 AI 휴먼 서비스인 'AI 스튜디오 페르소'가 글로벌 경쟁력을 확보한 만큼, 국내를 넘어 해외로 빠르게 사업을 전개해 나갈 계획이다"라고 전했다.
이수호 기자 lsh5998688@techm.kr