"오빠, 잘있었어? 우리 참 괜찮은 부부였지."
4년 전 병으로 세상을 떠난 아내가 내뱉은 첫, 그리고 마지막 말이다.
지난 28일 MBC 가상현실(VR) 휴먼다큐멘터리 '너를 만났다' 시즌2 로망스편에서는 인공지능(AI)과 VR 등 최첨단 기술로 먼저 떠나보낸 아내를 재회하는 김정수씨의 모습이 그려졌다.
김정수씨는 이날 5남매와 아내가 10년 가까이 함께 살았던 집부터 건강하고 활기찼던 아내의 생전 모습까지 모두 VR을 통해 만날 수 있었다. 그 중에서도 가장 눈길을 끌었던 것은 바로 음성합성기술로 복원된 아내의 '목소리'였다.
'너를 만났다' 시즌2에서 구현된 KT 음성합성기술
이번 가상 만남에서 엔씨소프트는 모션캡쳐 스튜디오를 지원했고, 사실적인 그래픽을 위해 최첨단 게임엔진 '언리얼'이 활용됐다. 특히 이번 프로젝트에서 아내의 목소리가 실제와 거의 유사하게 복원될 수 있었던 것은 KT의 'AI 음성합성기술(TTS)' 덕분이다.
음성합성기술은 딥러닝 기반 학습을 통해 사람의 목소리를 만드는 기술이다. AI 음성 합성 기술을 활용하면 실제 사람이 녹음하지 않더라도 진짜 목소리와 흡사한 자연스러운 음성을 구현해낼 수 있다.
KT 관계자는 "KT의 음성합성기술을 활용해 아내의 목소리를 복원할 수 있었다"며 "1분 남짓 남아있던 아내의 음성 베이스를 머신러닝하는 프로그램에 집어넣고, 최대한 비슷한 소리가 나게끔 계속해서 근사치를 찾는 과정을 거쳤다"고 말했다.
AI로 청각 장애인 목소리 찾아준 KT
이처럼 KT가 음성합성기술을 활용해 목소리를 구현해낸 것은 이번이 처음이 아니다. 앞서 KT는 선천성 청각 장애인 김소희씨 목소리를 기가지니 AI 음성합성 기술을 통해 구현하기도 했다.
이를 위해 먼저 KT는 김소희씨 가족들의 목소리를 녹음했다. 이어 김소희씨와 동년배인 사람들의 목소리를 분석하고, 구강구조 등 개인의 특성을 반영해 정교화 시키는 목소리 튜닝 과정을 거쳤다. 이후 KT의 AI 기반 반복학습을 통해 목소리를 생산해 낼 수 있었다.
뿐만 아니라 KT는 지난해 7월 '목소리 찾기' 프로젝트를 통해 후천적 청력, 언어 장애인들 대상으로 가족들의 데이터를 분석해 잃어버린 목소리를 찾아주기도 했다. 목소리 찾기는 청력을 잃었거나 사고나 질병 등으로 후천적으로 목소리를 잃은 농인의 목소리를 만들어 주는 프로젝트다.
기존 음성합성기술은 한 문장이라도 본인 목소리 녹음이 필요했지만 KT는 이 프로젝트에서 본인의 목소리를 내기 어려운 농인들을 위해 가족 목소리 데이터를 이용해 목소리를 만들었다. 목소리를 복원하기 위해 가장 중요한 과정은 가족의 목소리 기증과 녹음이다. 각 참가자의 동성 가족 구성원들은 참가자의 목소리 구현을 위해 1000문장을 녹음했다. 인당 평균 6시간이 필요했다.
지난해 8월 JTBC '마음을 전하는 AI 기술: 나의 목소리를 찾아서'에 소개된 농인 제빵사 우찬휘씨도 KT의 AI 기술을 통해 목소리를 구현할 수 있었다. KT는 우찬휘씨 목소리를 추론하기 위해 가족의 목소리를 녹음하고 구강 구조를 분석해, 모든 말을 목소리로 구현하도록 AI 학습을 진행했다.
KT 관계자는 "KT가 국내 최초로 추진한 목소리 복원 프로젝트가 청력이나 목소리를 잃은 사람들에게 희망이 되고 있다"며 "이처럼 불편을 해소하고 보다 나은 삶을 돕는 '새로운 가능성의 AI 기술'을 더욱 발전시키기 위해 노력하겠다"고 전했다.
KT, AI '음성인식기술'도 강하다
한편, KT는 '음성합성기술' 뿐만 아니라 '음성인식기술'에도 강하다. 대표적으로 AI 비서라고 불리는 '기가지니'가 있다.
신종 코로나바이러스 감염증(코로나19) 확산으로 집에서 생활하는 시간이 많아지면서 KT 기가지니 사용자는 지난해 9월 250만명을 돌파했다. 기가지니는 음성 명령을 받아 TV, 음악 감상, 일정관리, 교통 안내, 사물인터넷(IoT) 기기 제어 등의 기능을 제공하고 있다. 특히 다양한 대화주제(도메인)로 분류된 많은 양의 음성데이터와 딥러닝 기반 학습을 통해서 높은 음성 인식률과 넓은 인식 커버리지를 자랑한다.
출시 초기 음성인식 기반 AI 셋톱박스 수준이던 기가지니는 KT의 머신러닝, 빅데이터 역량이 더해져 현재는 B2C 뿐만 아니라 호텔과 커넥티드카 등 기업간거래(B2B) 영역에서도 두각을 나타내고 있다.
이처럼 최근 KT는 음성합성, 음성인식 기술 개발에 적극적으로 나서고 있다. 디지털플랫폼기업 '디지코'로 거듭나기 위해 AI 분야에도 힘을 주는 것으로 풀이된다. 이를 위해 지난 25일 KT는 로보틱스 분야의 세계적 권위자 데니스 홍 미국 로스앤젤레스 캘리포니아대학(UCLA) 교수를 자문으로 영입하는 등 AI와 로보틱스 분야의 핵심 인재를 영입하기도 했다. 스마트한 젊은 인재 영입과 집중적인 투자로 미래의 성장 엔진인 AI 분야에서 일류 기업으로 거듭난다는 전략이다.
김경영 기자 managment@techm.kr
관련기사
- [주목 테크M] 테크의 힘을 보여준 '너를 만났다'
- "KT가 '마음을 담아' 청각장애인의 목소리를 찾아드립니다"
- KT 음성합성기술로 20명 청각장애인 목소리 찾았다
- [IT진맥] '너를 만났다 시즌2'가 보여준 테크의 힘... 그리고 '이루다'가 던진 질문
- KT, 최대 5000명 접속 가능한 기업용 화상회의 플랫폼 출시
- "중소상공인 돕는다" KT, '통신 데이터' 기반 유동인구 빅데이터 할인 제공
- "토종 클라우드 생태계 확장" KT, 클라우드 원팀 1차 정기 협의체 개최
- 'ABC' 사업 힘주는 KT… 영업이익 '1조 시대' 이어간다
- 아직도 언리얼이 게임엔진? 디지털휴먼, 영상제작도 '언리얼'
- KT "시즌서 '심야카페' 시즌 2·3 통신사 관계없이 무료로 보세요"
- 미운오리로 불린 'VR·AR'...2021년 메타버스로 꽃 피운다