[이프 카카오] '보이스톡'으로 통화 녹음하면 AI가 요약...보안도 '확실'
카카오톡 '보이스톡'으로 통화 녹음 기능 뿐만 아니라 AI 요약, 클라우드 저장까지 제공받을 수 있게 됐다.
23일 열린 '이프 카카오 25' 콘퍼런스에서 이은혜 카카오 리더는 "이제 모든 기기로 카카오톡의 보이스톡에서 앱 추가 설치나 어떤 제약 없이 바로 통화 녹음을 사용할 수 있게 됐다"며 "통화 녹음과 AI 요약 및 검색, 톡 클라우드 저장까지 보이스톡 하나로 완벽하게 해결된다"고 밝혔다.
사용자들은 통화 중에 녹음 버튼을 누르면 한 통화당 최대 30분까지 녹음을 할 수 있다. 녹음 기록은 카카오톡에서 쉽게 확인할 수 있다. 통화한 사람과의 채팅방 '종료' 말풍선을 통해서도 다시 들을 수 있고, 채팅 탭에 새로 제공되는 최근 통화 목록에서도 확인할 수 있다.
녹음 이후에는 AI가 채팅처럼 받아쓰기 한 통화 내용을 확인할 수 있다. 화자를 구분해 녹음하는 카나나 AI 기술을 적용해 말이 겹치더라도 양쪽의 말이 선명하게 들리도록 구현했으며, 재생 중에는 해당 대화 내용을 자동 스크롤하며 하이라이트로 표시해준다. 통화 내용을 검색해 필요한 내용을 찾아보는 것도 가능하다.
황동현 카카오 리더는 "보이스톡 통화 녹음은 카나나의 음성 텍스트 변환과 통화 요약 기술을 사용했다"'며 "20만 시간 이상의 학습 내용과 10년 동안의 노하우로 음성을 보다 정확하게 분석한다"고 설명했다.
카카오는 보안에도 신경을 썼다. 통화 녹음은 서버에 저장되지 않으며, 녹음 파일도 사용자의 휴대폰에만 저장되는 구조다. 데이터도 암호화해 저장한다. 톡 클라우드 구독자는 녹음 내용을 암호화해 클라우드에 저장할 수 있으며, 비밀번호를 입력해야만 내용을 확인할 수 있다.
황 리더는 "음성 파일은 파일 자체가 암호화되어 휴대폰에 안전하게 저장이 되며, 해당 파일을 가지고 있어도 카카오톡 외부에서는 재생을 할 수 없다"며 "클라우드 서버에서도 데이터를 암호화해 저장하므로 서버 내에서도 통화 내용의 식별은 불가능하다"고 말했다.
또 "음성 텍스트 변환 서버는 음성을 자체적으로 분석하며 해당 음성이 누구의 음성인지는 전혀 판별이 불가능하다"며 "분석이 완료된 음성 파일은 즉시 폐기가 되며 이용자의 데이터를 학습에 사용하지 않는다"고 말했다.
남도영 기자 hyun@techm.kr