메타가 기존 대비 10배 많은 언어를 음성에서 텍스트 또는 텍스트에서 음성으로 변환해주는 '대규모 다국어 음성인식'(MMS)' 인공지능(AI) 모델을 24일 오픈소스로 공개한다고 밝혔다.
현재 지구상에 사용되는 언어의 수는 7000개 이상으로 알려졌는데, 기존 음성 인식 모델은 최대 100여개의 언어만을지원한다.
메타가 이번에 공개한 AI 모델은 변환이 가능한 언어의 수를 기존 100여개에서 1107개로 10배가량, 음성으로 식별할 수있는 언어의 수를 4000개 이상으로 40배가량 늘렸다는 점에서 의미가 있다.
기존 음성 변환 모델과 비교했을 때 성능도 우수하다. 메타 분석 결과, 음성 변환 언어의 수를 61개에서 1107개로 18배가량 늘렸을 때 문자 오류율은 단 0.4% 증가했다.
또한 오픈AI의 음성인식 모델 '위스퍼'와 비교한 결과, MMS 데이터로 교육된 모델은 단어 오류율을 절반으로 줄이면서도 11배 더 많은 언어를 처리할 수 있는 것으로 나타났다.
메타는 언어 다양성 보존에 기여하고, AI 생태계 전반의 발전과 책임 있는 개발을 위해 MMS 모델과 코드를 오픈소스로공개한다는 계획이다. 또한 수천 개의 언어를 지원하는 단일 음성 모델 구축을 위해 적용 언어 범위를 늘리고, 기존 음성기술로는 다루기 어려운 방언 처리 문제 해결을 위해서도 지속적으로 노력할 계획이라고 설명했다.
이영아 기자 twenty_ah@techm.kr
관련기사
- [테크M 이슈] MS-구글 전쟁에 아마존 참전…생성형 AI '빅테크 삼국지' 개막
- [FreeView] '생성형 AI'로 구글의 심장을 찌른 마소, 네이버는 막을 수 있을까
- 구글 AI 챗봇 '바드' 한국어도 잘하네...글로벌 패권 경쟁 후끈
- 구글·MS '파상공세'에 AI 주권 지켜내려는 네이버 "美·中 견제할 '제3극' 만든다"
- 페북·인스타 '릴스', 마케팅 도구로..."AI가 카피 써준다"
- '버츄얼 프렌드' 만드는 크래프톤 "AI로 새로운 재미·제작 혁신 가능"
- [테크M 이슈] 쿡 vs. 저커버그, 원수는 MR 다리에서 만난다
- [글로벌] 메타, 100개 언어 번역하는 AI 모델 출시했다