'상위 1% 수준의 전문가 AI' 지향
신소재 개발 등 계열사 협업 통한 실증 추진
글로벌 파트너사와 '연합'으로 생태계 확장
구광모 LG그룹 회장이 그룹의 미래를 이끌 조직으로 내세운 LG AI연구원이 대규모 데이터를 스스로 학습해 인간처럼 사고하고 판단할 수 있는 초거대 인공지능(AI) '엑사원(EXAONE)'을 전격 공개했다.
LG는 각 분야 전문가 수준의 사고 능력을 갖춘 엑사원을 계열사 사업에 우선 적용하고, 향후 API 공개와 외부 파트너십 등을 통해 '초거대 AI 생태계'를 확장해 나간다는 계획이다.
LG AI 연구원, 1년 만에 괄목할 연구성과 거둬
14일 LG AI 연구원은 설립 1주년을 맞아 온라인으로 열린 'LG AI 토크 콘서트'를 통해 엑사원을 공개하고 주요 연구성과와 향후 계획을 발표했다.
배경훈 LG AI연구원 원장은 "지난 1년 최신 AI 기술 연구로 글로벌 톱티어 학회 기준으로만 올해 총 18건 논문 채택되는 성과를 거뒀다"며 "국내 인공지능 연구조직 중에 창립 첫해부터 이런 우수한 성과를 낸 곳은 LG AI 연구원이 유일하다"고 말했다.
지난 1년 LG AI 연구원은 컴퓨터가 사람처럼 주어진 문서를 읽고 질문에 대한 정답을 찾아내는 기계독해(MRC) 분야의 리더보드인 스탠퍼드대 SQuAD에서 1위를 차지하는 등 우수한 연구 성과를 내고 있다. 특히 연구원은 계열사 AI 조직과 협력해 산업 문제 해결에 최신 AI 기술을 적용하며 실질적인 성과 창출에 나섰다.
배 원장은 "LG그룹이 가진 큰 장점 중 하나는 다양한 업종의 계열사가 있다는 것"이라며 "이는 최신 AI 연구성과를 비즈니스에 접목할 수 있는 이상적인 토대가 된다"고 설명했다. 이어 "실제 LG의 산업 현장에서는 최신 AI 기술이 적용돼 난제가 해결되고 이로 인해 돌파구(Breakthrough)가 창출되고 있다"며 "설립 첫해 사업적 임팩트가 크고 난이도가 높은 난제 18건을 해결해 약 2000억원대 이상의 사업적 가치를 창출했고, 내년에는 25건 이상의 난제 해결에 도전할 예정"이라고 말했다.
LG AI 연구원은 지난 1년 ▲맞춤형 항암 치료제 개발을 위한 신항원 예측 모델 개발 ▲세계 최고 수준의 MRC 기술을 적용한 챗봇 개발 ▲비지도 학습(Unsupervised Learning) 방식의 품질 검사 AI 세계 최초 상용화 등의 성과를 거뒀다. 이 같은 산업 현장의 혁신을 고객 한 명 한 명을 위한 맞춤형 서비스로 만들기 위한 LG의 무기가 바로 초거대 AI 엑사원이다.
단위부터 차원이 다른 초거대 AI '엑사원'
고객 개인이 필요로 할 때마다 AI를 통해서 이렇게 수준 높은 전문가 서비스를 손쉽게 받을 수 있게 된다면 우리는 좀 더 창조적인 영역에 집중할 수 있게 되고 우리의 삶은 더 가치 있어질 것이다. LG의 초거대 AI가 전문가 AI를 지향하는 이유가 바로 이것이다.
배 원장은 엑사원을 소개하며 "우리는 상위 1% 수준의 전문가 AI야 말로 고객에게 진정으로 필요한 AI라고 생각한다"며 "LG의 초거대 AI를 통해서 고객은 나만의 회계사, 변호사, 가정교사, 주치의, 쇼핑 큐레이터 등을 가지게 될 것"이라고 설명했다.
엑사원은 '인간을 위한 전문가 AI(EXpert Ai for everyONE)'라는 의미이며, 10의 18승 즉, 100경(京)을 뜻하는 접두어 'EXA'의 의미도 갖고 있다. 인류가 지금까지 사용한 모든 단어를 데이터로 저장한다고 가정할 때 그 양이 5엑사바이트(Exabyte)라는 점에 착안해 초거대 AI의 규모를 상징하는 이름으로 쓰였다.
백 원장은 엑사원이 언어와 시각 정보를 모두 다룰 수 있는 '멀티 모달 초거대 AI' 모델이라는 점에서 지금까지의 모델들과 차별화된다고 설명했다. 문서나 대화를 이해하고 문장을 생성하는 기존의 언어 모델에서 한 발 더 나아가 이미지를 텍스트로 표현하고 텍스트를 이미지로 시각화하는 능력을 갖췄다는 의미다.
엑사원의 학습 데이터는 국내 최대 규모를 넘어서 세계 최대 규모에 달한다. 연구원은 엑스원의 학습을 위해 세계 최대 규모에 준하는 2억5000만장 이상의 이미지 텍스트 페어 데이터를 사용했다. 이 방대한 데이터를 학습한 엑사원은 이미지와 텍스트 간 자유로운 양방향 생성이 가능해졌다. 예를 들어, 기존 AI는 텍스트를 분석해 이미지를 찾는 수준이었다면, 엑사원은 "호박 모양의 모자를 만들어 줘"라고 말하면, 학습된 정보를 기반으로 스스로 판단해 '호박 모양의 모자' 이미지를 새롭게 만들어 낸다.
백 원장은 "엑사원의 벤치마크 결과는 이미 13억개, 130억 개 모델 성능만으로도 글로벌 최고 수준인 'SOTA(State-of-the-art)'를 달성했다"며 "전문가 커뮤니케이션에서 가장 중요하다고 할 수 있는 목적 대화와 감성 분류의 영역에서 최고 수준을 기록하였을 뿐만 아니라 이미지 복원의 퀄리티를 보여주는 FID 스코어에서 최상의 점수를 기록하고 실제 애플리케이션에 활용 가능한 해상도로 이미지를 생성한다"고 말했다.
LG가 키운 '전문가 AI' 학습량부터 남다르다
엑사원은 6000억개의 한국어 영어 말뭉치 토큰을 학습에 사용해 한국어와 영어 두 언어의 특징을 동시에 학습한 '바이링구얼(이중언어) AI'로 성장했다. 미국 AI연구소 오픈AI가 개발한 초거대 AI인 'GPT-3'가 영어를 학습하고, 국내에서 개발 중인 다른 초거대 AI들이 한국어에 집중하는 것과는 차별화된 지점이다.
이와 함께 엑사원은 뉴스, 사전 등 공개 데이터 외에도 전문가 능력 학습을 위해 LG전자, LG화학, LG유플러스, LG CNS 등 LG 계열사들이 보유하고 있는 수억 건의 상담 데이터, 수십만 건의 학술 논문 및 특허 문서 등 전문 데이터를 학습에 사용했고, 지속적으로 추가하는 중이다.
엑사원은 지난 5월 개발을 시작한 이후 인간의 뇌에서 정보를 학습하고 기억하는 '시냅스'와 유사한 역할을 하는 인공 신경망의 파라미터를 13억개, 130억개, 390억개, 1750억개 등 단계적으로 키워왔다. 파라미터는 AI가 딥러닝을 통해 학습한 데이터가 저장되는 곳을 말하며, 이론상 파라미터가 많을수록 AI가 더 정교한 학습을 할 수 있는 것으로 알려져 있다. 현재 엑사원은 국내 최대 규모인 3000억개 파라미터 모델을 학습 중에 있다.
배 원장은 "아직 벤츠마크 테스트 중인 1750억개, 3000억 개 모델의 성능 측정이 완료되면 현재 기록한 최고 수준을 또다시 뛰어넘을 것이라고 확신한다"며 "결과가 나오는 대로 홈페이지나 학회 등을 통해서 공개할 것"이라고 말했다. 또 "초거대 AI 모델에는 대규모 인프라가 필수적"이라며 "엑사원 학습을 위해 초당 9경6000조번 연산이 가능한 슈퍼 컴퓨터급 인프라를 구축했고, 내년에 두 배로 확대할 계획"이라고 말했다.
LG '초거대 AI 생태계' 구축 나선다
연구원은 집단지성을 활용한 초거대 AI 생태계 조성을 위해 ▲LG 계열사와의 협업을 통한 실증 ▲국내를 포함한 글로벌 AI 연합 결성해 활용 영역 확대 ▲초거대 AI 대중화를 통한 상생 환경 구축 등 3단계 계획을 발표했다. 우선 엑사원을 사용할 수 있는 통로인 '오픈 API'를 LG 계열사들에게 공개해 전자, 화학, 통신 등 LG 사업 전반에 초거대 AI를 적용할 수 있도록 했다.
LG AI 연구원은 현재 여러 계열사와 함께 양극제, 발광소재, 친환경 촉매와 같은 AI 기반 신소재 신물질 발굴 과제를 진행 중이다. 신소재를 발굴하는 AI를 학습시키기 위해서는 전공자가 특허나 논문 문서 전체를 읽고 해당 내용을 요약해서 데이터베이스에 입력해야 한다. 현재는 대부분 수작업으로 이뤄지고 있지만, 문헌 전체의 컨텍스트를 이해할 수 있는 엑사원을 활용하면 대규모의 물질 데이터를 효과적으로 추출하는 것이 가능해진다.
배 원장은 "엑사원의 능력을 바탕으로 지난 100년 간에 발간된 모든 논문들의 물질 정보를 데이터베이스화하고, 이로부터 신소재, 신물질 발굴 AI가 새로운 인사이트를 발견해내는 작업을 진행할 예정"이라며 "이런 방대한 자료를 이해하고 지식을 끌어내는 것은 인간 전문가라고 해도 감당하기 어려운 일이며, 초거대 AI 진정 그 빛을 발하는 지점이라 할 수 있다"고 설명했다.
이후 LG AI연구원은 금융, 패션, 유통, 교육 등 다양한 글로벌 파트너사와 함께 연합을 결성해 초거대 AI 활용 영역을 넓혀 나갈 계획이다. 연구원은 연합을 결성할 때 가장 중요한 요소인 데이터 보안 문제를 해결하기 위해 '엑사원-튜닝(EXAONE-Tuning)'이라는 알고리즘도 자체적으로 개발했다. 이를 활용하면 개인정보나 영업비밀 등이 포함된 데이터를 외부에 노출하지 않으면서 파트너서가 활용 목적에 맞게 최적화된 전문가 AI를 얻을 수 있게 된다.
연구원은 초거대 AI를 일반 대중까지 공개하는 방안도 검토 중이다. 배 원장은 "이 마지막 단계를 위해서는 추론 인프라를 보강해야 하고 과금 체계도 고민해야 하며 사용자의 부담을 덜기 위해서 최적화와 경량화 연구에도 많은 노력이 필요하다"며 "이런 고민들을 체계적으로 정리해 나가고 있으며 정부에서도 다양한 지원을 준비하고 있어서 엑사원 확산에 도움이 될 것으로 보고 있다"고 말했다.
메타버스 시대 고객 경험 혁신도 초거대 AI로
향후 LG는 엑사원을 언어나 이미지뿐만 아니라 소리, 영상, 촉감 등 인간의 다양한 감각 기관을 통합한 진정한 멀티모달 AI로 발전시켜 나간다는 계획이다.
배 원장은 "각종 감각이 어우러지는 메타버스 환경에서 고객의 관심과 니즈를 충족하기 위해선 다양한 모달리티를 동시에 받아들이고 사고할 줄 아는 멀티 모달 AI가 필수 요건"이라며 "멀티모달 AI 기술이 아바타, AI 휴먼, 메타버스 등과 연계해 새로운 미래를 열 것이라고 기대하고 있다"고 말했다.
LG AI연구원은 이날 엑사원이 제공할 수 있는 새로운 메타버스 고객 경험 사례로 크리스마스 파티를 준비하는 엑사원이 고객이 말하는 의도를 파악해 의상을 직접 만들어 추천하고, 집안의 공간을 꾸미는 과정을 보여줬다.
배 원장은 "초거대 AI도 연구가 필요한 과제가 아직 많다"며 "캐나다 토론토 대학, 미국 미시건 대학, 서울대, 카이스트와 초거대 AI 관련 다수의 연구 협력을 진행하고 있으며 내년에는 더 깊은 연구 협력을 계획하고 있다"고 말했다.
남도영 기자 hyun@techm.kr
관련기사
- KT, AI 원팀에서 '초거대 AI' 개발 나선다
- '국가대표 AI 기업' 통신3사·네이버·카카오·삼성 뭉쳤다…'초거대 AI' 생태계 구축(종합)
- [IF KAKAO] "게 섯거라 네이버"...카카오 '초거대 AI' 개발 뛰어들었다
- [데뷰2021] 네이버 '초거대 AI'로 글로벌 빅테크에 도전장
- '초거대 AI' 힘주는 카카오브레인, 국내 최대 수준 슈퍼컴퓨터 도입
- "마이데이터 서비스를 미리 만나보세요"... LG유플러스 '디키타카' 시범 서비스 개시
- [카드뉴스] LG의 초거대 AI '엑사원' 베일 벗었다...LG그룹 사업 전반에 적용
- LG U+, O-RAN 실증랩에서 글로벌 생태계 싹 틔운다
- "안녕하십니까, 구광모입니다" 이른 새해 인사에 담긴 메시지는 '고객 경험 혁신'
- LG CNS, '구글 프리미어 파트너 어워즈'서 3회 연속 수상
- "초거대 AI로 버추얼휴먼 만든다"...브이에이코퍼레이션, LG AI연구원과 맞손
- LG CNS, 협력사 온라인 채용관 구축…"IT 인재 확보·양성 지원"
- [신년사] 김영섭 LG CNS 대표 "DX 역량 강화로 '디지털 성장 파트너' 도약"
- 구글클라우드, LG 초거대 AI '엑사원'에 클라우드 TPU 제공
- LG '엑사원', 퓨리오사AI '레니게이드' 품고 생성형 AI 경쟁력 높인다
- LG, 상위 1% 전문가급 AI '엑사원 2.0' 공개…"신소재·신물질·신약 개발에 활용"
- 논문으로 공부한 전문가 AI 'LG 엑사원 2.0'..."산업 현장에서 성공사례 만들 것"(종합)