19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 배경훈 LG AI연구원장이 엑사원(EXAONE) 2.0을 발표하고 있는 모습. /사진=LG 제공
19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 배경훈 LG AI연구원장이 엑사원(EXAONE) 2.0을 발표하고 있는 모습. /사진=LG 제공

"엑사원은 실제 산업 현장에서 활용할 수 있는 전문성과 신뢰성을 갖춘 특화된 AI 모델이다"

배경훈 LG AI연구원장은 19일 서울 강서구 마곡 LG사이언스파크 컨버전스홀에서 열린 'LG AI 토크 콘서트 2023'에서 초거대 멀티모달 AI '엑사원 2.0'을 공개하며 이 같이 밝혔다.

엑사원은 구광모 LG 회장이 미래 성장 동력으로 집중 육성하고 있는 AI 사업의 핵심이다. LG는 2020년 그룹 AI 연구의 싱크탱크 역할을 할 LG AI연구원을 설립하고 2021년 12월 엑사원을 처음 선보였다. 엑사원은 국내에서 유일하게 영어와 한국어를 모두 이해하는 '이중 언어' 모델과 텍스트와 이미지를 서로 인식하는 '양방향 멀티모달' 모델을 모두 상용화한 사례로 손꼽힌다.

이날 공개된 엑사원 2.0은 '상위 1%의 전문가 AI'를 표방하고 있다. 특히 산업 영역에서 활용할 수 있는 전문성과 신뢰성을 갖춰 기존 생성형 AI 모델과는 차별화를 뒀다는 설명이다. 이런 차별화를 바탕으로 산업 현장에서 실제 성공사례를 만들고, 시장을 선점해 '퍼스트 무버'의 이점을 누리는 게 LG의 목표다.

배경훈 원장은 "생성형 AI 경쟁은 앞으로도 더 치열해질 것"이라며 "이럴 때일수록 차별점을 잘 만들어야 한다"고 강조했다. 그는 "LG 엑사원은 전문성과 신뢰성에 있어선 글로벌 최고 경쟁력을 갖췄다"며 "이를 실제 산업 현장에서 입증하고 성공 사례를 만들어 나갈 것"이라고 강조했다. 


'전문가 AI'는 교재부터 다르다

지난해 말 '챗GPT'와 함께 전 세계적 관심을 모았던 생성형 AI는 '그럴듯한 거짓말'을 하는 '환각'(할루시네이션) 문제로 실제 활용 사례를 만드는 데 한계를 보이고 있다. 챗GPT의 유창한 언변에 세상이 놀랐지만, 실제 중요한 일을 시키자니 신뢰하기가 어렵다는 얘기다. 최근 챗GPT 방문자가 둔화되는 추세인 것도 이런 한계를 반영한다는 분석이 나온다.

인터넷에 떠도는 데이터를 학습한 챗GPT와 달리 LG 엑사원 2.0은  파트너십을 통해 확보한 특허, 논문 등 약 4500만 건의 전문 문헌과 저작권 문제를 해결한 3억5000만장의 이미지를 학습했다. 데이터양을 4배로 늘려 학습량으로 글로벌 최고 수준일 뿐만 아니라, 저작권과 개인정보 등의 문제가 없는 신뢰할 수 있는 데이터를 학습시켰기 때문에 애초에 잘못된 정보를 말할 가능성이 적다는 설명이다.

19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 엑사원 디스커버리(EXAONE Discovery)를 발표하고 있는 배경훈 LG AI연구원장 /사진=LG 제공
19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 엑사원 디스커버리(EXAONE Discovery)를 발표하고 있는 배경훈 LG AI연구원장 /사진=LG 제공

이런 엑사원의 강점은 전문 지식을 다루는 대화형 AI 플랫폼 '엑사원 유니버스'에서 잘 드러난다. 엑사원 유니버스는 챗GPT와 같이 대화형으로 질의응답이나 텍스트 분류·요약, 키워드 추출·생성 등을 수행해준다. 다만 다른 대화형 AI들과 달리 사전 학습한 전문 영역의 데이터는 물론, 각 도메인별 최신 데이터까지 포함해 근거를 찾아내며 추론한 답변을 생성한다.

이와 더불어 질문에 대한 답변과 함께 화면 좌측과 우측에 각각 질문과의 연관성이 가장 높은 전문 문헌들과 AI가 답변하는 과정에서 활용한 단락을 표시해 사용자가 답변의 근거를 직접 확인할 수 있도록 했다. 이날 행사에선 엑사원 유니버스가 "대형언어 모델에서 환각문제를 어떻게 극복할까", "AI 자동화가 사람 일자리를 대체할까" 등의 질문에 답하는 모습을 시연했다. 엑사원 유니버스는 전문가 수준의 인사이트를 제공했을 뿐만 아니라, 답변의 근거까지 보기 좋게 정리해 보여줬다.

배 원장은 "트랜스포메이션 구조 상 환각 문제를 100% 해결할 수는 없지만, 모델을 전문적인 데이터로 학습시키고 구조적으로 질문한 내용과 가장 유사한 문서를 찾아내 그 내용을 바탕으로 답을 찾는 방식으로 해결책을 찾았다"며 "전문가들이 답변의 생성 근거를 보는 두 가지 방법을 더해 신뢰성을 확보한 것"이라고 말했다. 

LG AI연구원은 현재 엑사원 유니버스를 AI 연구에 활용하고 있으며, 향후 화학, 바이오, 제약, 의료, 금융, 특허 등 각 도메인에 최적화된 서비스로 개발한다는 방침이다. 오는 7월 31일부터 LG 그룹 내 AI 연구자, 협력 중인 대학을 대상으로 서비스를 시작하며, 9월에는 LG에서 AI를 연구하거나 공부하는 임직원 대상으로 정식 서비스를 진행할 계획이다.


신소재 개발로 '성공사례' 만든다

LG AI연구원은 엑사원 2.0이 실제 산업현장에서 실질적인 활용 사례를 만들 수 있도록 한다는 계획이다. 최근 미국 빅테크를 비롯한 많은 기술기업들이 생성형AI 개발에 나섰지만, 아직 산업 현장에서 성공적으로 안착한 활용 사례가 많지 않은 만큼 발빠르게 시장 선점에 나선다는 전략이다.

연구원이 가장 먼저 노리고 있는 분야는 '소재' 개발이다. LG 그룹 특성상 좋은 소재 개발이 부품이나 완제품 경쟁력으로 이어질 가능성이 크기 때문이다. 이를 위해 연구원은 신소재·신물질·신약 관련 탐색에 특화된 '엑사원 디스커버리'를 선보였다. 

엑사원 디스커버리의 핵심은 논문과 특허 등 전문 문헌의 텍스트와 분자 구조, 수식, 차트, 테이블, 이미지 등을 AI가 읽고 학습할 수 있는 형태로 데이터베이스화 하는 '심층 문서 이해(DDU)' 기술이다. 이를 통해 확보한 데이터를 기반으로 '소재 구조 설계(UMDn)'와 '소재 합성 예측(NCS)' 기술을 결합해 신소재를 찾아낸다. 연구소 측은 엑사원 디스커버리가 1만회가 넘었던 합성 시행착오를 수십회로 줄이고, 연구개발 소요 시간은 40개월에서 5개월로 단축시킬 수 있을 것으로 기대했다.

연구원은 올 4분기 그룹 내 화학 및 바이오 분야 연구진들을 대상으로 엑사원 디스커버리를 제공해 상용화 단계로 나아간다는 계획이다.


광고 카피부터 SNS 피드까지 '척척'

엑사원 2.0은 기업간거래(B2B) 시장에 특화된 모델로 개발되고 있지만, 일부 일반 사용자(B2C)들에게도 활용될 수 있을 전망이다.

이미지 생성과 이미지 이해에 특화된 '엑사원 아뜰리에'는 저작권이 확보된 이미지-텍스트가 짝을 이룬 페어(Pair) 데이터 3.5억 장을 학습했다. 최근 무분별한 학습으로 작가들의 반감을 사고 있는 다른 이미지 생성 모델과는 차별화되는 부분이다.

LG AI연구원은 엑사원 아뜰리에가 제품 디자인이나 광고를 위한 마케팅 문구 등을 제작하는 데 활용될 수 있을 것으로 봤다. 이미 엑사원 생성 이미지로 LG생활건강 '숨37' 패키지 디자인이 선을 보이기도 했다. 이와 함께 소셜네트워크서비스(SNS) 피드 문구를 생성하는 등 일반 사용자들이 일상에서 활용할 수 있는 기회도 제공할 방침이다.

앞서 LG AI연구원은 지난 6월 디지털 이미지 라이센싱 서비스 기업 셔터스톡과 함께 '캡셔닝 AI' 기능 상용화에 나섰다. 캡셔닝 AI는 처음 보는 이미지까지 자연어로 설명할 수 있으며, 이미지 검색에 활용할 수 있는 정보인 문장이나 키워드 등의 메타 데이터를 생성한다.

LG AI연구원은 올해 3분기에 그룹 내외부 전문 디자이너를 대상으로 엑사원 아틀리에 서비스를 시작할 예정이다.


미래를 '예측'하는 AI 나온다

LG AI연구원은 엑사원의 향후 연구 방향으로 '예측' 성능을 강화하는 것을 꼽았다. 배성훈 원장은 "AI의 숙제는 미래 예측에 생성형 AI를 잘 접목하는 것"이라며 "현재까진 정형화된 데이터를 기반으로 하고 있지만, 향후에는 비정형화된 데이터와 결합해 가격, 수요, 주가 등을 높은 수준으로 예측해 제공할 수 있을 것"이라고 말했다.

19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 LG AI연구원의 연구 리더들이 질의응답을 진행하고 있다. /사진=LG 제공
19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 LG AI연구원의 연구 리더들이 질의응답을 진행하고 있다. /사진=LG 제공

AI를 보다 자연스럽게 활용할 수 있도록 만드는 '액셔너블 AI'도 과제로 꼽힌다. AI 스피커가 딱딱한 말투로 성장에 한계를 보였고, 챗GPT와 같은 생성형 AI 챗봇 역시 프롬프트로 명령을 입력해야 하는 번거로움이 있는 데, 연구원은 이런 불편 없이 인간 행동에 자연스럽게 녹아들기 위해 명령 없이 스스로 판단해 피드백을 주는 AI에 대한 연구를 진행한다는 계획이다.

배성훈 원장은 "2021년 엑사원 발표 이후 2년 넘게 생성형 AI를 연구하며 많은 시행착오가 있었고 어떤 분야에 어떻게 적용할 지에 대해 고민을 많이 했다"며 "엑사원 2.0이 완벽하진 않아도 부족한 부분을 개선하고 장점을 살려서 좋은 사례를 만들어 가겠다"고 말했다.

남도영 기자 hyun@techm.kr

 

관련기사