'LLM 온디바이스 구동·고화질 영상 시청' 동시 시연
NPU 역할 강화, CPU·GPU 타 작업 활용↑…전력 효율화
퀄컴이 세계 최고속 PC용 신경망처리장치(NPU)를 갖춘 PC용 시스템온칩(SoC) '스냅드래곤X2 엘리트 익스트림'과 '스냅드래곤X2 엘리트'를 상용화했다. NPU 속도는 80톱스(TOPS)다. PC 제조사는 오는 2026년 1분기 이를 장착한 제품을 출시할 예정이다. NPU가 빠르면 장점은 무엇일까. 퀄컴은 세계 언론을 대상으로 체험 행사를 열고 초고속 NPU는 PC 사용 패턴을 바꿀 것으로 예견했다.
11일과 12일(현지시각) 퀄컴은 미국 샌디에이고 퀄컴 본사에서 '스냅드래곤X2 시리즈 인공지능(AI) 시연회'를 가졌다.
카우시크 칼리타 퀄컴 엔지니어링 시니어 디렉터는 "스냅드래곤X2 시리즈는 온디바이스(기기 내부 처리) AI로 메타 '라마2' 700억개 매개변수(파라미터)급 모델 실행이 가능하다"라며 "NPU가 작업하는 동안 중앙처리장치(CPU)와 그래픽처리장치(GPU)는 거의 유휴(Idle) 상태로 다른 애플리케이션(앱)을 실행할 여유를 충분히 갖고 있다"라고 설명했다.
퀄컴은 초고화질(4K) 영상을 재생하며 라마2 구동을 가정했다. 라마2는 온디바이스와 클라우드 실행을 자동으로 오갈 수 있도록 설정했다. 'AI가 인간에게 왜 중요한지 간략하게 설명해달라'고 질문하자 온디바이스 NPU가 돌아갔다. '두 행렬을 곱하는 파이썬 프로그램을 작성해줘'라는 문의는 클라우드로 돌렸다. CPU GPU NPU는 유휴로 들어가는 대신 와이파이 트래픽이 급증했다.
칼리타 디렉터는 "'사르밤 AI'는 240억개 매개변수를 지닌 인도 LLM으로 이 역시 에지 환경에서 초당 17토큰이라는 속도로 실행이 가능해졌다"라며 "복잡한 힌디어를 포함해 10종의 인도 언어와 영어를 모두 미세조정(파인튜닝)했다"라고 전했다.
휴대 기기에서 PC를 'AI 핫스팟'으로 이용하는 사례도 공개했다. 스마트 안경을 착용한 사용자가 내 PC에서 AI를 활용하면 개인정보 보호에도 유리하다.
칼리타 디렉터는 "'라마3' 및 '라마2.5' 등 여러 모델을 NPU 최적화 버전으로 내장한 애니씽 LLM을 통해 PC의 고성능 NPU를 원격으로 사용하는 상황"이라며 "모바일에서 가방에 있는 PC를 AI 가속기로 쓰는 셈"이라고 말했다.
한편 퀄컴은 창작 AI 미래도 제시했다. 문자를 입력하면 영상을 만들고 또 이 영상을 더 높은 화질로 향상하는 형태다. '토파즈랩스 AI' 등을 썼다. 멀티모달 AI도 빠질 수 없다. 입출력 수단이 다른 AI를 지칭한다. 이 역시 NPU가 주체적으로 나선다.
칼리타 디렉터는 "'나뭇잎에 낮은 나비'라는 문장을 앱력하면 즉시 NPU가 영상을 만들고 영상 AI로 가져와 업스케일링을 시작한다"라며 "NPU와 GPU 무엇이 유용한지는 자동으로 고르며 성능을 극대화한다"라고 분석했다.
샌디에이고(미국)=윤상호 기자 crow@techm.kr
관련기사
- [스냅드래곤 딥다이브] 퀄컴 "올웨이스 온 AI PC, '저전력 고성능 NPU' 필수"
- [스냅드래곤 딥다이브] 퀄컴 "PC 전원 유무 성능차 최소화…'전성비=퀄컴 DNA'"
- [스냅드래곤 딥다이브] 케다르 콘답 퀄컴 본부장 "AI 거품론이 '거품'…AI는 '실제'"
- [카드뉴스] 'AI는 이제 판단하고 실행한다'...구글과 MS가 그리는 AI 에이전트의 미래는
- [가봤다] 던파 게이머들은 오프라인 축제도 진심이다...'던파 페스티벌' 현장 모습은
- "당해본 사람이 안 당한다"…LG유플러스, B2C·B2B 보안 사업 확대
- ICT업계, 연말 ESG 활동 '활발'…무인 기부·친환경·상생 '다양화'
- 네이버 이해진-두나무 송치형 합병 전략 직접 밝힌다...27일 네이버서 공동 기자회견
- [크립토 주간 브리핑] 업비트 종합지수 5.58% 하락...비트코인·이더리움 동반 약세
- [카드뉴스] 퀄컴이 여는 새로운 PC시대.. 스냅드래곤X2로 드러난 ‘5대 혁신 영역’ 총정리