루시안 코드레스쿠 부사장 "세계 최고속 PC용 NPU, '인텔 5.7배·AMD 2.4배' 빨라"

루시안 코드레스쿠 퀄컴 기술 부사장/사진=윤상호 기자
루시안 코드레스쿠 퀄컴 기술 부사장/사진=윤상호 기자

"6세대 헥사곤 신경망처리장치(NPU)는 세계 최고속 PC용 NPU다. 최대 속도는 80톱스(TOPS)로 전작대비 78% 빨라졌다. 얇고 가벼운 노트북에서 하루 종일 인공지능(AI)을 구동하며 다른 작업을 할 수 있도록 가장 잘 지원할 수 있는 NPU다. AI를 항상 켜고 있는(Always-on) PC 시대를 뒷받침하는 역할을 할 것이다."

12일(현지시각) 루시안 코드레스쿠 퀄컴 기술 부사장은 미국 샌디에이고 퀄컴 본사에서 열린 '스냅드래곤X 시리즈 아키텍처(구조) 딥다이브 2025'에서 이같이 밝히고 AI 시대 고성능 NPU는 기본이라고 강조했다.

퀄컴은 지난 9월 PC용 시스템온칩(SoC) '스냅드래곤X2 엘리트 익스트림'과 '스냅드래곤X2 엘리트' 2종을 공개했다. ▲중앙처리장치(CPU) ▲그래픽처리장치(GPU) ▲NPU ▲모뎀 ▲센싱 허브 등을 하나로 묶었다.

퀄컴 '스냅드래곤X2 엘리트 익스트림' NPU 성능 비교/사진=퀄컴 제공
퀄컴 '스냅드래곤X2 엘리트 익스트림' NPU 성능 비교/사진=퀄컴 제공

코드레스쿠 부사장은 "이제 PC는 AI는 항상 돌아가고 그 위에서 여러 소프트웨어(SW)가 동시에 동작하는 상황을 전제로 해야 한다"라며 "퀄컴의 목표는 이런 환경에서 매우 높은 에너지 효율로 최고 수준의 AI 가속기를 제공하는 것"이라고 말했다.

또 "CPU GPU SW가 존재하는 위해 AI를 추가한 환경이기 때문에 AI 가속기는 추가 부담으로 들어온다고 보는 것이 맞다"라며 "▲성능 ▲효율 ▲동시성을 모두 만족해야 한다"라고 덧붙였다.

퀄컴 '스냅드래곤X2 엘리트 익스트림' NPU 성능 비교/사진=퀄컴 제공
퀄컴 '스냅드래곤X2 엘리트 익스트림' NPU 성능 비교/사진=퀄컴 제공

헥사곤은 2004년 탄생했다. 디지털신호처리프로세서(DSP)로 출발해 NPU로 진화했다. 이번 제품은 6세대 헥사곤 코어 기반이다.

코드레스쿠 부사장은 "매년 새로운 NPU를 설계해 제품별 크기와 기능을 조절해 탑재한다"라며 "모바일용 노트북용 자동차용 사물인터넷(IoT)용 등으로 파생하지만 아키텍처 뼈대는 동일한 헥사곤 세대"라고 전했다.

6세대 헥사곤 NPU는 ▲스케일러 ▲벡터 ▲매트릭스 등으로 구성했다. 스케일러 코어는 두뇌 역할이다. 코어 자체는 32비트지만 DMA(Direct Memory Access) 아키텍처에 64비트 주소 지원을 추가했다. 스레드는 6개에서 12개로 늘렸다. 벡터는 8개를 배치했다. 매트릭스는 2비트 웨이트를 지원한다.

퀄컴 '스냅드래곤X2 엘리트 익스트림' NPU 성능 비교/사진=퀄컴 제공
퀄컴 '스냅드래곤X2 엘리트 익스트림' NPU 성능 비교/사진=퀄컴 제공

코드레스쿠 부사장은 "'스냅드래곤X 엘리트' NPU 대비 스케일러 처리량은 143% 대역폭은 128% 향상했다"라며 "벡터와 매트릭스 처리량은 각각 143%와 78% 높였다"라고 설명했다.

퀄컴은 스냅드래곤X2 엘리트 익스트림 NPU를 인텔 '코어 울트라9 822V'와 AMD 라이젠 AI9 HX 370' 등과 비교했다. 최대 5.7배 빨랐다.

코드레스쿠 부사장은 "벤치마크마다 차이는 있지만 인텔 대비는 최대 5.7배 AMD 대비는 2.4배 앞서는 속도를 보였다"라며 "이번 NPU는 성능 측면에서 매우 큰 도약뿐 아니라 에너지 효율 측면에서도 3~4배 수준 나아졌다"라고 평가했다.

샌디에이고(미국)=윤상호 기자 crow@techm.kr

관련기사