중국의 인공지능(AI) 기술력이 미국 실리콘밸리를 공포에 떨게 만들고 있습니다. 바로 중국 AI 스타트업 '딥시크(DeepSeek)' 때문인데요, 이들이 불과 10분의 1 수준의 비용으로 서방의 선진 모델과 맞먹는 성능을 갖춘 AI 모델을 만들어냈기 때문입니다. 일각에선 벌써 중국산 AI발 '스푸트니크 쇼크'가 언급되고 있는 상황입니다.
딥시크 쇼크, 실리콘밸리를 흔들다
딥시크는 지난 20일 추론에 특화된 AI 모델 '딥시크-R1'을 선보이며 논문 형태의 기술보고서를 내놨습니다. 이에 따르면 딥시크-R1은 현재 AI 분야에서 가장 선도적인 모델로 꼽히는 오픈AI의 'o1'과 맞먹는, 일부 분야에선 오히려 이를 앞서는 성능을 발휘한다고 합니다.
앞서 딥시크는 지난해 오픈AI의 'GPT-4o'와 비슷한 성능을 지닌 '딥시크-V3'를 선보이며 주목을 받은 바 있습니다. 이에 더해 현재 생성형 AI 모델 경쟁의 최전선인 추론 영역마저 서방의 선도 기업들과 어깨를 나란히 하며 충격을 주고 있습니다.
딥시크는 기술보고서에서 R1 모델 훈련에 투입한 비용이 557만6000달러(약 78억원)에 불과하다고 밝혔습니다. 학습에는 현재 선도적인 AI 기업들이 주력으로 사용하는 엔비디아 H100 보다도 성능이 낮은 H800 칩을 사용했습니다. H800은 엔비디아가 대중 수출 규제를 피해 사양을 의도적으로 낮춘 제품입니다. R1의 훈련 비용은 이 칩을 시간당 2달러에 2개월 동안 빌린 비용을 대입한 것으로, 메타가 H100으로 '라마3' 모델을 훈련시킨 비용의 10분의 1 수준으로 분석됩니다.
딥시크는 하이엔드 AI 칩 수급의 한계를 극복하기 위해 알고리즘 상으로 효율성을 극대화하는데 집중했습니다. 연구진은 R1 모델에 특정 작업에 적합한 하위 모델만 선택적으로 활성화하는 방식인 전문가 혼합(MoE) 아키텍처를 활용했다고 설명했습니다. 전체 6710개 매개변수 중 약 340억개만 활성화하도록 설계해 추론 비용과 메모리 사용량을 줄여 AI 모델이 사용하는 토큰 당 비용을 크게 낮출 수 있었다는 설명입니다.
딥시크가 제시한 비용은 관련 시설이나 개발비, 인력 등의 요소들이 빠진 단순 비용이고, 중국 기업들의 실제 AI 칩 보유량은 명확하지 않은 부분들이 많기 때문에 이를 그대로 비교하긴 어렵습니다. 또 딥시크가 '챗GPT'처럼 전 세계적으로 대중적인 AI 서비스가 될 가능성도 희박해 보입니다. 중국 정부와 관련한 내용은 회피하는 등, 당국의 정책에 따라 제한적인 답변을 내놓고 있기 때문입니다. 허나 중국이 무역 제재가 가해지고 있는 가운데 유사한 성능의 모델을 개발하는게 가능하다는 점을 입증한 것만으로도 상당히 충격적이라는 평가입니다.
돈만 쓰면 될 줄 알았는데…빅테크들 '패닉'
딥시크의 기술보고서 발표 이후 뉴욕타임즈(NYT), 포브스, 파이낸셜타임즈(FT), 이코노미스트 등 서방 언론들은 미국과 중국의 AI 경쟁에 큰 변화의 조짐으로 받아들이며 이를 대서특필했습니다.
이들이 주목한 지점은 AI 반도체 공급망 통제를 기반으로 한 미국의 대중 제재가 실효성을 잃어버릴 수 있다는 점입니다. AI 칩만 틀어막으면 중국의 AI 패권 도전을 막을 수 있을 것이란 논리가 틀릴 수 있다는 것입니다. 오히려 이런 제재로 인해 중국이 더 치열하게 알고리즘 기술 개발에 매달리게 되면서 새로운 방향을 찾게 만든 배경을 제공한 꼴이 됐다는 분석도 나옵니다. 중국이 AI 칩에 대한 한계를 극복하게 된다면, 자국에서 쌓은 엄청난 데이터와 자체 제조 공급망을 활용해 오히려 미국 이상의 역량을 발휘하게 될 것이란 관측도 가능해졌습니다.
빅테크들도 비상입니다. 딥시크의 등장이 '게임의 룰'을 뒤집어 놓고 때문입니다. 지금까지 미국 빅테크들은 'AI칩이 많으면 이긴다'라는 전제 하에 천문학적인 자금을 투입해 AI칩을 확보하는데 주력해왔습니다. 이런 게임의 룰 안에선 막대한 자본력을 갖춘 빅테크, 혹은 이런 빅테크의 투자를 받는 기업 외에는 선도적인 AI 모델을 가지지 못할 것이란 계산이 지배적이었습니다. 하지만 딥시크의 등장으로 이런 룰 자체가 변화할 조짐을 보이고 있습니다. 이미 마이크로소프트, 메타 등의 빅테크 기업 내부에서도 막대한 자본 지출에만 메달린 결과에 대해 자성의 목소리가 나오기 시작했습니다.
딥시크가 가져온 변화는 AI 칩을 독점하며 막대한 이익을 올려온 엔비디아 같은 반도체 기업들에게도 영향을 미칠 수 있습니다. 물론 딥시크도 미국산 AI 칩의 영향에서 완벽히 벗어난 것은 아니지만, 스케일 법칙에서 벗어나 더 효율적인 AI 모델 학습이 가능하다는 점이 입증된다면 엔비디아가 누렸던 강력한 독점 효과와 이익률을 계속 이어나가기 어려워질 수 있다는 우려가 나옵니다.
AI 패권 다툼 새국면? 트럼프 정부에 미칠 영향은
딥시크는 오픈소스 모델로, AI 칩 사용을 최소화하면서 모델의 성능을 높이는 기술을 이미 다른 기업 혹은 연구조직들도 이미 들여다보고 있는 상황입니다. 이들이 함께 기술을 발전시켜 나간다면 오픈AI와 같은 선도기업, 혹은 서방이 보유한 기술 독점의 벽을 무너뜨릴 수 있다는 위기감도 제시됩니다.
바이든 정부는 오픈소스 형태의 AI 모델이 악용될 수 있다는 일부 기술 리더들의 우려를 정책에 반영해왔는데, 트럼프 정부에선 전 정부의 AI 행정명령을 철회하며 이를 수정하려고 하고 있습니다. 결국 오픈소스를 받아들이지 않은 채로 중국과 경쟁하기 어려울 수 있다는 포석이 이미 깔리고 있는 것으로 풀이할 수 있는 대목입니다.
이런 식으로 딥시크의 등장이 미국의 AI 정책 방향에 영향을 미치게 될 것이란 분석도 나옵니다. 앞서 트럼프 2기 정부는 출범과 함께 '스타게이트'라는 프로젝트를 발표했습니다. 오픈AI, 오라클, 소프트뱅크 등이 참여한 스타게이트는 초기 1000억달러, 4년 내 최대 5000억달러를 투입해 미국에 AI 인프라를 구축하는 초대형 프로젝트입니다. 트럼프 대통령은 스타게이트를 "역사상 가장 큰 AI 프로젝트"라고 소개하기도 했습니다.
이어 메타가 올해 AI와 대규모 신규 데이터 센터 구축 등에 최대 650억달러의 자본 지출을 할 것이란 발표를 하기도 했습니다. 이를 두고 트럼프 대통령의 AI 투자 기조에 보폭을 맞춘 발표라는 분석이 나오기도 했습니다.
앞으로 딥시크 쇼크를 계기로 이런 대규모 자본 투자만으로는 중국을 따돌리기 어렵다는 게 확인된다면, 트럼프 정부의 AI 정책 역시 변화를 줄 수 밖에 없다는 게 현지 언론들의 분석입니다.
남도영 기자 hyun@techm.kr