엔비디아는 오라클과 함께 기업을 위한 AI와 데이터 처리 가속화를 지원한다고 13일 밝혔다.
지난 9일(현지시간) 미국 라스베이거스에서 열린 '오라클 클라우드월드' 콘퍼런스에서 오라클 클라우드 인프라스트럭처(OCI)는 엔비디아 '블랙웰' 플랫폼으로 가속화된 최초의 제타스케일 'OCI 슈퍼클러스터'를 발표했다. 이는 기업이 10만 개 이상의 엔비디아 최신 GPU를 사용해 차세대 AI 모델을 훈련하고 배포할 수 있도록 지원한다.
OCI 슈퍼클러스터를 통해 고객은 다양한 엔비디아 GPU 중에서 필요에 따라 선택할 수 있으며, 온프레미스, 퍼블릭 클라우드, 소버린 클라우드 등 어디에나 배포할 수 있다. 내년 상반기에 출시될 예정인 블랙웰 기반 시스템은 최대 13만1072개의 블랙웰 GPU를 RoCEv2 또는 엔비디아 퀀텀-2 인피니밴드 네트워킹용 엔비디아 커넥트X-7 NIC로 확장해 클라우드에 2.4제타플롭의 AI 컴퓨팅을 제공할 수 있다.
오라클은 이번 행사에서 생성형 AI 애플리케이션을 지원하는 엔비디아 GB200 NVL72 수냉식 베어메탈 인스턴스도 미리 선보였다. 이 인스턴스는 퀀텀-2 인피니밴드를 통해 대규모 훈련이 가능하며, 확장된 72-GPU 엔비디아 NV링크 도메인 내에서 수조 개의 매개변수 모델을 실시간으로 추론할 수 있다. 이 도메인은 단일 대형 GPU처럼 작동할 수 있다.
올해 OCI는 NV링크와 NV링크 스위치를 통해 엔비디아 HGX H200을 제공할 예정이다. 이는 단일 베어메탈 인스턴스에 8개의 엔비디아 H200 텐서 코어 GPU를 연결하고, RoCEv2 클러스터 네트워킹을 통해 엔비디아 커넥트X-7 NIC로 6만5536개의 H200 GPU까지 확장될 수 있다.
또한 OCI는 중급 AI 워크로드, 엔비디아 옴니버스와 시각화를 위한 엔비디아 L40S GPU 가속 인스턴스의 정식 출시에 대한 소식도 발표했다. 단일 노드부터 멀티 랙 솔루션까지, 오라클의 엣지 오퍼링은 연결되지 않은 원거리에서도 엔비디아 GPU로 가속화된 엣지에서 확장 가능한 AI를 제공한다. 예를 들어, 오라클의 로빙 엣지 디바이스 v2를 사용한 소규모 배포는 이제 최대 3개의 엔비디아 L4 텐서 코어 GPU를 지원한다.
오라클 자율운영 데이터베이스는 고객이 오라클 자율운영 데이터베이스에서 데이터 처리 워크로드를 가속화할 수 있도록 오라클 머신 러닝 노트북에 대한 엔비디아 GPU 지원을 확보하고 있다. 양사는 오라클 클라우드월드에서 현재와 미래에 어떻게 엔비디아 가속 컴퓨팅 플랫폼을 사용해 성성형 AI 검색의 핵심 구성 요소인 검색 증강 생성(RAG) 파이프라인을 가속화할 수 있는지 보여주는 기능을 시연했다.
또한 엔비디아와 오라클은 협력을 통해 전 세계에 소버린 AI 인프라를 제공함으로써 정부와 기업의 데이터 레지던시 요구 사항을 해결하고 있다. 브라질에 위치한 스타트업 와이드랩스(Wide Labs)는 브라질 포르투갈어를 위한 최초의 거대 언어 모델(LLM) 중 하나인 '아마조니아 IA'를 개발했다. 이들은 데이터 주권을 보장하기 위해 OCI의 브라질 데이터센터에서 엔비디아 H100 텐서 코어 GPU와 엔비디아 네모 프레임워크를 사용해 아마조니아 IA의 훈련과 배포를 진행했다.
컨설팅 서비스와 시스템 솔루션을 제공하는 일본의 글로벌 선도 기관 노무라종합연구소는 엔비디아 GPU가 탑재된 OCI의 알로이(Alloy) 인프라를 사용하고 있다. 이를 통해 금융 규제와 데이터 주권 요건에 따라 운영되는 LLM을 통해 금융 AI 플랫폼을 강화하고 있다. 또한 줌(Zoom)은 현지 데이터 요건 준수를 지원하기 위해 OCI의 사우디아라비아 데이터센터에 엔비디아 GPU를 사용할 예정이다.
기업은 OCI의 확장 가능한 클라우드 솔루션과 함께 NIM 마이크로서비스와 엔비디아 cuOpt 등의 엔비디아 소프트웨어를 배포해 OCI에서 작업 자동화를 가속화할 수 있다. 이러한 솔루션을 통해 기업은 코드 생성과 경로 최적화와 같은 복잡한 작업을 수행하는 생성형 AI를 빠르게 도입하고 에이전트 워크플로우를 구축할 수 있다. 오라클 클라우드 마켓플레이스에서 제공되는 엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼에는 엔비디아 cuOpt, NIM, 래피즈 등이 포함된다.
남도영 기자 hyun@techm.kr
관련기사
- [글로벌] 엔비디아, AI 기업 투자 확대...어플라이드 디지털·사카나AI에 투자
- 오라클, 데이터 인텔리전스 플랫폼에 '지능형 데이터 레이크' 제공
- 오라클, AI 중심 애플리케이션 개발 인프라 발표
- 오라클, '퓨전 데이터 인텔리전스' AI 기반 신기능 발표
- 오라클, 생성형 AI 탑재한 '히트웨이브' 신기능 발표...AWS에서도 기본 제공
- 엔비디아, 무선 네트워크 'AI-RAN' 구현 위한 'AI 에리얼' 플랫폼 공개
- 오라클, '자바 23' 출시..."개발자 생산성 높였다"
- 엔비디아, LG '엑사원 3.0'에 H100 GPU와 '네모' 프레임워크 제공