오라클은  클라우드 환경에서 구동되는 세계 최대 규모의 AI 슈퍼컴퓨터 '오라클 클라우드 인프라스트럭처(OCI) 제타스케일10'을 공개했다고 16일(현지시간) 밝혔다.

오라클은 기존 모델 대비 10배 향상된 성능을 자랑하는 차세대 AI 인프라로, 최대 16 제타플롭스(zettaFLOPS)의 연산 능력을 제공한다고 설명했다. 관련 업계에 따르면 제타플롭스는 1초에 1000조번의 연산을 처리하는 단위로, 16 제타플롭스면 현재 세계에서 가장 빠른 슈퍼컴퓨터로 알려진 미국의 ‘엘 카피탄(El Capitan·1.742~2.746 엑사플롭스)’의 최소 수십배 빠른 속도다. 

OCI 제타스케일10은 여러 데이터센터에 걸쳐 최대 80만개의 엔비디아 그래픽처리장치(GPU)를 연결한 멀티 기가와트급 클러스터다. 이는 대화형 AI나 자율주행 등 복잡한 AI 모델을 훈련하는 데 필요한 시간을 획기적으로 단축시킬 것으로 기대된다.

특히 이 슈퍼컴퓨터는 오픈AI와 협력해 미국 텍사스주 애빌린에 구축되는 ‘스타게이트’ 프로젝트의 핵심 인프라가 된다. 스타게이트는 트럼프 행정부가 추진하는 AI 국가 경쟁력 강화를 위한 대규모 프로젝트로, 오라클과 오픈AI가 공동으로 진행하고 있다.

OCI 제타스케일10의 핵심은 오라클이 자체 개발한 ‘액셀러론 RoCE’ 네트워킹 아키텍처다. 이 기술은 각 GPU를 여러 개의 독립된 네트워크에 동시 연결해 하나의 네트워크에 문제가 생겨도 다른 네트워크로 즉시 전환할 수 있도록 설계됐다. 기존 AI 클러스터의 가장 큰 문제점인 ‘한 곳에서 장애 발생 시 전체 시스템 중단’을 해결했다.

또한 기존 3단계 네트워크 구조에서 한 단계를 제거해 GPU 간 통신 속도를 높이고 전력 소비도 줄였다. 마헤쉬 티아가라얀 OCI 총괄 부사장은 “고객들이 성능 단위당 전력 소비를 줄이면서 높은 안정성을 달성해 가장 큰 규모의 AI 모델을 실제 운영 환경에 구축, 훈련 및 배포할 수 있다”고 설명했다.

피터 호셸레 오픈AI 인프라 및 산업 컴퓨팅 부문 부사장은 “OCI 제타스케일10 네트워크 및 클러스터 패브릭은 오라클과 함께 구축한 텍사스주 애빌린의 스타게이트 사이트에서 최초로 개발 및 배포됐다”며 “기가와트 규모에서 패브릭 전체 성능을 극대화하면서도 대부분의 전력을 컴퓨팅에 집중시킨다”고 말했다.

홈으로 이동 상단으로 이동