[AWS 리인벤트 2025] AWS, 성능 4배 향상 ‘트레이니움3’ 출시… 4세대 개발도 착수
3나노 공정 칩 144개 연결, 100만 칩 클러스터 구축 가능
앤트로픽, 50만 칩으로 클로드 학습 “학습비 50% 절감”
트레이니움4, 성능 또 3~6배 향상… 엔비디아 기술 탑재
아마존웹서비스(AWS)가 자체 개발 인공지능(AI) 칩 ‘트레이니움(Trainium)’ 3세대 제품을 정식 출시했다. 기존 제품보다 컴퓨팅 성능 4.4배, 에너지 효율 5배 향상됐다.
맷 가먼 AWS 최고경영자(CEO)는 2일(현지시각) 미국 라스베이거스에서 열린 ‘AWS 리인벤트 2025’ 기조연설에서 트레이니움3 칩 기반 서버 ‘아마존 EC2 Trn3 울트라서버’ 정식 출시를 발표했다. EC2는 AWS의 클라우드 컴퓨팅 서비스 이름이고, Trn3는 트레이니움3를 탑재한 서버를 뜻한다.
AWS는 이미 100만 개 이상의 트레이니움 칩을 데이터센터에 배치했으며, 자사 AI 플랫폼인 ‘아마존 베드록’의 추론 작업 대부분을 트레이니움에서 처리하고 있다.
◇ 3나노 공정 칩, 144개를 하나처럼 작동
트레이니움3는 3나노미터(nm) 공정으로 제작된 AWS 최초의 AI 칩이다. 반도체 공정이 작을수록 같은 면적에 더 많은 트랜지스터를 집적할 수 있어 성능과 전력 효율이 높아진다.
이전 세대인 트레이니움2와 비교하면 컴퓨팅 성능이 4.4배, 메모리 대역폭(데이터 처리 속도)이 3.9배 향상됐다. 특히 에너지 효율은 5배 높아져 같은 전력으로 5배 많은 AI 작업을 처리할 수 있다.
Trn3 울트라서버는 최대 144개의 트레이니움3 칩을 하나로 묶어 작동시킨다. AWS가 자체 개발한 ‘뉴런스위치-v1(NeuronSwitch-v1)’로 칩들을 연결해 마치 하나의 거대한 컴퓨터처럼 사용할 수 있게 만들었다. 이 서버는 362 페타플롭스(1초에 36경 번의 연산 가능)의 컴퓨팅 성능을 제공한다.
AWS는 메타의 오픈소스 AI 모델 ‘GPT-OSS 120D’를 활용한 성능 테스트에서 트레이니움3가 트레이니움2보다 칩당 처리량이 3배, 응답 속도가 4배 빠른 것으로 나타났다고 밝혔다.
가먼 CEO는 이번 기조연설에서 더 큰 규모가 필요한 고객을 위한 ‘EC2 울트라클러스터 3.0’도 공개했다. 이 시스템은 수천 대의 울트라서버를 연결해 최대 100만 개의 트레이니움 칩을 하나의 클러스터로 구성할 수 있다. 이는 이전 세대보다 10배 큰 규모다.
◇ 앤트로픽 클로드도 트레이니움에서 학습, 학습 비용 절반 절감
AWS는 이미 주요 고객들이 트레이니움을 대규모로 활용하고 있다고 밝혔다. 클로드 개발사인 앤트로픽이 대표 사례다. 이 회사는 AWS와 협력해 50만 개 이상의 트레이니움2 칩을 연결한 세계 최대 규모의 AI 학습 클러스터 ‘프로젝트 레이니어(Project Rainier)’를 구축했다. 이는 앤트로픽이 이전 세대 모델을 학습시킬 때 사용한 인프라보다 5배 큰 규모다.
앤트로픽의 최신 AI 모델 클로드는 모두 트레이니움에서 학습됐다. AWS 베드록에서 제공되는 클로드의 추론 작업도 전량 트레이니움에서 처리되고 있다. 가먼 CEO는 “베드록에서 클로드를 사용하면 다른 주요 클라우드 제공업체보다 빠른 응답 시간을 경험할 수 있다”고 말했다.
실시간 AI 영상 생성 전문 스타트업 디카트(Decart)는 트레이니움3를 활용해 영상을 생성하고 있다. 디카트는 “GPU 대비 절반의 비용으로 4배 빠르게 프레임을 생성하고 있다”고 밝혔다.
가먼 CEO에 따르면 앤트로픽, 리코(Ricoh), 카라쿠리(Karakuri) 등 고객사들은 트레이니움을 통해 다른 솔루션 대비 학습 비용을 최대 50% 절감했다.
◇ 트레이니움4 개발 착수… 엔비디아 기술도 통합
가먼 CEO는 이번 기조연설에서 차세대 칩인 트레이니움4 개발 소식도 알렸다. 트레이니움3 대비 AI 연산 성능이 3~6배, 메모리 대역폭이 4배 향상될 것으로 전망했다. AI 칩 차세대 모델 개발 소식을 미리 알린 건 이례적인 일이다.
특이한 점은 트레이니움4의 경우 엔비디아의 칩 연결 기술인 ‘NV링크 퓨전(NVLink Fusion)’을 지원하도록 설계되고 있다는 것이다. 이를 통해 트레이니움4와 엔비디아 GPU, AWS의 CPU 칩 그래비톤(Graviton)을 하나의 서버 랙 안에서 함께 사용할 수 있게 된다.
가먼 CEO는 “트레이니움은 고객들이 AI 인프라의 한계를 뛰어넘을 수 있도록 지속적으로 혁신하고 있다”며 “트레이니움4는 차세대 최첨단 AI 모델을 위한 더욱 뛰어난 성능을 제공할 것”이라고 말했다.