[AWS 리인벤트 2025] 레드햇-AWS, 엔터프라이즈급 생성형 AI 추론 강화 협업
전용 AI 칩 활용 GPU 가격 대비 성능 최대 40% 향상
AI 워크로드 위한 폭넓은 선택지와 유연성·효율성 제공
글로벌 오픈소스 솔루션 기업 레드햇이 아마존웹서비스(AWS)와 협업을 확대해 엔터프라이즈급 생성형 인공지능(AI) 지원을 강화한다.
레드햇은 2일(현지시간) 미국 라스베이거스에서 열린 ‘AWS 리인벤트 2025’ 기간 AWS 상에서 레드햇 AI와 AWS AI 실리콘을 통해 엔터프라이즈급 생성형 AI를 지원하기 위해 AWS와의 협업을 강화한다고 밝혔다. AWS의 AI 전용 칩과 레드햇의 포괄적인 플랫폼 역량을 결합해 기업들이 기반 하드웨어에 구애받지 않고 고성능·고효율 AI 추론을 대규모로 실행할 수 있도록 지원할 방침이다.
생성형 AI의 부상과 확장 가능한 AI 추론의 필요성은 기업들로 하여금 IT 인프라를 재검토하도록 촉구하고 있다. 시장조사기관 IDC는 “2027년까지 조직의 40%가 성능 최적화, 비용 효율성, 특수 컴퓨팅에 대한 증가하는 요구를 충족하기 위해 ARM 프로세서 또는 AI/ML 전용 칩을 포함한 맞춤형 실리콘을 사용할 것”이라고 전망했다.
◇ vLLM 기반 추론 서버, AWS AI 칩 지원
이번 협업의 핵심은 vLLM 기반의 레드햇 AI 인퍼런스 서버가 AWS의 AI 칩인 인퍼런시아2와 트레이니움3에서 구동될 수 있도록 최적화한 것이다. 이를 통해 모든 세대의 생성형 AI 모델을 지원할 수 있는 공통 추론 레이어를 제공한다.
레드햇 측은 고객들이 프로덕션 환경의 AI 배포를 확장함에 있어 더 높은 성능과 더 낮은 지연 시간, 비용 효율성을 달성할 수 있다고 설명했다. 기존 GPU 기반 아마존 EC2 인스턴스 대비 가격 대비 성능이 최대 30~40% 향상된다고 강조했다.
레드햇은 vLLM의 최대 상업적 기여자로서, AWS 상에서 vLLM을 활성화함으로써 사용자의 AI 추론 및 학습 역량을 가속화하는 데 기여하고 있다. vLLM은 대규모 추론 제공을 목표로 하는 오픈소스 프로젝트인 llm-d의 기반이 되며, 현재 레드햇 오픈시프트 AI 3에서 상업적으로 지원되는 기능으로 제공된다.
◇ 오픈시프트에 AWS 뉴런 오퍼레이터 통합
양사는 AWS 상에서 제공되는 완전 관리형 애플리케이션 플랫폼인 ‘AWS 레드햇 오픈시프트 서비스’와 ‘레드햇 오픈시프트’, 레드햇 오픈시프트 AI를 위한 ‘AWS 뉴런’ 오퍼레이터를 개발했다. 이를 통해 고객들은 AWS 가속기를 활용해 AI 워크로드를 더욱 원활하고 지원되는 방식으로 실행할 수 있는 경로를 제공받게 된다.
AWS 뉴런 커뮤니티 오퍼레이터는 현재 레드햇 오픈시프트 또는 AWS 레드햇 오픈시프트 서비스를 사용하는 고객을 위해 레드햇 오픈시프트 오퍼레이터허브에서 이용할 수 있다.
레드햇은 최근 ‘레드햇 앤서블 오토메이션 플랫폼’을 위한 ‘amazon.ai 인증 앤서블 컬렉션’도 출시해 AWS 상에서 AI 서비스를 오케스트레이션할 수 있도록 지원하고 있다.
◇ “AI 추론 비용 절감이 관건”
조 페르난데스 레드햇 AI 사업부 부사장은 “혁신적인 vLLM 프레임워크를 기반으로 구축된 엔터프라이즈급 레드햇 AI 인퍼런스 서버를 AWS AI 칩과 함께 구현함으로써, 조직이 보다 향상된 효율성과 유연성을 기반으로 AI 워크로드를 배포하고 확장할 수 있도록 지원하고 있다”며 “레드햇의 오픈소스 유산을 바탕으로 한 이번 협력은 하이브리드 클라우드 환경 전반에서 생성형 AI의 접근성과 비용 효율성 제고를 목표로 한다”고 말했다.
콜린 브레이스 AWS 안나푸르나 랩 부사장은 “기업들은 미션 크리티컬 AI 워크로드를 위해 탁월한 성능과 비용 효율성, 운영 옵션을 제공하는 솔루션을 원한다”며 “레드햇과의 이번 협력을 통해 고객들은 오픈소스의 유연성과 AWS 인프라, AI 가속기 기반의 기능을 결합해 파일럿에서 프로덕션까지 생성형 AI를 대규모로 배포하는 과정을 더욱 빠르게 가속화할 수 있는 지원 체계를 갖추게 됐다”고 설명했다.
장-프랑수아 가마쉬 CAE 디지털 서비스 부문 최고정보책임자는 “AWS 레드햇 오픈시프트 서비스를 기반으로 핵심 애플리케이션을 현대화한 것은 CAE의 디지털 전환 여정에서 중요한 이정표”라며 “레드햇 오픈시프트는 라이브 가상 코칭을 통한 실행 가능한 인사이트 제공부터 사용자 보고 이슈의 처리 주기 단축까지 실질적인 성과를 내는 데 필요한 유연성과 확장성을 제공한다”고 평가했다.
AWS AI 칩을 지원하는 레드햇 AI 인퍼런스 서버는 2026년 1월 개발자 프리뷰로 제공될 예정이다.