카카오엔터프라이즈 “하이브리드 GPUaaS가 비용 최적화 핵심”
카카오엔터, AI 인프라 전략으로 ‘하이브리드 GPUaaS’ 강조
클라우드 비용 부담과 GPU 활용 효율 문제 해결 방향 제안해
AI·클라우드 산업 전반의 비용 최적화 경쟁 치열할 것으로 보여
카카오엔터프라이즈가 지난 16일 서울 강남구 코엑스에서 열린 ‘2025 AI를 위한 데이터&클라우드 진흥주간’ 행사에 참가해 하이브리드 GPUaaS 전략을 국내 AI 인프라 시장의 새로운 대안으로 제시했다.
이번 진흥주간 행사는 과학기술정보통신부 주최로 12월 16일부터 19일까지 진행되며, 데이터와 클라우드 기술을 기반으로 AI 산업 최신 동향과 미래 기술 방향을 공유하는 자리다. 카카오엔터프라이즈는 이 행사에서 자체 개발한 하이브리드 GPUaaS의 구축 방안과 도입 사례를 발표했다. 이 솔루션은 클라우드 서비스 기반의 GPU 자원과 고객 소유의 GPU 자산을 결합해 AI 서비스 기업과 기관의 비용 부담을 완화하는 데 초점을 맞춘 모델이다.
이재한 카카오엔터프라이즈 클라우드부문 사업본부장은 발표에서 “AI 추론 비용이 빠르게 증가하고 있어 비용 구조 개선이 필요하다”고 언급하며, 향후 AI 추론 비용이 학습 비용을 앞설 가능성을 언급했다. 실제로 AI 추론은 모델이 학습된 이후 계속해서 발생하는 비용으로, 클라우드 API를 활용할 때 이용량 기준으로 비용이 크게 늘어날 수 있다는 점은 업계의 공통된 우려다. 예컨대 추론 처리 서비스는 사용량 기반 과금 체계로 운영되어 서비스 확장에 따라 비용이 급증할 수 있다.
이재한 본부장은 “GPU는 AI 모델 개발과 서비스 운영에 필수적이지만, 서비스 초기 단계의 클라우드 기반 GPUaaS는 비용 부담이 크고 온프레미스 자원 확보는 구축과 운영 측면에서 부담이 된다”고 설명했다. 이에 카카오엔터프라이즈는 GPU 자원을 고객이 소유하고 카카오클라우드가 이를 관리하는 하이브리드 GPUaaS를 제안했다.
카카오클라우드의 하이브리드 GPUaaS는 고객이 사업 초기에는 클라우드 GPU를 활용해 리스크를 줄이며 기술 검증을 진행하고, 비즈니스가 본격적으로 성장하는 시점에 GPU 자산을 확보해 운영 비용 대비 수익성을 높일 수 있는 구조를 지향한다. 이를 통해 고객은 클라우드의 유연성과 온프레미스 자산 소유의 경제적 이점을 동시에 누릴 수 있다.
이재한 본부장은 “하이브리드 GPUaaS는 클라우드의 유연성과 자산 소유의 경제성을 동시에 추구할 수 있는 효과적인 해법”이라며, “카카오엔터프라이즈는 AI 서비스 기업과 기관이 불확실한 비즈니스 환경 속에서도 민첩성 및 수익성을 확보하도록 파트너로서 지원할 것”이라고 말했다.
AI 인프라 비용 최적화는 글로벌 클라우드 시장에서도 중요한 화두로 부상하고 있다. CIO에 따르면, 생성형 AI 서비스의 보급 확대와 함께 추론 워크로드의 비중이 커지면서 비용 구조 최적화에 대한 요구가 증가하고 있다. 실제로 대규모 언어 모델(LLM) 추론 비용을 최적화하는 기술들이 업계에서 주목받으며, 일부 오픈소스 기반 최적화 솔루션은 특정 모델의 추론 비용을 최대 75%까지 절감하는 사례도 보고된다.
카카오엔터프라이즈는 17일 클라우드 활성화 및 미래 전략을 논의하는 디지털서비스 서밋 2025 with PlugFest에 참여했다. 이 자리에서는 한국지능정보원(NIA)과 주요 클라우드 기업이 함께 AI 혁신 인프라의 미래, 신기술 대응 전략, 공공 부문 클라우드 도입 촉진 방안을 논의했다.