딥러닝 모델 빠르고 쉽게 서비스하는 토탈 인퍼런스 솔루션

래블업은 CES 2025에서 토탈 인퍼런스 솔루션 'PALI'를 공개한다고 밝혔다. /래블업

래블업은 내년 1월 7일(현지시각)부터 나흘간 미국 라스베이거스에서 열리는 ‘CES 2025’에 참가해 토탈 인퍼런스 솔루션 ‘빨리(PALI, Performant AI Launcher for Inference)’를 선보인다고 밝혔다.

PALI는 딥러닝 모델을 빠르고 쉽게 서비스할 수 있는 토탈 인퍼런스 솔루션이다. △엔비디아 NIM, 허깅페이스, 캐글 등 다양한 소스의 딥 러닝 모델 지원 △앱처럼 쉽게 실행하는 언어 모델, 이미지 생성 모델 등 최신 생성 AI 모델 △온프레미스 및 에어갭 환경에서도 쉬운 시스템 구축 및 운영 △Backend.AI의 강력한 기술력으로 엔비디아 GPU 하드웨어 성능 극대화 △직관적인 사용자/관리자 인터페이스로 편의성 제공 △어플라이언스 하드웨어 기반으로 유연한 확장성을 보장한다. 고객은 PALI를 이용해 최신 AI 모델을 비즈니스에 신속하게 적용할 수 있다. PALI의 이름엔 해외 사람이 콘텐츠 등을 통해 많이 알고 있는 ‘빨리’의 의미도 내포됐다.

PAL 제품은 이미 일본 시장에서 판매되고 있다. 래블업에 따르면, PALI를 도입하면 개발자들은 모델 서빙에 필요한 복잡한 인프라 구축 과정 없이도 곧바로 AI 서비스 개발에 집중할 수 있다. 회사의 또다른 솔루션인 백엔드닷에이아이(Backend.AI) 플랫폼 위에서 GPU 가속 성능과 유연한 확장성을 바탕으로 대규모 사용자를 대상으로 하는 고성능 AI 서비스를 손쉽게 구현할 수 있다.

신정규 래블업 대표는 “AI 기술의 발전과 함께 다양한 규모와 분야에서 AI 서비스 및 어플리케이션 수요가 급증하고 있다”며 “래블업의 이미 검증된 Backend.AI 기술력을 바탕으로 고성능, 고효율 인퍼런스 분야에서도 최상의 플랫폼 솔루션을 제공함으로서 AI 프로젝트 성공을 적극 지원하고자 한다”고 밝혔다.

홈으로 이동 상단으로 이동