페르소나AI, 음성·언어 결합 온디바이스 AI 적용한 휴머노이드 공개
페르소나AI가 자체 개발한 온디바이스 인공지능(AI) 모델을 적용한 휴머노이드를 공개하며 피지컬 AI 시장 진출을 본격화했다. 음성 인식과 언어 이해, 행동 수행을 통합한 ‘에이전틱(Agentic) 로봇’ 구현이 핵심이다.
페르소나AI는 인터넷 연결이나 GPU 없이도 구동 가능한 경량 AI 모델을 기반으로 로봇 운영체제(OS)를 개발해 왔다고 밝혔다. 회사는 해당 기술을 바탕으로 CES 2025·2026 혁신상과 글로벌 AI 경진대회 수상 이력을 확보했다고 설명했다.
이번에 공개한 로봇에는 음성 인식 모델(SSTT)과 소형 언어모델(sSLM)이 온디바이스 형태로 탑재됐다. 이를 통해 클라우드 연결 없이도 음성 명령을 실시간 처리할 수 있으며, 보안성과 처리 속도를 동시에 확보했다는 설명이다.
특히 음성 기반 제어가 특징이다. 기존 로봇이 조이스틱이나 사전 입력된 시나리오에 의존했다면, 해당 로봇은 사용자의 자연어 음성을 기반으로 상황을 인식하고 행동을 수행한다. 방언 등 다양한 언어 표현도 인식해 환경에 맞는 동작을 수행하도록 설계됐다.
예를 들어 사용자가 더위를 표현하는 발화를 하면 로봇이 이를 상황 정보로 해석해 창문을 열거나 냉방 장치를 작동시키는 방식이다. 회사는 이를 통해 관찰·판단·행동이 연결된 자율형 로봇 구현이 가능해졌다고 설명했다.
페르소나AI는 최근 피지컬AI 연구소를 설립하고 해외 연구진 및 로봇 기업과 공동 연구도 진행 중이다. 스탠퍼드대 로봇 플랫폼 ‘모바일 알로하(Mobile ALOHA)’에 자사 음성 AI를 적용해 모방학습과 음성 제어 성능을 고도화했다는 설명이다.
또한 시각·언어·행동을 결합한 VLA(Vision-Language-Action) 모델 등 자체 AI 기술을 로봇 OS에 적용해 다양한 작업 수행 능력을 확대할 계획이다. 해당 기술은 카메라 입력과 자연어 명령을 결합해 실시간으로 작업을 수행하도록 하는 구조다.
향후 적용 분야로는 국방, 제조, 물류, 가정용 로봇 등이 제시됐다. 회사는 온디바이스 기반 구조를 통해 비용 절감과 보안 측면의 이점을 확보할 수 있다고 밝혔다.
페르소나AI 관계자는 “경량화된 AI 엔진을 기반으로 한 로봇 기술을 고도화해 관련 생태계 확장에 나설 계획”이라고 말했다.