사진 = Sensory Inc 제공

디지털 전환 시대에 핵심 기술로 떠오른 인공지능(AI)의 국내외 현황을 살피고, 미래를 전망하는 'AWC 2021 in Busan'이 1일부터 2일간 부산 벡스코에서 진행된다. 부산광역시, 디지틀조선일보, 더에이아이, 부산정보산업진흥원, 벡스코 공동 주최로 마련된 AWC 2021 in Busan은 미래학자 버나드 마와 건축자 겸 엔지니어 칼로 라티를 비롯한 10여 개국의 AI 전문가가 참여해 'AI for SDGs'와 'AI for SmartCity'를 주제로 한 강연과 토론을 온라인과 오프라인으로 진행한다.

AWC 2021 in Busan에서 제프 로저스 센서리(Sensory Inc) 공동 설립자 및 영업 부사장은 '스마트홈과 스마트시티를 위한 AI'를 발표했다. 센서리는 1994년에 설립됐으며, 전자 제품에 내장된 음성 인식 사용자 경험을 개선하는 기술을 개발하는 회사다. 기술은 구글, 아마존, 마이크로소프트 등 대기업에 30억개 이상의 제품에 적용됐다. 가전 제품의 음성 인식, 생체 인증, 센서/음성 조합, 깨우기 기술 등 60개 이상의 특허도 보유하고 있다.

사진 = Sensory Inc 제공

센서리의 강력한 AI 기술은 가정에서 음성 기반 상호 작용 제품의 편리함을 제공한다. 스마트 장치를 통해 우리가 듣지 못할 수도 있는 가정 내에서 일어나는 일을 경고해 위험한 상황에서 가정과 가족을 보호한다. 특히 TrulySecure Sound ID는 유리 깨지는 소리, 아기 울음 소리, 개 짖는 소리, 집 보안 경보, 연기/일산화탄소 경보 및 배터리 부족 경고, 초인종, 노크, 코골이 등 다양한 환경 소리를 인식할 수 있다. 이러한 소리가 발생하면 사용자에게 스마트폰 등 제품으로 즉시 경고하고 상황을 더 잘 이해할 수 있도록 소유자 사운드 클립을 보낼 수 있다.

클라우드 기반 음성 서비스 플랫폼을 활용한 도메인별 비서는 제조업체가 가전 제품, 장치 또는 차량을 작동하기 위해 소비자가 브랜드 이름(Alexa, Google 또는 Siri와 비교)을 연상하게 할 수 있는 기능을 제공한다. 이 접근 방식을 통해 소비자는 어색한 명령 시퀀스를 거치지 않고도 음성으로 장치를 보다 직접적으로 제어할 수 있다. 내장된 맞춤형 또는 도메인별 음성 비서는 데이터를 실시간으로 처리해 대기 시간 없이 클라우드에 필적하는 정확도를 제공한다.

도메인별 음성 도우미로 정확도도 향상됐다. 개인 정보에 대한 영향 외에도 Alexa와 같은 클라우드 기반 도메인별 음성 비서는 작업 완료율 및 대기 시간과 관련해 임베디드 대응 제품 만큼 성능이 좋지 않음을 보여주었다. 임베디드 도메인별 도우미는 특정 도메인 알고리즘에 맞게 조정되기 때문에 음성 명령을 혼동할 가능성이 훨씬 적다. Alexa, Google 또는 Siri와 같은 가상 비서는 광범위한 요청을 인식하도록 만들어진 일반 비서이기 때문에 인식기 또는 NLU가 혼란스러워서 초기 요청에 올바르게 응답하지 않는 작업이 발생할 수 있다. 이에 대한 좋은 예는 사용자가 Alexa와 이야기하고 음성 도우미가 사용자 요청의 의도를 이해하지 못했을 때 확인됐다.

제프 로저스 부사장은 "임베디드 솔루션을 사용할 때의 이점은 음성 인식 엔진이 Wi-Fi 연결에 의존하지 않고 작동하도록 훈련돼 다양한 조건에서 매우 정확한 솔루션이 생성된다는 것"이라며, "또한, 단어와 명령을 발화하려는 시도가 클라우드로 전송되지 않기 때문에 사실상 개인 정보 문제가 발생하지 않는다"고 말했다.

제프 로저스 공동 설립자 및 영업 부사장 / Sensory Inc 제공

센서리는 음성 기반 제품의 혁신을 위한 진입 장벽을 낮추기 위해 개발자가 음성 도구를 제품에 통합할 수 있는 도구인 VoiceHub 를 출시했다. VoiceHub는 제품에 음성 제어 기능 추가를 간소화하는 음성 사용자 인터페이스(VUI) 생성 플랫폼이다. 이 플랫폼은 wake words 단어, 장치를 활성화하는 단어 및 음성 제어 명령에 중점을 둔다. 새로운 기능은 회사 사이트에 따라 수십개의 언어를 지원할 수 있다.

제프 로저스 부사장은 "VoiceHub와 같은 유연한 도구에 대한 무료 액세스를 제공하면 브랜드 음성 경험과 도메인별 맞춤형 음성 비서의 정확성을 가속화하는데 도움이 된다"며, "이 기술은 수백만개의 고유한 문구를 처리할 수 있는 기능을 통해 보다 복잡하고 진정한 대화형 음성 인터페이스를 개발하는데 도움을 줄 것"이라고 밝혔다.

홈으로 이동 상단으로 이동