13개 언어 지원… 화상회의·대면 대화 동시 번역
문맥·예측 기술로 번역 품질 고도화
-
딥엘이 출시한 실시간 음성 번역 서비스 딥엘 보이스(DeepL Voic) 서비스가 한국어 지원을 하면서 본격적인 국내 비즈니스 시장을 노리고 나섰다.
28일 그랜드 하얏트 서울에서 열린 딥엘 기자간담회에서 쿠틸로브스키(Jarek Kutylowski) 딥엘 창업자 겸 최고경영자(CEO)는 “한국어 모델을 지원하기 위해 딥엘 보이스에 한국어 대형언어모델(LLM)을 포함했다”며 “문맥, 방언, 미세한 뉘앙스까지 통역할 수 있다”고 밝혔다.
딥엘은 지난 7월 음성 번역 솔루션인 ‘딥엘 보이스’ 기능에서 ‘보이스 포 미팅(Voice for Meetings)과 ‘보이스 포 컨버세이션(Voice for Conversations)’ 등 두 개 모델 출시를 알렸다. 이 서비스는 이번 한국어 지원으로 영어, 독일어, 일본어, 스웨덴어, 네덜란드어, 프랑스어, 튀르키예어, 폴란드어, 포르투갈어, 러시아어, 스페인어, 이탈리아어 등 13개 언어를 지원한다.
딥엘 보이스 포 컨버세이션(DeepL Voice for Conversations)은 일대일 대면 대화를 위한 모바일 솔루션이다. 두 가지 보기 모드로 자막 번역이 제공돼 한 기기에서 두 사람이 동시에 하는 대화를 번역한 내용을 확인할 수 있다. 실시간 통역을 해주는 식이다.
딥엘 보이스 포 미팅(DeepL Voice for Meetings)은 실시간 화상회의 통역을 지원한다. 마이크로소프트(MS) 팀즈에서 사용할 수 있다. 화상회의에서 나온 여러 언어에 대해 화상 채팅에서 실시간 통역 텍스트가 보이면서 서로 언어가 달라도 회의를 원활하게 하게 도와준다.
딥엘은 음성 번역 솔루션 고도화를 통해 문장이 끝나기 전에 대화를 예측하고 번역을 시작하는 기능을 도입해 실시간 회의 및 대화 환경에서 자연스러운 소통을 가능하게 했다.
크리스토퍼 오즈번(Christopher Osborne) 딥엘 제품 담당 부사장은 이날 간담회에서 “개발 과정에서 문장이 끝나기도 전에 대화가 시작되는 점을 착안해 음성 번역을 하는 것이 어려워 이 기술을 고도화했다”고 설명했다.
한국어 번역의 품질 향상 과정에 대해 쿠틸로브스키 CEO는 “한국어는 문법적으로 복잡하지만, 예측 기술을 활용해 이를 해결하려 했다”며 “딥엘의 번역 모델은 문장을 예측하고 그 방향에 맞춰 번역을 제공함으로 품질을 개선했다”고 설명했다.
보이스 포 미팅과 보이스 포 컨버세이션 두 가지 모델 모두 다양한 억양과 방언, 발화 속도를 고려한 데이터 학습을 기반으로 번역을 제공한다.
딥엘 보이스의 보안성과 품질에 대해서도 강조했다. 딥엘은 번역과 음성 데이터의 보안성을 강화하기 위해 자체적인 AI 모델에 사용자 데이터를 재사용하지 않는다고 말했다.
딥엘 보이스가 음성 번역을 제공하지 않는 이유에 대해 쿠틸로브스키 CEO는 “기술적으로 음성으로 번역을 제공하는 것이 가능하지만, 회의에서 실시간으로 음성을 번역하는 데 시간이 오래 걸린다는 점을 고려해 자막 번역을 선택했다”고 설명했다.
딥엘은 또한 음성 악용 방지와 관련된 본 기자의 질문에 대해 음성 복제 기능이 없으며, 모든 제품은 기업 간 상호작용을 위해 설계되어 있다고 강조했다.
향후 디벨은 기업간거래(B2B) 시장에서의 확장을 계속 추진할 계획이며, 특히 대기업을 대상으로 한 제품 제공에 집중할 것이라고 밝혔다. 또한, 마이크로소프트(MS) 팀즈와 같은 화상회의 플랫폼 외에도 다른 툴에 통합할 계획이 있으며, 향후 전 세계적으로 딥엘 보이스의 사용 환경을 확대할 예정이다.
쿠틸로브스키 CEO는“딥엘 번역기를 통해 33개의 언어를 지원하고 있고 이를 딥엘 보이스에도 적용해 지원 언어를 늘릴 것”이라고 말했다.
- 구아현 기자 ainews@chosun.com