카카오브레인, 더 빠르고 안정된 ‘페이스 스와핑’ 신기술 개발
카카오브레인이 더 빠르고 안정적인 페이스 스와핑이 가능한 ‘스무스 아이덴티티 임베더’ 기술을 개발했다고 9일 밝혔다.
페이스 스와핑(face-swapping) 기술은 틱톡, 스냅챗 등 SNS에서 사용자의 얼굴을 촬영한 뒤, 촬영된 얼굴을 다른 얼굴로 바꾸는데 흔히 쓰이는 기술이다.
카카오브레인이 이번에 개발한 Smooth-Swap 모델은 페이스 스와핑 시스템 모듈을 단순화해 기존에 공개된 기술보다 훨씬 빠르고 안정적인 페이스 스와핑을 구현하는 것이 특징이다.
자연스러운 페이스 스와핑 기술 구현을 위해 기존 모델들은 3D 페이스 모델링을 비롯한 여러 요소를 모델에 적용하는데, 이 과정에서 모델의 아키텍처가 복잡해져 정교한 초매개 변수 조정(hyperparameter tuning)이 추가로 요구된다. 이러한 한계점을 극복하기 위해 카카오브레인은 새로운 요소들을 추가하는 대신, 하나의 통합된 아이덴티티 임베더(identity embedder)를 구축하고, 안정적이고 일관된 아이덴티티 그래디언트(identity gradient)를 확보함으로써 자연스러운 페이스 스와핑이 가능하게 했다.
또한 카카오브레인의 Smooth-Swap 모델은 단순화된 아키텍처와 향상된 성능으로 상용화 가능성과 기술 적용 범위를 넓혔을 뿐만 아니라, 비디오가 재생 중인 상황에도 페이스 스와핑이 가능하게 함으로써 경쟁력을 높였다. 특히 차별화된 아이덴티티 임베딩(identity embedding) 접근 방식을 통해 대상의 얼굴 형태를 변경할 시에도 고품질의 이미지를 생성할 수 있어 추후 가상 인플루언서, 쇼호스트, 아나운서 등 다양한 직업군의 디지털 휴먼을 개발할 수 있을 것으로 기대된다.
카카오브레인 김일두 대표는 “혁신적인 Smooth-Swap 모델을 세상에 공개하게 돼 매우 기쁘다”라며, “우리가 공개한 Smooth-Swap 모델이 페이스 스와핑 기술 분야의 혁신을 가속하여 항상 꿈꿔왔던 메타버스와 미래의 디지털 휴먼 서비스를 구현하는 데 기여할 수 있을 것이라 믿는다”라고 말했다.
한편, 페이스 스와핑에 대한 이번 연구 성과를 담은 카카오브레인의 논문(Smooth-Swap: A Simple Enhancement for Face-Swapping with Smoothness)은 오는 6월에 열리는 학술대회 CVPR 2022 오럴 세션에서 발표 예정이다.