닫기

인더스트리

네이버, 컴퓨터비전 국제 학회서 공간지능·AI 논문 14편 게재

기사입력 2025.03.25 11:52
  • 네이버는 네이버랩스, 네이버랩스 유럽, 네이버클라우드 등 ‘팀네이버’의 다양한 기술 조직이 발표한 연구 논문 14편이 컴퓨터비전 분야 세계적 학회 중 하나인 ‘CVPR(컴퓨터비전 및 패턴 인식 컨퍼런스 학술대회) 2025’에 게재 승인됐다고 25일 밝혔다.

    지난 1983년 시작된 CVPR은 세계 최대 기술 전문 단체인 전기전자공학자협회(IEEE)와 컴퓨터비전협회(CVF)가 공동 주최하는 학술대회다.

    비전 AI 분야의 대표적인 학회이자 컴퓨터 공학에서 가장 영향력 있는 학회로 알려져 있다.

    이로써 네이버는 컴퓨터비전 분야 세계 3대 학회로 꼽히는 CVPR, ECCV(유럽 컴퓨터비전 학회), ICCV(국제 컴퓨터비전 학회)에 최근 5년여 동안(2020년~2025년 3월) 151건의 정규 논문을 등재했다.

    먼저 팀네이버는 CVPR 2025에서 지난해 공개했던 3D 재구성 AI 도구 ‘DUSt3R(더스터)’의 후속 연구 결과들을 발표할 예정이다. 

    한두 장의 사진만으로 3차원 복원을 쉽게 할 수 있는 AI인 더스터를 기반으로, 여러 장의 이미지에서 보다 정확한 3차원 공간을 재구성할 수 있는 AI 모델 ‘MUSt3R(머스터)’와, 다양한 카메라 및 장면 정보를 통합해 추론 능력을 높인 AI 모델 ‘Pow3R(파워)’ 등이 새로 등재됐다. 

    또한 사전에 학습되지 않은 물체의 위치와 방향을 신속하고 정확하게 찾아내는 기술을 제안한 네이버랩스의 논문(Co-op: Correspondence-based Novel Object Pose Estimation) 등 다수의 공간지능 논문이 학회에 채택됐다.

    또한 최근 멀티모달(Multimodal) AI 기술의 부상으로 주목받고 있는 이미지 학습 모델 관련 연구들이 채택됐다. 

    네이버클라우드는 ‘마스킹(masking)’ 기법을 활용해 AI가 이미지 학습을 할 때 발현되는 훈련 불안정성 문제를 해결한 효율적인 학습 방법론을 제안(Masking meets Supervision: A Strong Learning Alliance)했다.

    네이버랩스 유럽은 시각언어모델(Vision-and-Language Model)을 활용해 추가 학습 없이 이미지 속 새로운 사물을 정교하게 구분하는 기술을 선보였다(LPOSS: Label Propagation Over Patches and Pixels for Open-vocabulary Semantic Segmentation).

    시각 정보 입력부터 행동 출력까지 전체 과정을 학습하는 ‘엔드 투 엔드(End-to-End)’ 방식으로 빠르게 이동하는 로봇이 효율적으로 경로를 찾는 자율주행 시스템에 관한 연구(Reasoning in visual navigation of end-to-end trained agents: a dynamical systems approach)도 채택됐다.

    이 외에 이미지 생성 AI 모델의 창의성을 향상시키기 위한 방법을 제안한 연구(Enhancing Creative Generation on Stable Diffusion-based Models) 등도 채택됐다.

    네이버는 “적극적인 연구개발 투자를 지속하며 선행기술을 확보해나겠다”며 “나아가 ‘온 서비스 AI(On-Service AI)’ 전략 아래, 생성형 AI와 공간지능 등 성공적으로 내재화한 핵심 기술을 네이버 주요 서비스에 도입해 사용자에게 차별화된 서비스 경험을 제공할 계획”이라고 말했다.

위로