학습 없는 위치 검색·범용 설명 기법·반사면 깊이 추정 등 실용 기술 발표
ETRI·경북대·DGIST·계명대, 블랙박스 해결·학습 효율성 높인 기술 소개
공공 AI 호환성 확보 방안도 논의… 국제 AI 행사 ICPR 2030 유치 목표

제9회 대구AI연구자포럼에 참석한 관계자와 연사들이 단체사진을 찍고 있다. /유덕규 기자

대구·경북 지역 AI 연구자들이 한자리에 모여 최신 연구 성과를 공유했다. 지난 22일 한국정보사회진흥원 대구 본원에서 열린 제9회 대구AI연구자포럼에서는 학습 효율성과 설명 가능성을 높인 실용적 AI 기술들이 집중 조명됐다.

대구AI연구자포럼과 대한전자공학회 대구경북지부가 주관하고 한국전자통신연구원(ETRI) 대경권연구본부, 한국지능정보사회진흥원, 엑스코가 후원한 이번 행사에서는 한국전자통신연구원, 경북대, DGIST, 계명대 소속 연구자 4명이 발표자로 나섰다. 발표된 연구들은 학습 데이터 없이 작동하는 위치 검색 기술, 다양한 신경망에 적용 가능한 범용 설명 기법, 반사면에 강건한 깊이 추정, 설명가능한 로봇 학습 등 실제 적용 가능성에 초점을 맞춘 내용으로 구성됐다.

이번 포럼에서는 AI 기술의 블랙박스 문제를 해결하기 위한 설명 가능성 연구와 학습 비용을 낮추는 효율적 접근법이 공통적으로 강조됐다. 또한 공공 부문 AI 인프라의 상호 호환성 확보 방안도 함께 논의됐다.

고병철 계명대 교수는 “대구는 AI 관련 유의미한 연구 성과가 나오고 있는 주요 도시”라며 “2030년 국제 AI 행사인 ICPR 2030도 성공적으로 유치해 유의미한 AI 성과를 만들어 가겠다”고 강조했다. /유덕규 기자

◇ 학습 없이 거리뷰로 위성 영상 찾는다

김동영 ETRI 석사후연구원은 거리에서 촬영한 건물 사진만으로 위성 영상에서 해당 위치를 찾아내는 학습 프리(Training-free) 기술을 발표했다.

거리뷰와 위성 영상은 촬영 시점 차이가 극심해 직접 매칭이 매우 어려운 문제로 알려져 있다. 기존 연구들은 드론 영상 등 추가 데이터를 활용하거나 복잡한 학습을 거쳐야 했지만, 성능이 저조했다.

김동영 ETRI 석사후연구원은 거리에서 촬영한 건물 사진만으로 위성 영상에서 해당 위치를 찾아내는 Training-free 기술을 발표했다. /유덕규 기자

김 연구원은 직접 매칭 대신 우회 전략을 제안했다. 거리뷰 이미지에서 인터넷 정보를 수집하고, 대형언어모델(LLM)로 위치를 추출한 뒤 좌표로 변환해 위성 이미지를 생성하는 방식이다. 이렇게 생성된 위성 이미지와 실제 위성 영상을 매칭하는 구조로, 거리-위성 직접 매칭보다 훨씬 쉬운 위성-위성 검색 문제로 전환했다.

김 연구원은 “벤치마크 데이터셋이 부족한 이 분야에서 학습 없이도 기존 방법보다 우수한 성능을 달성했다”며 “이 파이프라인을 활용하면 원하는 지역의 벤치마크 데이터셋을 자동으로 생성할 수 있어 실제 서비스 확장에도 기여할 수 있다”고 설명했다.

◇ 다양한 신경망에 통하는 범용 설명 기법

신호경 경북대 박사과정은 합성곱신경망(CNN)과 트랜스포머 등 서로 다른 구조의 신경망에 공통으로 적용 가능한 설명 가능 AI 기법을 소개했다.

신호경 경북대 박사과정은 CNN과 트랜스포머 등 서로 다른 구조의 신경망에 공통으로 적용 가능한 설명 가능 AI 기법을 소개했다. /유덕규 기자

기존 설명 기법들은 특정 모델 구조에 맞게 설계돼 다른 아키텍처로 확장할 경우 성능이 크게 떨어지는 문제가 있었다. 특히 합성곱신경망용으로 설계된 클래스 활성화 맵 기반 방법들은 트랜스포머에 적용하면 정확한 설명을 제공하지 못했다.

신 연구원은 두 가지 혁신적 기법을 제안했다. 먼저 잔차 기여도 맵(RAM)은 빈 이미지에 활성화 위치 정보만 전달해도 실제 이미지 예측을 근사할 수 있다는 발견을 활용했다. 이를 통해 합성곱신경망과 트랜스포머 모두에서 일관되고 우수한 설명을 제공하는 데 성공했다. 해당 연구는 저널 익스퍼트 시스템즈 위드 애플리케이션즈에 게재됐다.

두 번째로 제안한 판타지아 이미저리 네트워크(PhINet)는 부분 프로토타입 네트워크의 설명 불안정성 문제를 해결했다. ‘판타지아’ 개념을 도입해 빈 이미지 입력으로 불확실성을 모델링함으로써, 입력에 노이즈가 추가되어도 일관된 설명을 유지하도록 설계했다. 이 연구는 컴퓨터비전 및 패턴인식 학회(CVPR) 2026에 제출돼 심사 중이다.

최원혁 DGIST 석박통합과정은 반사 표면에서도 정확한 깊이 추정이 가능한 자가지도 학습 기법을 발표했다. /유덕규 기자

최원혁 DGIST 석박통합과정은 반사 표면에서도 정확한 깊이 추정이 가능한 자가지도 학습 기법을 발표했다. 자가지도 방식의 깊이 추정에서는 거울이나 유리 같은 반사 표면에서 실제보다 깊게 추정하는 ‘블랙홀 현상’이 발생하는 문제가 있었다.

최 연구원은 트리플렛 마이닝을 활용한 해결책을 제시했다. 교차 뷰 워핑으로 반사 영역을 자동 탐지하고, 반사 영역에서는 네거티브 샘플로, 비반사 영역에서는 포지티브 샘플로 학습하는 방식이다. 포토메트릭 오차만으로 반사 영역을 식별할 수 있어 앙상블이나 메시 재구성 같은 무거운 연산이 필요 없다는 장점이 있다.

최 연구원은 “반사체가 주로 나타나는 3개 데이터셋에서 평균 13.89%의 성능 향상을 확인했다”며 “향후 다층 깊이 추정과 파운데이션 모델 융합을 통해 극한의 반사 표면 문제도 해결할 계획”이라고 밝혔다.

◇ 설명가능한 로봇 학습과 공공 AI 호환성 확보

안다솜 계명대 박사과정은 디퓨전 정책에 설명 가능성을 부여하는 콘셉트 템플릿 기반 아키텍처(KOTRA) 프레임워크를 소개했다.

안다솜 계명대 박사과정은 디퓨전 정책에 설명 가능성을 부여하는 콘셉트 템플릿 기반 아키텍처(KOTRA) 프레임워크를 소개했다. /유덕규 기자

디퓨전 정책은 로봇 학습에서 높은 성능을 보이지만 블랙박스 특성 때문에 왜 그런 행동을 선택했는지 설명할 수 없다는 한계가 있었다. 안전이 중요한 환경에서는 로봇의 판단 근거를 이해할 수 있어야 하지만, 기존 생성형 모델들은 이런 설명 가능성을 제공하지 못했다.

안 연구원이 제안한 코트라는 개념 병목 모델을 통합해 이 문제를 해결했다. 관찰 이미지에서 30개의 개념을 추출하고, 이 개념들을 기반으로 로봇의 행동을 생성하는 구조다. GPT와 클립을 활용해 레이블을 자동 생성해 어노테이션 비용을 크게 절감했으며, 대규모 멀티모달 모델을 추가로 활용해 자연어로 행동 설명까지 제공한다.

안 연구원은 “푸시티와 리버런 데이터셋 실험에서 경쟁력 있는 성능을 유지하면서도 설명 가능성을 확보했다”며 “예를 들어 ‘로봇이 왼쪽으로 움직인 이유는 오브젝트가 왼쪽 아래에 있고 로봇이 왼쪽에 있기 때문’이라는 식의 직관적 설명이 가능하다”고 강조했다. 해당 연구는 국제학습표현학회(ICLR) 2026에 제출돼 리뷰를 기다리고 있다.

박눈솔 NIA 주임은 “AI 사업 전 단계에 걸친 일관된 기준과 상호 호환성 구조 및 제도적 기반 수립이 필요하다”고 밝혔다. /유덕규 기자

이날 포럼에서는 박눈솔 NIA 주임이 ‘공공 부문 AI 인프라 상호 호환성 확보를 위한 요구사항 가이드 연구’를 발표했다. 박 주임은 “현재 공공 부문에서 추진 중인 AI 사업들은 개별적으로 운영되고 플랫폼과 모델, 서버 환경이 상이해 연계나 공동 활용이 이루어지지 못하고 있다”며 “AI 사업 전 단계에 걸친 일관된 기준과 상호 호환성 구조 및 제도적 기반 수립이 필요하다”고 강조했다.

한편 대구AI연구자포럼은 수도권에 집중된 AI, 빅데이터 연구를 IT 특화 도시이자 미래 성장 산업으로 AI 산업을 집중 육성하고 있는 대구에서 활성화하기 위한 노력의 일환으로 2023년 3월 창립됐다. 포럼은 향후 정부 및 지역 기업체 대상 공동 연구 프로젝트 발굴 및 기술 자문, 연구 협업을 통한 국제 우수 학술대회 및 우수 저널 등에 논문 발표, AI 관련 국내외 학술대회 대구 유치를 위해 공동 노력할 방침이다. 매월 AI 관련 기관을 순차적으로 돌며 연구 성과 발표 및 전문가 세미나를 진행하고 있다.

포럼 창립자인 고병철 계명대 교수는 “대구는 AI 관련 유의미한 연구 성과가 나오고 있는 주요 도시”라며 “2030년 국제 AI 행사인 ICPR 2030도 성공적으로 유치해 유의미한 AI 성과를 만들어 가겠다”고 강조했다.

홈으로 이동 상단으로 이동