(왼쪽부터) AI융합학과 이규빈 교수, 노상준 박사과정생, 김종원·강래영·남동우 석박사통합과정, 백승혁 한국기계연구원 선임연구원. /GIST

광주과학기술원(GIST) 연구팀이 복잡한 환경에서도 물체를 정확히 잡을 수 있는인공지능(AI) 모델을 개발했다. 이 모델은 다양한 물체와 상황에 즉각 적응해 미학습 물체도 정확히 파지하고 작업자와의 협업을 고려한 자업자 시선 추적 기반 파지 기능도 갖췄다. 

GIST는 이규빈 AI융합학과 교수 연구팀이 복잡한 환경에서도 로봇이 물체를 안정적으로 잡을 수 있는 AI 로봇 파지 모델 ‘GraspSAM’을 개발했다고 밝혔다. 

GraspSAM은 점, 박스, 텍스트 등 다양한 형태의 프롬프트 입력을 지원한다. 한 번의 추론만으로 물체의 파지점을 정확히 예측할 수 있도록 설계됐다. 이를 통해 학습되지 않은 물체라도 복잡한 환경에서 안정적으로 파지할 수 있게 됐다.

기존 딥러닝 기반 파지 모델은 물체 종류나 환경 변화에 따라 별도의 모델 학습이 필요하고, 제한된 데이터셋에 의존하는 단점이 있었다. 연구팀은 이를 해결하기 위해 메타(Meta)가 개발한 범용 이미지 분할 모델 ‘SAM(Segment Anything Model)’을 로봇 파지 출력이 가능하도록 기술을 적용했다.

GraspSAM은 SAM의 강력한 객체 분할 능력을 활용해 최소한의 미세 조정으로 물체의 파지점을 예측한다. 연구팀은 어댑터(Adapter) 기법과 학습 가능한 토큰(Learnable Tokens) 기법을 도입해 SAM을 파지점 추론에 최적화했다. 이로 인해 모델은 점, 박스, 텍스트 등 다양한 프롬프트 입력을 지원한다. 단 한 번의 연산으로 학습되지 않은 물체도 복잡한 환경에서 안정적으로 파지할 수 있다.

GraspSAM은 유명 파지 벤치마크 데이터셋 ‘Grasp-anything’과 ‘Jacquard’에서 최고 수준의 성능(SOTA, State of the Art)을 달성했다. 실험 결과 복잡한 실제 환경에서도 로봇이 물체를 정확히 잡는 능력을 확인했다. 눈동자 추적 기술과 결합해 작업자의 시선에 맞춘 파지 작업을 성공적으로 구현했다. 

이규빈 GIST 교수는 “GraspSAM은 로봇과 사용자의 직관적인 상호작용을 가능하게 하며, 복잡한 환경에서도 뛰어난 파지 성능을 발휘한다”며 “산업 현장은 물론 가정용 로봇, 서비스 로봇 등 다양한 분야에서 폭넓게 활용될 것”이라고 전했다.

이번 연구는 이규빈 GIST AI융합학과 교수의 지도 아래 노상준 박사과정생이 주도했다. 산업통상자원부와 과학기술정보통신부의 지원을 받았다. 연구 결과는 로봇 분야 글로벌 학회인 ‘IEEE ICRA(International Conference on Robotics and Automation)’에서 오는 5월 발표될 예정이다. 

홈으로 이동 상단으로 이동