광주과학기술원 연구진, ‘어텐션 맵’ 학습으로 얼굴인식 성능 향상

(사진제공: 광주과학기술원)

CCTV 속 흐리게 보이는 사람 얼굴을 또렷하게 인식할 수 있는 인공지능 기술이 개발됐다.

광주과학기술원(GIST) 연구진이 인공지능 딥러닝 기술을 적용해 저화질 영상 속 사람의 눈, 코, 입 등 주요 특징을 잘 인식할 수 있는 기술을 발표했다. GIST 이규빈 교수 연수팀은 24일 ‘어텐션 맵’을 이용해 고해상도 얼굴 이미지에서 학습한 정보를 저해상도 얼굴 이미지 인식 모델에 전달해 성능을 향상하는 방법을 개발했다고 밝혔다.

‘어텐션 맵(attention map)’은 딥러닝 네트워크가 인식을 수행할 때 입력 이미지에 어떤 영역이 인식 결과에 영향을 주었는지 시각화 한 정보다. 0에서부터 1로 나타내며 저해상도일 수록 0에 가까운 활성 값을 나타낸다.

(사진제공: 광주과학기술원)

연구팀은 저해상도 네트워크의 어텐션 맵이 고해상도와 유사해지도록 학습하는 손실 함수를 추가해, 얼굴인식에 도움이 되는 주요 영역에 초점을 맞출 수 있도록 유도했다. 그 결과 기존 세계 최고 수준의 인식 성능인 45.49%보다 5% 향상된 47.91%의 인식 정확도를 얻어냈다.

얼굴 인식 외에도 저해상도 이미지에서 물체의 종류를 분류하는 과업에서도 연구팀의 제안 방법이 높은 성능 향상을 거두어 다양한 곳에서 활용될 가능성이 보여졌다.

이규빈 교수는 “연구 성과가 응용되면 범죄 해결의 중요 단서를 제공하는 CCTV로 멀리서 촬영된 사람의 얼굴 특징을 정확하게 인식할 수 있게 됐다”며 “연구팀이 제안한 ‘어텐션 맵 전이 기법’은 얼굴 인식 외에도 물체 영역 검출, 종류 분류 등 컴퓨터 비전의 다양한 과업에서 핵심 기술로 활용될 것이다”고 기대했다.

metarism@metaplanet-dm.com

홈으로 이동 상단으로 이동