서울대 전병곤 교수팀, 데이터 증강 시스템 '리뱀퍼' 개발... AI 학습 속도 2배 높인다

송정현 기자
2021.05.13 16:01

서울대학교 공과대학(학장 차국헌)은 컴퓨터공학부 전병곤 교수팀이 데이터 증강(Data Augmentation) 과정을 최적화해 AI(인공지능) 학습을 보다 빠르고 정확하게 할 수 있는 '리뱀퍼(Revamper)' 시스템을 개발했다고 12일 밝혔다.

전병곤 교수 연구팀(사진제공=서울대학교 공과대학)

리뱀퍼 시스템은 머신러닝 학습 수행시 기존 시스템 대비 최대 2배 빠른 수행 속도를 자랑한다. 연구팀은 해당 시스템을 통해 다양한 분야에서 보다 효율적 AI 학습 수행이 가능할 것으로 기대하고 있다.

데이터 증강은 학습 데이터에 임의의 변환 연산을 적용함으로써 실질적 학습 데이터의 수를 증가시키는 것을 의미한다. 이는 AI 학습 모델 정확도를 높이지만, 학습 속도는 저하시킨다는 문제가 있다.

문제를 해결하기 위해 전병곤 교수 연구진은 학습된 모델의 정확도 저하 없이 표본을 재사용하는 데이터 리퍼비싱(Data Refurbishing) 기법을 제안했다. 데이터 리퍼비싱은 데이터 증강 과정을 두 부분으로 나눠 부분적인 데이터 증강 연산이 적용된 표본들을 일정 횟수 재사용하고, 학습에 사용하기 전에 나머지 증강 연산을 수행하는 방식으로 모델 정확도 저하 문제를 해결할 수 있다.

이러한 리버비싱 방식을 효율적으로 지원하기 위해, 연구진은 재사용하는 표본들을 여러 학습 스텝에서 고르게 사용하는 새로운 캐싱 시스템인 리뱀퍼를 구현했다. 리뱀퍼는 파이토치(PyTorch) 데이터 로더와 대비해 최대 2배 빠른 인공지능 학습 속도를 제공한다.

리뱀퍼는 개발 시 사용자의 편의성을 고려해 설계됐으며, 기존에 사용하던 파이토치 모델을 리뱀퍼를 이용해 빠르게 수행할 수 있다. 연구진은 리뱀퍼를 파이토치 사용자들이 활용할 수 있도록 공개할 계획이라고 밝혔다.

연구 결과는 컴퓨터 시스템 분야의 최고학회로 알려진 USENIX ATC(Annual Technical Conference)에서 오는 7월 발표될 예정이다. 전병곤 교수 연구팀은 지난 2019년에도 해당 학회에 연구 논문을 발표했다.

님블(Nimble)의 수행 과정(사진제공=서울대학교 공과대학)

아울러 전병곤 교수는 연구팀이 AI 분야에서 저명하다고 알려진 NeurIPS에도 지난해 논문을 발표하는 등, 꾸준한 AI 시스템 개발 성과를 내고 있다고 밝혔다. 해당 학회에서는 그래픽 처리 장치(GPU)를 활용해 AI 학습과 추론을 수행할 때, 기존 시스템에 대비해 최대 22배 빠른 속도로 처리할 수 있는 님블(Nimble) 시스템의 개발을 발표했다.

전 교수는 "세계를 선도하는 AI 플랫폼 기술을 연속해서 발표하게 돼 기쁘다"며, "앞으로 프렌들리에이아이(friendli.ai)를 통해 초대형 AI를 만들어 서비스로 제공하겠다"고 소감을 전했다.

페이스북 플러스친구 네이버포스트