카카오모빌리티, '자율주행 AI 학습용 데이터셋' 공개 / 카카오모빌리티 제공

카카오모빌리티가 과학기술정보통신부(이하 과기정통부)와 자율주행기술개발혁신사업단(이하 KADIF)의 '자율주행 기술개발 혁신사업' 국책 과제 일환으로 구축한 '인공지능(AI) 학습용 자율주행 데이터셋'을 한국전자통신연구원(ETRI) 'AI 나눔'에 공개해 국내 자율주행 연구개발 생태계 조성에 나선다고 28일 밝혔다.

카카오모빌리티는 레벨4(Lv.4) 자율주행 구현을 위한 해당 사업에 참여해 차량, 엣지-인프라, 지능학습을 연계해 융합형 자율주행 데이터의 생성·관리·배포 자동화 기술 개발을 완료했다. 사업의 일환으로 국내 도로 환경에서 구축한 비식별화된 AI 학습용 데이터셋을 일반에 공개하고 저작권 문제없이 누구나 자유롭게 자율주행 연구개발에 활용할 수 있도록 한다는 취지다.

그동안 자율주행을 연구하는 소규모 기업이나 학계, 연구계에서는 막대한 비용과 시간이 소요돼 라이다·레이더·카메라 센서로 자율주행 데이터를 직접 확보하기 어려웠다. 이미 공개된 데이터셋은 대부분 해외 지역이나 특정 시간대에 수집된 데이터로 국내 실정에 맞는 연구개발에 한계가 있었다.

카카오모빌리티가 이번에 공개한 데이터셋은 국내 주요 도로변에 설치된 라이다·카메라 센서 등 엣지-인프라와 카카오모빌리티가 직접 운영한 자율주행차를 통해 획득했다. 이는 사람, 차량, 자전거 등 움직이는 3D 동적 객체와 신호등, 표지판 등 2D 정적 객체를 인지·판단할 수 있는 10개 유형의 15만건으로 구성된 데이터셋으로, 국내 환경에 적합한 자율주행 AI 모델 개발과 학습에 활용할 수 있을 것으로 기대된다. 

특히 해당 데이터는 도로타입(고속도로, 국도, 지하차도, 터널 등), 시간(주/야간), 날씨(맑음/강우/안개 등) 등 총 31개 카테고리의 다양한 환경 조건에서 수집됐다. 라이다 센서를 통해 취득한 포인트클라우드의 좌표값은 물론 사람, 사물 등 개체 속성을 구분할 수 있는 세분화 데이터도 포함돼 활용 가치가 높을 것으로 예상된다.

ETRI가 자율주행 차량에 해당 데이터셋을 학습해 실증한 결과, 사람과 차량, 자전거 등 3D 동적 객체 검출 AI 성능은 약 5~8%, 신호등 인식 AI 성능은 약 2%가 향상된 것으로 나타나는 등 데이터의 신뢰성이 검증됐다. 특히 도심지 야간 교통 정체 상황, 보행자 신호등과 같은 희소 데이터에 대한 AI 성능이 크게 향상된 것으로 확인됐다. 자율주행 AI의 객체 검출 및 인식 성능이 향상되면, 주변 환경을 보다 정확히 인식해 안정적인 자율주행이 가능하다.

카카오모빌리티는 과기정통부·ETRI·정보통신기획평가원(IITP)·KADIF·자율주행DNA기술포럼과 함께 지난해 8월 해당 학습 데이터셋 일부를 활용, 과기정통부 주최 '제1회 자율주행 AI 챌린지'를 개최해 참석자들에게 자율주행 AI 데이터 활용 역량 향상의 기회도 제공한 바 있다.

정부는 2027년 융합형 레벨4+ 자율주행 상용화 기반 완성을 목표로 '자율주행 기술개발  혁신사업'을 추진 중이며, 카카오모빌리티는 과기정통부와 IITP, KADIF의 지원을 받아 해당 사업 과제를 수행했다.

정광복 KADIF 단장은 "본 사업을 통해 '미래의 석유'라 불리는 15만건의 융합형 자율주행 학습 데이터셋을 공개하게 되어 기쁘게 생각한다"며, "이번에 공개된 학습 데이터가 관련 학계, 스타트업 등의 성장 발판이 되고, 나아가 AI 자율주행 기술 고도화에 기여할 수 있기를 기대한다"고 말했다.

장성욱 카카오모빌리티 미래이동연구소장은 "이번 데이터셋 공개가 국내 자율주행 기술의 상용화와 발전을 앞당기는 초석이 되길 기대한다"며, "앞으로도 다양한 공공 및 민간기업과 협력하여 자율주행 기술 혁신과 공공 데이터 활용 확대에 앞장서겠다"고 말했다.

홈으로 이동 상단으로 이동