테크

과기부, 디지털 뉴딜 핵심 '데이터 댐' 구축에 나선다...AI 기술개발의 필수요소

기사입력 2020.06.22 17:34
2020년도 AI 학습용 데이터 20종 선정
올해내 추경예산을 통한 총 150종 추가 구축
  • 데이터 댐 구상 예시, 추경 정부안 기준/자료제공=과학기술정보통신부
    ▲ 데이터 댐 구상 예시, 추경 정부안 기준/자료제공=과학기술정보통신부

    과학기술정보통신부(장관 최기영, 이하 과기부)가 인공지능(AI) 개발에 필수적인 양질의 데이터를 대규모로 구축∙개방하는 'AI 학습용 데이터 구축 사업'의 20개 과제를 확정했다고 22일 밝혔다.

    2017년부터 시작된 'AI 학습용 데이터 구축 사업'은 한-영 번역 말뭉치, 한국어 음성, 이상 행동 영상 등 텍스트, 이미지, 영상 분야의 AI 서비스 개발을 위한 기계학습용 데이터 21종, 4,650만건을 구축하여 AI통합지원 플랫폼인 AI허브를 통해 공개 중이다.

    올해는 작년보다 예산 및 과제가 2배 늘어난 20개 과제(10개 지정공모, 10개 자유공모)를 390억 원 규모(2019년 195억 원)로 추진하였으며, 총 92개 사업자가 참여하여 평균 4.6대 1의 경쟁률을 보였다.

    선정 분야는 국가적∙산업적 필요성에 따라 사람의 감성과 문맥을 이해할 수 있는 자연어 처리분야, 자동차 및 드론 등 자율주행기술 분야, 음성∙시각∙언어 융합 분야 등 국가적으로 산업적으로 활용가치가 높고 데이터 확보 필요성이 시급한 과제를 선정했다.

    이와 함께, 국민편의 향상을 위해 질병진단(치매, 구강질병 등), 헬스케어 분야, 사람의 얼굴을 악의적으로 변조한 딥페이크 방지 기술 분야, 장애인의 삶을 향상 시킬 수 있는 분야 등 국민 생활을 윤택하게 하고 사회적 문제를 해결할 수 있는 과제를 선정했다.

    AI 학습용 데이터를 수집하고 가공하는데 많은 인력이 필요하다. 이에, 미국과 중국 등 해외에서는 누구나 참여하여 데이터를 가공할 수 있는 크라우드소싱 방식을 경쟁적으로 도입하여 인력 부족 문제를 해결하면서 양질의 데이터 확보와 일자리를 창출하고 있다.

    과기부는 작년에 2개 과제를 크라우드소싱 방식으로 추진한데 이어, 올해는 모든 과제에 전면적으로 크라우드 소싱 방식을 적용하여AI 학습용 데이터를 구축함으로써 일자리를 만들어갈 예정이다. 특히, 청년과 취업준비생, 경력단절여성, 장애인 등에게 많은 일자리가 제공되고, 데이터 가공 전문성을 쌓을 수 있는 기회도 될 것으로 기대된다.

    과기부는 2020년 추경예산을 통해 코로나19 이후 경기침체를 극복하기 위해 일자리 창출효과가 크고 AI모델 개발에 필수적인 'AI 학습용 데이터 구축 사업'을 확대 추진할 계획이다. 총 150개 종류의 AI 학습용 데이터를 구축하고 AI 통합 지원 플랫폼인 AI 허브를 통해 무료 개방할 계획이다.

    과기부는 "중소기업과 스타트업 등은 비용부담과 인력부족 때문에 필요한 AI 학습용 데이터를 직접 구축하는데 어려움 많아서, 양질의 데이터 확보에 대한 수요가 크다"고 밝히며, "시장에서 필요한 양질의 AI 학습용 데이터를 많이 확보하는 것이 단기간에 우리나라 AI 경쟁력을 끌어 올릴 수 있는 해결책이 될 수 있다"고 강조하였다.

    또한, "이번 추경을 통해 AI 학습용 데이터 구축을 대규모로 확대∙구축하여 데이터 댐에 모으고, 다양한 AI 기술연구, 상용화 서비스 개발에 활용할 수 있도록 지원하겠다"고 전하며, "이를 통해, 양질의 일자리 창출과 경제성장의 새로운 원동력을 확보할 수 있을 것으로 기대한다"고 밝혔다.

최신뉴스