-
공공데이터 개방이 확대되는 가운데 데이터 활용 과정에서 발생하는 전처리 부담을 줄이기 위한 자동화 솔루션이 잇따라 등장하고 있다. 데이터 품질 솔루션 기업 우리데이터는 공공데이터를 인공지능(AI) 학습 및 활용에 적합한 형태로 정제하는 ‘우리데이터클리닉 V1.0’을 출시했다고 19일 밝혔다.
공공기관들은 데이터 개방 규모를 확대하고 있지만 실제 현장에서는 기관별 상이한 데이터 구조와 비표준 형식, 메타데이터 부족, 코드 체계 불일치 등으로 인해 AI 적용 이전 상당한 전처리 작업이 필요한 상황이다. 이 과정에서 추가 비용과 업무 부담이 발생하는 점이 과제로 꼽혀왔다.
우리데이터클리닉 V1.0은 데이터 구조와 표준, 데이터 값을 분석해 품질 진단부터 개선 과정까지 자동화하는 데 초점을 맞춘 솔루션이다. 회사 측에 따르면 역공학(Reverse Engineering) 기반 분석 기술을 활용해 데이터베이스 구조를 분석하고 데이터 품질 관리 과정을 자동화할 수 있도록 설계됐다.
특히 Oracle, PostgreSQL, Microsoft SQL Server, MySQL, MariaDB 등 총 13종 데이터베이스 관리 시스템(DBMS)을 지원해 이기종 데이터베이스 환경에서도 통합 관리가 가능하도록 했다.
또 데이터 표준 진단 기능을 통해 표준 용어, 도메인, 코드 정의서 등을 자동 생성하고, 데이터 값 검증 기능을 통해 품질 검증 규칙 추천 및 실시간 모니터링 기능도 제공한다. 공공데이터 품질 수준평가 대응에 필요한 16종의 산출물 자동 생성 기능도 포함됐다.
박희성 우리데이터 대표는 “AI 활용이 확대되면서 단순한 데이터 개방보다 곧바로 활용 가능한 데이터 품질 확보가 중요해지고 있다”며 “공공기관의 데이터 활용성과 AI 적용 효율성을 높이는 데 초점을 맞췄다”고 말했다.
- 송정현 기자 hyunee@chosun.com