큐빅, 차등정보보호 기법 기반 합성데이터 솔루션 개발
AI 데이터 전문 기업 큐빅(CUBIG)이 민감한 데이터를 안전하게 보호할 수 있는 대안으로 차등정보보호(Differential Privacy) 기법을 적용한 합성데이터(재현데이터, synthetic data) 솔루션을 자체 개발했다고 16일 밝혔다.
큐빅 관계자는 “기존의 합성데이터는 심각한 보안 취약점을 갖고 있고 보안 조치가 취해지지 않은 합성데이터 솔루션을 사용할 경우 심각한 보안 위험을 야기할 수 있다”며 “규빅의 솔루션에 적용한 차등정보보호 보안 기법은 미국 인구통계국 및 여러 글로벌 빅테크 기업들이 사용하고 있는 안전한 보안 알고리즘 기법으로, 민감한 데이터를 분석하거나 학습할 때 노이즈를 추가해 모든 공격으로부터 샘플 단위의 민감 정보를 안전하게 보호한다”고 말했다.
차등정보보호 기법을 기반으로 개발된 큐빅의 합성데이터 솔루션은 성능과 보안성에서 모두 SOTA(State-of-the-Art) 수준을 유지한다. 또한 큐빅의 차등정보보호는 한 번 적용되면 이후에도 안전성을 유지한다는 특징이다.
큐빅 관계자는 “특히 보안 강화에 있어 법적 위험을 제거하며, 합성데이터로 원본 데이터를 유추할 수 있는 가능성을 최소화한다. 이는 기존 합성데이터의 보안 취약점을 보완하며 데이터 재식별 공격과 재구성 공격에 대한 높은 저항성을 제공한다”고 설명했다.
배호 큐빅 대표는 “현재 합성데이터의 가장 큰 문제점은 원본만큼 성능이 올라오면 보안이 취약해지고, 성능이 낮으면 AI 학습이나 분석에 사용이 불가하다는 점”이라며 “단순한 합성데이터 생성으로는 모든 보안 요소가 충족될 수 없고, 특히 개인정보나 민감한 내용을 포함한 데이터일수록 차등정보보호를 만족하는 형태로 생성돼야 안전하다”고 말했다.
이어 배 대표는 “차등정보보호 기법을 적용한 합성데이터 솔루션을 개발을 계기로 앞으로 국내외 합성 데이터 기술의 선두주자로서 사용자의 프라이버시와 민감정보 보안을 최우선 목표로 해 글로벌 사업을 확장해 나가겠다”고 덧붙였다.