큐빅, 차등정보보호 기법 기반 합성데이터 솔루션 개발

김경희 기자
2024.07.16 11:08

AI 데이터 전문 기업 큐빅(CUBIG)이 민감한 데이터를 안전하게 보호할 수 있는 대안으로 차등정보보호(Differential Privacy) 기법을 적용한 합성데이터(재현데이터, synthetic data) 솔루션을 자체 개발했다고 16일 밝혔다.

합성데이터의 한계./사진=USENIX Security 23

큐빅 관계자는 “기존의 합성데이터는 심각한 보안 취약점을 갖고 있고 보안 조치가 취해지지 않은 합성데이터 솔루션을 사용할 경우 심각한 보안 위험을 야기할 수 있다”며 “규빅의 솔루션에 적용한 차등정보보호 보안 기법은 미국 인구통계국 및 여러 글로벌 빅테크 기업들이 사용하고 있는 안전한 보안 알고리즘 기법으로, 민감한 데이터를 분석하거나 학습할 때 노이즈를 추가해 모든 공격으로부터 샘플 단위의 민감 정보를 안전하게 보호한다”고 말했다.

차등정보보호 기법을 기반으로 개발된 큐빅의 합성데이터 솔루션은 성능과 보안성에서 모두 SOTA(State-of-the-Art) 수준을 유지한다. 또한 큐빅의 차등정보보호는 한 번 적용되면 이후에도 안전성을 유지한다는 특징이다.

큐빅 관계자는 “특히 보안 강화에 있어 법적 위험을 제거하며, 합성데이터로 원본 데이터를 유추할 수 있는 가능성을 최소화한다. 이는 기존 합성데이터의 보안 취약점을 보완하며 데이터 재식별 공격과 재구성 공격에 대한 높은 저항성을 제공한다”고 설명했다.

고양이./사진=ICLR 2024

배호 큐빅 대표는 “현재 합성데이터의 가장 큰 문제점은 원본만큼 성능이 올라오면 보안이 취약해지고, 성능이 낮으면 AI 학습이나 분석에 사용이 불가하다는 점”이라며 “단순한 합성데이터 생성으로는 모든 보안 요소가 충족될 수 없고, 특히 개인정보나 민감한 내용을 포함한 데이터일수록 차등정보보호를 만족하는 형태로 생성돼야 안전하다”고 말했다.

이어 배 대표는 “차등정보보호 기법을 적용한 합성데이터 솔루션을 개발을 계기로 앞으로 국내외 합성 데이터 기술의 선두주자로서 사용자의 프라이버시와 민감정보 보안을 최우선 목표로 해 글로벌 사업을 확장해 나가겠다”고 덧붙였다.

페이스북 플러스친구 네이버포스트