딥페이크·가짜뉴스 시대, 생성형 AI 책임 묻는 기술
디퓨전 모델로 이미지 자체 최적화, ‘워터필링’과 유사
-
생성형 인공지능(AI) 만든 이미지를 누가 생성했는지 눈에 보이지 않게 표시하는 기술이 개발됐다. 딥페이크와 가짜뉴스가 사회적 문제로 대두되는 상황에서 AI 생성 콘텐츠의 책임 추적성을 확보할 수 있는 기술이다.
김혜지 텍사스대 오스틴캠퍼스(University of Texas at Austin) 교수는 4일 KCCV(Korean Conference on Computer Vision) 2025에서 ‘Neural Cover Selection for Steganography’를 주제로 한 강연에서 AI 생성 이미지에 사용자 식별 정보를 은밀하게 삽입하는‘ 스테가노그래피’ 기술을 소개했다.
김 교수는 “오바마 전 미국 대통령이 빨간 모자를 쓴 AI 생성 이미지가 온라인에 퍼져 어린이들에게까지 유통된다고 상상해보라”며 “이런 상황에서 누가 해당 이미지를 생성했는지 추적할 수 있는 기술이 절실하다”고 강조했다.
◇ 기존 워터마크 넘어선 ‘보이지 않는’ 식별 기술
스테가노그래피는 비밀 메시지를 이미지 속에 숨기는 기술로, 메시지가 존재한다는 사실조차 탐지되지 않아야 한다는 특징이 있다. 기존 워터마킹과 달리 일반 사용자에게는 완전히 보이지 않으면서도 훨씬 많은 정보를 담을 수 있다.
김 교수팀이 개발한 시스템은 인코더와 디코더로 구성된다. 인코더는 사용자 식별 메시지와 이미지를 입력받아 숨겨진 메시지를 포함한 이미지를 출력하고, 디코더는 권한을 가진 주체가 필요시 숨겨진 메시지를 복원할 수 있도록 한다.
연구팀은 이 기술의 핵심 지표로 △얼마나 많은 정보를 숨길 수 있는지(페이로드) △복원된 메시지의 정확도(오차율) △원본과 수정 이미지 간 시각적 차이를 제시했다. 특히 디코더는 원본 이미지 없이 수정된 이미지만 보고 메시지를 추정해야 하는 매우 도전적인 작업을 수행한다.
기존 딥러닝 기반 스테가노그래피 연구들은 주로 완성된 이미지에 메시지를 삽입하는 상황만 고려했지만, AI 생성 이미지의 경우 생성 과정에서 이미지가 유연하게 변할 수 있다는 점에 착안해 새로운 접근법을 제안했다.
◇ AI가 정보이론 원칙 스스로 학습 “워터필링과 유사”
김 교수팀은 ‘생성 기반 커버 최적화(Generative Cover Optimization)’ 기법을 통해 기존 방식의 한계를 극복했다. 핵심은 디퓨전 모델을 활용해 이미지 생성을 담당하는 커버 이미지 자체를 최적화하는 것이다.
연구진은 “AI가 초기 생성한 이미지가 완벽하지 않을 수 있다면, 약간의 수정을 통해 더 효과적으로 메시지를 삽입할 수 있지 않을까 하는 아이디어에서 출발했다”고 설명했다. 최적화는 메시지 복원률과 이미지 품질을 포함하는 손실 함수를 줄이는 방향으로 진행되며, 디퓨전 모델의 잠재 공간에서 이미지를 표현하고 최적화한다.
연구팀은 이번 실험에서 딥러닝 모델이 정보이론의 ‘워터필링(Waterfilling)’ 원리와 유사한 방식으로 정보 삽입 전략을 형성한다는 점을 확인했다. 워터필링은 여러 통신 채널에 잡음이 서로 다를 때 제한된 전력을 잡음이 적은 채널에 더 많이 할당하는 최적 전략이다.
김 교수는 “인코더가 각 픽셀에 정보를 덧붙인다는 가정 하에서, 원본 이미지는 디코더 입장에서 일종의 잡음으로 작용한다”며 “얼굴 영역은 매우 다양하고 복잡하지만, 배경은 단순할 수 있기 때문에 노이즈가 적은 영역에 메시지를 더 많이 삽입하는 것이 유리하다”고 설명했다.
실제로 연구진이 워터필링의 수학적 공식에 따라 픽셀별 노이즈 수준을 계산하고 실제 인코더의 정보 할당량과 비교한 결과, 인코더가 실제로 잡음이 적은 픽셀에 더 많은 메시지를 넣고 있다는 것을 확인했다. 최적화 후에는 저분산 픽셀이 더욱 많아져, 고전력 픽셀의 비율이 80%에서 90%로 증가했다.
◇ 딥페이크 시대 핵심 대응 기술... 실용화 과제는 남아
이번 연구는 생성형 AI 시대의 새로운 사회적 문제에 대한 기술적 해결책을 제시했다는 점에서 의미가 크다. 특히 기존 워터마크 방식이 눈에 보이거나 쉽게 제거될 수 있었던 반면, 스테가노그래피 기반 식별 정보 삽입은 탐지 자체가 어렵고 제거도 매우 힘들다는 장점이 있다.
연구 결과, 메시지 복원 성능이 크게 향상되었고 이미지 품질은 손상되지 않았다. 기존 GAN 기반 방법과 비교했을 때도 시각 품질 측면에서 더 우수한 결과를 얻었다. JPEG 압축에 대한 강건성 등 실제 적용을 고려한 요소도 실험에 포함됐다.
김 교수는 “최적화 과정에서 꽃이 많은 이미지가 단 하나의 꽃으로 바뀌는 등 구조 변화가 나타났지만, 이러한 변화를 통해 더 효과적인 메시지 삽입이 가능해졌다”고 말했다.
다만 실용화를 위해서는 추가적인 개선이 필요하다. 현재 천 번 중 1번에서 만 번 중 1번 꼴로 발생하는 오류를, 10억 번에 한 번꼴 수준으로 낮추는 채널 코딩 기법 개발이 과제로 남아 있다. 김 교수는 “앞으로는 스테가노그래피 인코더가 단순히 정보를 숨기는 것 이상의 역할을 할 수 있을지, 그리고 이진 정보가 아닌 다양한 유형의 정보 특성도 활용할 수 있을지에 대한 연구를 계속할 것”이라고 향후 연구 방향을 밝혔다.
- 김동원 기자 theai@chosun.com