국회 회의록 3만 건 벡터화한 시맨틱 검색 시스템 시연으로 주목
VDPU 반도체로 검색 효율 극대화해 내년 신제품 출시 앞둬
-
디노티시아가 AI 인프라 핵심 기술인 벡터 데이터베이스를 앞세워 검색증강생성 시장 진출에 속도를 낸다. 10일 코엑스 B홀에서 열린 스타트업 페스티벌 ‘컴업(COME UP) 2025’에서 정무경 디노티시아 대표는 자사의 벡터DB ‘씨홀스’와 이를 활용한 실사용 기반 AI 서비스를 공개하며 시장 확장 의지를 드러냈다.
디노티시아는 컴업 전시장에서 국회 본회의와 위원회 회의록 약 3만 건을 벡터 데이터로 재구성한 AI 서비스 ‘폴리큐’를 선보였다. 사용자가 자연어로 질문하면 관련 발언과 맥락, 요약, 출처를 즉시 제시하는 구조다. 현재 베타 버전으로 운영 중인 폴리큐는 방대한 문서 환경에서 시맨틱 검색 기술이 어떻게 작동하는지 직접 확인할 수 있는 시연으로 주목받았다.
LLM 기반 서비스가 RAG와 에이전트 구조로 확산되면서 검색 성능의 중요성이 급격히 커지고 있다. 방대한 데이터에서 의미를 빠르게 찾아내는 능력이 AI 전체 시스템의 효율을 좌우하기 때문이다. 이러한 흐름 속에서 벡터 데이터베이스는 핵심 인프라로 떠올랐다. 벡터 데이터베이스는 텍스트, 이미지, 영상을 수치 벡터로 변환해 저장하고, 문맥과 의도를 반영한 검색을 가능하게 한다. 전통적인 키워드 기반 검색과 달리 의미론적 유사성을 기반으로 작동하기에 사용자의 질문 의도를 정확히 파악해 답변의 정확도를 높일 수 있다.
디노티시아가 개발한 씨홀스는 이러한 차세대 벡터DB의 특징을 모두 갖춘 제품이다. 텍스트뿐만 아니라 이미지, 영상 등 멀티모달 데이터를 벡터화해 저장하고, 문맥을 고려한 검색 결과를 제공하도록 설계됐다. 기업 입장에서는 별도 인프라 구축 없이도 시맨틱 검색 환경을 빠르게 도입할 수 있어 운영 비용과 개발 기간을 줄일 수 있다.
디노티시아는 씨홀스를 클라우드 기반 완전 관리형 SaaS 형태로도 제공한다. 기업은 인프라를 직접 구축하지 않고도 벡터 검색 시스템을 활용할 수 있어 진입 장벽이 낮다. 이는 중소기업이나 스타트업도 고도화한 AI 검색 기능을 빠르게 적용하는 환경을 조성한다. 주목할 점은 디노티시아가 벡터 연산 가속기 전용 반도체 VDPU를 개발한다는 것이다. VDPU는 대규모 벡터 연산을 전용 회로에서 처리하는 방식으로, CPU나 GPU 기반 시스템 대비 지연 시간과 전력 소비, 비용 문제를 낮추는 것을 목표로 한다. 벡터 연산에 특화한 하드웨어를 통해 검색 처리량을 높이고 효율을 극대화하는 전략이다.
현재 벡터 데이터베이스 시장에서는 클라우드 네이티브 배포와 GPU 가속 지원이 주요 트렌드로 자리 잡았다. 기업들은 실시간 검색 성능과 확장성을 동시에 확보하기 위해 관리형 클라우드 서비스를 선호하는 추세다. 디노티시아의 SaaS 모델과 VDPU는 이러한 시장 요구에 정확히 부합하는 접근이다.
디노티시아는 폴리큐를 자체 LLM인 DNA 시리즈와 다양한 외부 모델 모두와 연동 가능하도록 설계했다. 지난해 말 발표한 DNA 파운데이션 모델 이후 한국어 추론 과정을 투명하게 출력하는 DNA-R1, 도구 호출과 에이전트 기능을 강화한 DNA 2.0까지 순차적으로 출시하며 모델 성능을 끌어올렸다. 이러한 구조는 공공 문서 탐색에 국한되지 않는다. 기업 내부 문서 관리, 의료 데이터 분석, 금융 정보 검색 등 정보량이 많은 다양한 환경으로 확장 가능하다. 실제로 폴리큐의 아키텍처는 벡터 검색과 LLM을 결합한 전형적인 RAG 구조로, 다른 도메인에도 동일하게 적용할 수 있다.
정무경 대표는 자사의 시맨틱 검색 기술과 고객 환경에 최적화한 LLM, 자동화한 RAGOps 기반으로 여러 기업의 AI 전환을 지원하고 있다고 설명했다. 내년에는 이러한 기반을 더 많은 산업으로 확장할 계획이며, AI가 활용하는 데이터가 선별된 일부가 아닌 모든 데이터로 확장되는 만큼 이를 효율적으로 처리하기 위한 새로운 제품을 2026년에 선보일 예정이라고 밝혔다.
- 서재창 기자 chang@chosun.com