‘비국가대표’ 카카오, 네이버보다 작고 빠른 AI 내놨다
한국형 하이브리드 멀티모달 모델 공개
일상 대화-복잡 추론 자동 전환... 네이버 ‘옴니모달’과 차별화
4B 모델로 32B 하이퍼클로바 제쳐… 한국어 벤치마크 92.8점 ‘1위’
카카오가 정부의 파운데이션 모델 프로젝트에서 탈락한 가운데, 독자적인 인공지능(AI) 기술 개발 행보를 이어가고 있다. 5일 카카오는 일상 대화부터 복잡한 논리적 문제 해결까지 하나의 모델로 처리할 수 있는 자체 개발 AI 모델 ‘Kanana-v-4b-hybrid’의 성능을 공개했다.
정부는 지난해 국가 파운데이션 모델 개발을 위해 SK텔레콤, 네이버클라우드, LG AI연구원, 업스테이지, NC AI 등 5개사를 선정했다. 국가대표 AI 후보로 선정된 네이버클라우드는 최근 텍스트·이미지·오디오를 처음부터 하나의 모델에 동시 학습시킨 네이티브 옴니모달 모델 ‘하이퍼클로바 X SEED’를 공개하며 정부 프로젝트 참여 기업으로서의 기술력을 과시했다. 카카오는 이 프로젝트에서 제외됐지만, 자체 AI 모델 개발에 집중하며 독자 노선을 걷고 있다.
카카오가 이번에 공개한 모델은 네이버클라우드와는 다른 접근 방식을 취했다. 네이버클라우드가 ‘옴니 모달(통합 감각)’을 내세우며 음성, 이미지, 텍스트 등 다양한 입출력 방식의 통합에 초점을 맞췄다면, 카카오는 ‘하이브리드’라는 이름에서 알 수 있듯 일반 대화 모드와 추론 모드를 하나의 모델에서 전환할 수 있다는 점을 강조했다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 “LLM은 책만 읽고 공부한 두뇌와 같다”며 “이 두뇌에 눈과 귀, 손과 발을 달아주면 세상을 보고 듣고 만지면서 개념을 통합적으로 이해하게 된다”고 설명했다. 반면 카카오는 사람처럼 정보를 종합하고 계산하며 스스로 검산하는 자기 점검 과정을 통해 AI 환각 현상을 최소화하는 데 주력했다.
카카오의 새로운 모델은 지난해 7월 허깅페이스를 통해 오픈소스로 공개한 ‘Kanana-1.5-v-3b’를 기반으로 개발됐다. 단순히 이미지를 텍스트로 변환하는 수준을 넘어 복잡한 표나 영수증, 수학 문제 등에서 발생하기 쉬운 계산 실수나 조건 누락을 획기적으로 줄였다.
카카오는 높은 성능 구현을 위해 기초 학습, 장문 사고 사슬(Long CoT), 오프라인 강화학습, 온라인 강화학습으로 이어지는 4단계의 정교한 학습 과정을 적용했다. 특히 한국어 논리 전개 능력에서 독보적인 경쟁력을 입증했다. 기존 글로벌 모델들이 한국어 질문을 영어로 번역해 사고한 뒤 재번역하는 과정에서 맥락과 논리가 결여되는 한계를 보인 반면, 이 모델은 한국어 질문을 직접 이해하고 사고하도록 훈련됐다.
한국 교육 체계 기반의 AI 학력 평가 벤치마크인 ‘KoNET’에서 92.8점을 획득했으며, 대학수학능력시험 사회탐구나 수학 문제에서 한국어의 미묘한 조건들을 놓치지 않고 높은 정답률을 기록했다. 네이버클라우드의 32B 싱크 모델이 수능에서 국어·영어·수학 1등급, 한국사·영어 만점을 기록한 것과 유사한 성과다.
글로벌 모델 Qwen3-VL-4B, InternVL3.5-4B, GPT-5-nano 및 국내 모델과의 성능 평가에서도 과학과 공학, 일반 시각 질의응답, 문서 이해 등의 영역에서 뛰어난 성능을 보였다. 특히 수학과 과학 등 복잡한 추론이 필요한 영역과 일반 시각 이해 능력에서는 글로벌 모델을 뛰어넘는 성과를 기록했다.
카카오는 향후 사용자가 모델을 선택할 필요 없이 AI가 질문의 복잡도를 스스로 판단해 일반·추론 모드를 자동 전환하는 형태로 고도화할 계획이다. 네이버클라우드가 음성, 이미지, 텍스트 등 어떤 방식으로도 실시간 소통이 가능한 '감각의 통합'을 추구한다면, 카카오는 작업의 난이도에 따른 '사고 방식의 전환'에 방점을 찍은 셈이다.
카카오 김병학 카나나 성과리더는 “Kanana-v-4b-hybrid는 한국어 환경에서 가장 자연스럽고 정확하게 생각하고 답변할 수 있는 모델로, 일상과 복잡한 작업을 모두 하나의 AI에 맡길 수 있는 혁신적인 연구 성과”라며 “한국어에 특화된 높은 성능과 효율을 갖춘 자체 AI 모델 개발을 통해 글로벌 무대에서 경쟁력을 높이고, 국내 AI 생태계 발전의 선도 역할을 이어가겠다”고 말했다.
카카오는 지난달 멀티모달 언어모델 ‘Kanana-o’와 ‘Kanana-v-embedding’의 연구개발 성과를 공개했으며, 에이전틱 AI 구현에 최적화된 ‘Kanana-2’를 오픈소스로 공개하는 등 정부 프로젝트와 별개로 독자적인 기술 경쟁력을 지속 증명하고 있다.