인더스트리

KT-매스프레소-업스테이지, ‘수학 AI’로 글로벌 빅테크 아성 넘다

기사입력 2024.01.08 14:25
공동 개발한 수학 특화 LLM, MS·오픈AI 기록 앞서
  • KT와 매스프레소, 업스테이지가 공동 개발한 수학 인공지능(AI) 모델이 세계 기록을 달성했다. 마이크로소프트(MS), 오픈AI 등 유수 AI 기업들을 제친 성과다.

    AI 기반 학습 플랫폼 ‘콴다’를 운영하는 매스프레소(대표 이용재)는 AI 스타트업 업스테이지(대표 김성훈), KT와 공동 개발한 수학 도메인 특화 프리이빗(Private) 대형언어모델(LLM)이 오픈AI와 MS 모델을 제치고 세계 신기록을 달성했다고 8일 밝혔다.

    교육 분야에서 대형 AI 모델 활용은 꾸준히 과제로 제시돼왔다. 챗GPT 등 흔히 알려진 생성형 AI 모델은 전문 지식과 같은 학습데이터가 아닌 대규모 텍스트 데이터를 기반으로 학습돼 잘못된 정보를 진짜처럼 알려주는 환각 현상을 보여서다. 정확한 정보 제공이 핵심인 교육에서 이 문제는 해결해야 할 숙제로 꼽혔다. 특히 수학은 정확도가 낮아 숙제가 컸다.

    이 숙제를 풀기 위해 매스프레소와 업스테이지는 지난해 11월, KT와의 전략적 파트너십 일환으로 ‘MathGPT(가칭)’ 개발에 착수했다. 매스프레소는 매일 1000만 건의 문제 검색을 통해 축적된 학습 수준, 맥락, 상호작용 등 학습데이터를 업스테이지에 제공했다. 업스테이지는 이를 환각현상 방지에 특화된 자체 솔루션에 학습시켜 자연어 기반 언어모델이 논리적 추론과 프로그래밍화를 통해 복잡한 수학 문제를 풀 수 있도록 파인튜닝을 진행했다. 

    양사가 개발한 MathGPT는 ‘MATH’(1만 2500개의 고난도 수학 경시 문제), ‘GSM8K’(8500개의 초등학교 수학 문제) 등 수학 능력을 평가하는 벤치마크에서 기존 최고 기록인 MS ‘ToRA 13B’를 제치고 13B 이하 모델 기준 1위를 차지했다. MATH 벤치마크에서는 GPT-4의 성능을 넘어섰다. GSM8K와 MATH 두 벤치마크에서 동시에 1위를 달성한 경우는 이례적인 성과다. 매스프레소 측은 “KT의 강력한 인프라와 기반 모델 분야에서 축적된 노하우, 콴다의 독보적인 수학 특화 데이터, 그리고 업스테이지의 뛰어난 모델링 기술력이 결합돼 이룩한 성과”라고 말했다.

    매스프레소는 ‘MathGPT’ 모델의 정확도와 성능을 지속해서 향상하고, 궁극적으로는 이를 자사의 학습 인터페이스와 결합해 AI 보조 교사인 ‘AI 튜터’로 구현하겠다고 밝혔다. 향후 AI 튜터 서비스를 모든 교육 현장과 솔루션에 접목하여 글로벌 AI 튜터로써 교육 시장을 혁신한다는 구상이다.

    이용재 매스프레소 이용재 대표는 “매스프레소, 업스테이지, KT 3사의 기술력과 노하우가 합쳐져 글로벌 빅테크를 뛰어넘은 의미 있는 결과를 만들어냈다”며 “우리의 AI 튜터를 통해 아시아를 넘어 전 세계 학생들의 교육 경험을 혁신하겠다”고 말했다.

    김성훈 업스테이지 대표는 “콴다, KT와의 협력을 통해 챗GPT를 뛰어넘고 세계 최고 수준의 수학 특화 언어모델을 개발하게 되어 뜻깊다”라며 “앞으로 업스테이지는 글로벌 1위 LLM 기술력을 바탕으로 다양한 영역에서 생성형 AI 혁신을 주도해 나갈 것”이라고 밝혔다.

최신뉴스