KT 초거대 AI '믿음’, B2B 대상 AI 사업화 지원 집중”
B2B 시장 공략 3년 뒤 천 억 매출 목표
생성형 AI 오류 환각현상 70% 낮춰
KT가 초거대 인공지능(AI) ‘믿음’ 출시로 B2B 시장 점령과 대중화에 나섰다. 믿음은 기업 규모와 사용 목적에 맞는 경량 모델부터 초대형 모델을 지원하며, 누구와도 협력할 수 있다.
최대 2,000억 개 수준의 매개변수(파라미터) 규모의 연산 능력을 학습한 ‘초거대 인공지능(AI) 믿음(Mi:dm)’이 출시됐다. 31일 서울 서초구 KT 연구개발센터 열린 기자설명회에서 최준기 인공지능빅데이터(AI BigData) 사업본부장은 이와같이 말하며, 초거대 AI ‘믿음’ 출시와 동시에 B2B 시장 공략을 알렸다. 이는 오픈 AI의 GPT3.0보다 큰 규모이다. 대체로 언어모델의 크기는 매개변수 개수의 영향을 받는데 많을수록 성능과 효율성이 올라가 의사결정에 유리해진다.
최준기 본부장은 “KT가 가장 나은 B2B 솔루션을 제공할 수 있다”며 “3천억 시장이 열릴 것이라고 보고 있다”고 말했다. 이어 “3년 뒤 천 억대의 매출을 목표로 하고 있고, 5년간 AI 분야 1.5조를 투자하겠다”고 밝혔다. KT만의 B2B 경쟁력으로 고객의 요구를 정확하게 이해해 컨설팅하고 가장 적합한 AI 모델을 찾을 수 있게 하겠다는 전략이다.
최 본부장은 “더 잘 알아듣고 깊이 있게 이해하는 AI부터 스스로 디자인하는 AI까지 믿음은 발전할 것”이라며 “태국 그룹과의 협업을 필두로 비영어권 국가를 중심으로 서비스 기회를 확장하려고 하고 있다”고 밝혔다.
◇ 1조 토큰 이상 데이터 학습…환각현상 70% 낮추는 기술 적용
특히 국내 최초 1조 토큰 이상 데이터를 학습한 대형언어모델(LLM) ‘믿음’은 이름과 같이 신뢰성 강화를 위해 노력했다. AI가 왜곡된 내용을 진실처럼 대답하는 현상인 환각현상(할루시네이션)을 70% 낮추는 3가지 기술을 적용했다. 신뢰 패키지(Reliable Package)에 제공되는 AI 기술은 다큐먼트 AI, 서치 AI, 팩트가드로 AI로 문서를 검색하고 추론하고 답변하는 모든 단계에서 신뢰성을 높이는 기술이다.
다큐먼트 AI(Document AI)는 도식화된 복잡한 문서도 모델이 정확히 이해할 수 있도록 변환하는 기술이다. 서치 AI(Search AI)는 목표 도메인과 문서에 최적화된 최신 정보를 찾아내는 딥러닝 기술이다. 팩트가드 AI(FactGuard AI)는 원문에 근거한 응답만 생성하도록 강화학습을 적용했다.
초거대 AI ‘믿음’은 이와 같은 신뢰성, 맞춤성, 편리성, 효율성이라는 기술적 특징을 갖고 있다. ‘믿음’을 모든 규모에 기업들이 활용할 수 있도록 완전 맞춤형(Full Fine-Tuning)으로 사용할 수 있게 했다. ‘KT 믿음 스튜디오(KT Mi:dm Studio)’ 전용 포털을 공개해 사용자가 직접 KT 믿음의 파운데이션 모델을 직접 선택, 학습, 서빙할 수 있는 맞춤형 환경을 제공한다.
파운데이션 모델이란, 방대한 데이터 세트로 학습한 초거대 AI 핵심 기반 모델을 말한다. 자사가 원하는 AI 모델을 만들기 위해서는 기업에서 원하는 형태로 미세조정(Fine-Tuning: 파인 튜닝)을 거쳐야 한다.
배순민 소장 KT 융합기술원 AI2XL연구소장은 “기업들이 믿고 자사의 데이터에 맞는 AI 모델을 쉽고 비용 부담 없이 만들 수 있는 솔루션”이라며 “70억 개 수준의 매개변수부터 2,000억 개 수준의 초대형 매개변수까지 4가지 LLM 라인업을 제공하고 있다”고 설명했다.
예를 들어 인테리어 업체 또는 금융에 대한 Q&A에서 복잡한 표를 요약해 필요한 정보를 표로 제공하거나 주어진 여러 문서에서 정보를 분석·조합하여 정보를 줄 수 있다. 광고 홍보 문구 생성, 기사 초안 작성, 캐릭터 생성 등도 할 수 있다.
◇ 기업 전용 AI 클라우드팜으로 원스톱 서비스 제공
편리성 측면에서 믿음의 기업전용 AI 클라우드팜을 이용해 자사의 AI 전용 모델을 원스톱으로 지원하고 있다. 배 소장은 “클라우드 팜에서 어플리케이션 전용 AI 모델 및 서비스를 제공하기 위한 모든 편의성을 갖추었다”며 “멀티 LLM 지원을 통해 고객이 기업 내부 데이터나 시스템에 연동하고 이를 통해 가장 적합한 모델을 선택할 수 있도록 했다”고 말했다.
이어 배순민 소장은 “모델 학습 및 서비스를 검증할 수 있는 플레이그라운드 기능으로 부족한 데이터를 추가하고 학습을 진행할 수 있다”고 언급했다. AI 역량이 없어도 손쉽게 자사 맞춤 AI 모델과 애플리케이션을 구축할 수 있게 되는 것이다.
비용도 절감했다. 추론 비용을 기존 대비 50% 절감한 리벨리온의 NPU 인프라와 기존 대비 약 27% 가까운 GPU 학습 비용 절감이 가능한 KT Cloud의 HAC(Hyperscale AI Computing) 서비스 등을 ‘AI 풀스택’ 맞춤형 통합 패키지로 함께 제공할 예정이다.
LLM이 학습과정에서 고정관념을 학습해 편향성이 드러나는 문제가 이슈가 됐다. 이러한 우려에 대해 배순민 소장은 “실제 연구소 안에 파운데이션 모델을 계속 테스트하는 여러 팀이 존재한다”며 “데이터와 그 결과에 대해 한국어 차원에서 검증하는 케이스를 만들어 가고 있고, 버전마다 문제를 검증하면서 다른 모델들과 비교하고 있다”고 답했다. 이어 “보편적이고 안전한 답변이 가능하도록 노력하고 있다”고 밝혔다.
한편, KT가 공개한 ‘믿음’의 4종 모델 중 외부에 완전히 개방하는 70억 파라미터 규모의 경량 모델은 한국어 LLM 평가 리더보드인 ‘Open Ko LLM’에서 최상위를 기록하기도 했다. ‘Open Ko-LLM’은 역사 왜곡이나 형태소 오류, 환각, 혐오 표현 등 광범위한 항목을 평가하고 AI가 주어진 조건에 대해 생성해 낸 결과물이 한국어 사용자의 일반 상식에 부합하는지를 평가한다.
◇ 스타트업과 LLM 사업화 나서
KT는 스타트업 기업과도 협력해 LLM 사업화에 나선다. 기업전용 LLM 사업화에 ‘업스테이지’, Math-GPT를 비롯한 교육 영역에선 ‘콴다’와 서비스를 만들고 있다. ‘에누마’는 기업용 업무 개인비서 영역에 협조하고 있다. 배순민소장은 "기업들과 LLM 생태계를 확장해 나갈 것“이라며 ”절대 혼자서는 빠르게 성장할 수 없고, 기업들과 함께해야 성장할 수 있다"고 말했다.
이용재 콴다 대표는 “KT 양질에 교육용 LLM을 만들어 글로벌 교육 생태계를 주도하겠다”며 “세계적인 수준의 AI 선생님 매스 지피티(Math-GPT)를 만들기 위해 노력할 것”이라고 말했다.
김성훈 업스테이지 대표는 “반복된 업무를 자동화하고 중요 정보를 찾고 요약하고 읽기 쉬운 형태로 다시 생성하는 일을 하고 있다”며 “자비스 같은 AI 비서가 대신 해주는 것처럼 KT와 업무의 단순화를 실현하는 기업 전용 LLM 시장을 개척하겠다”고 말했다.