스켈터랩스 김도연 CPO, 서종훈 개발총괄 인터뷰
스켈터LLM 올해 하반기 출시 “각 분야 특화된 전문가 AI 만들 것”

(왼쪽부터) 스켈터랩스 김도연 CPO, 서종훈 개발총괄

대화형 인공지능(AI) ‘챗GPT’ 등장 이래로 ‘대형언어모델(LLM)’이 전성기를 맞이했다. AI가 사람과 자연스럽게 대화하고 필요한 문장을 생성하는 데 있어 구심점 역할을 한 LLM은 GPT 시리즈 개발사인 오픈AI뿐 아니라 구글, 메타, 엔비디아 등 글로벌 빅테크 기업과 네이버, LG, 카카오 등 국내 대기업들이 경쟁적으로 모델 고도화에 나서고 있다. LLM이 연구 단계를 넘어 실제 서비스 영역에서 큰 파장을 줄 수 있다는 것을 챗GPT로 입증됐기 때문이다.

하지만 LLM은 자본과 기술, 데이터가 풍부한 일부 기업만 할 수 있는 분야라는 한계가 있었다. 모델 구축에만 억에서 조 단위의 비용이 투입되고 운영 단가도 높아서다. 실제로 국내 대기업이 개발한 LLM 모델의 경우 1000개 이상의 그래픽처리장치(GPU)가 투입됐는데, 엔비디아 A100과 같은 GPU가 개당 1000만 원 이상에 판매된다는 점을 생각하면 GPU 구축에만 100억 원의 금액이 투자된다는 점을 알 수 있다. 

그런데 이 LLM 개발에 뛰어든 스타트업이 있다. 국내 자연어 AI 기업 ‘스켈터랩스’다. 자체적으로 높은 성능의 기계독해(MRC) 기술을 개발한 이 회사는 빅테크 기업이 개발한 LLM에 자체 대화형 AI 기술을 접목해 전문성 있는 질의응답 업무가 가능한 챗봇 ‘큐나(QNA)-GPT’를 출시한 데 이어, 이젠 자체 LLM을 개발하고 있다. 올해 하반기 정식 출시가 목표다. 그렇다면 스켈터랩스가 추구하는 LLM은 무엇일까. 스켈터랩스 사무실에서 김도연 최고제품책임자(CPO)와 서종훈 개발총괄(Head of Engineering)을 만나 자세한 얘기를 들어봤다.

스켈터랩스가 출시한 큐나GPT는 대화부터 문서독해 등 다양한 서비스가 가능하다. /스켈터랩스

- 스켈터랩스는 기계독해(MRC) 강자 기업으로 알고 있다. MRC 분야 성과가 있나.

서종훈 : “우리는 한국어 MRC 대회에서 1위를 기록했다. 사람의 독해 능력(91.20)보다 더 높은 점수인 95.15점을 받았다. 본래 이런 대회가 영어권에는 있지만, 한국어로는 없어서 LG CNS가 한국어 기반 유사한 대회를 만들었는데 그 대회에 출전해 1위를 했다. 출시한 서비스와는 달리, 보유하고 있는 모델의 기술 측면만 평가하는 대회다. MRC는 말 그대로 기계가 글을 독해할 수 있는 능력을 의미한다. 포털 사이트 등에 접목돼 사용자에게 익숙한 자연어 인식 기반 검색 서비스와 다르다. 이 서비스는 ‘키워드’를 기반으로 사용자가 입력한 키워드가 같은 문장을 찾아내지만, MRC는 전체적인 글을 이해한다. 예를 들어 국어영역 지문을 준 다음, 이 문제의 답은 무엇이냐고 물어보면 AI가 지문을 독해해 질문과 답을 찾아낸다. 자연어를 얼마나 잘 이해하느냐에 따라 성능이 달라진다.”

김도연 : “우리가 한국어 MRC 대회에 나간 것은 실제 기술을 평가받기 위해서였다. 우리가 자체 개발한 MRC 기술이 객관적으로 어느 수준까지 올라왔고, 한국어에서 얼마나 경쟁력이 있는지 알고 싶었다. 대회를 통해 기술력을 검증한 후 지금은 자체적으로 제품 개발과 서비스에 맞춰 기술을 고도화하고 있다.”

- 서비스는 챗GPT와 같은 대화형 모델에 초점이 맞춰져 있나.

김도연 : “우리는 대화형 AI와 관련해 모든 분야의 기술을 보유하고 있다. 자연어를 인식해 텍스트로 변환하는 음성인식(STT)과 목소리를 생성하는 음성합성(TTS), 언어의 의미를 독해하는 기계독해(MRC), 그리고 사용자 접점에서 서비스되는 챗봇 등의 기술을 보유하고 있다. 이러한 기술들을 필요에 맞게 결합해 맞춤형 솔루션을 만들어 낼 수 있다. 최근 출시한 업무용 챗봇 ‘큐나GPT’에도 이러한 기술들이 총체적으로 들어가 있다. 예를 들어 기업에는 수많은 문서가 있는데, 이를 사용자가 일일이 확인해 가며 업무하긴 쉽지 않다. 이러한 수많은 문서를 학습하고 이해해 필요한 정보를 찾아주고 사용자 질문에 답변으로 알려주고, 반대로 질문을 만들어 낼 수 있는 것이 우리 서비스다.”

서종훈 : “큐나GPT는 이름에서도 알 수 있지만, 우리 자체 기술에 챗GPT를 결합한 서비스다. 기업용 데이터는 민감한 내용이 많아서 챗GPT와 같은 범용적인 모델에 학습시킬 수 없다. 이러한 고객사의 어려움을 해결하고자 기업용 버전으로 특화된 서비스가 큐나GPT다. 챗GPT는 2021년까지의 데이터만 갖고 있어 그 이후 대답은 할 수 없지만, 큐나GPT는 기업용 데이터에 한 해 2021년 이후 내용도 정확하게 답변할 수 있다. 물론 우리가 제품을 SaaS(서비스형 소프트웨어)로도 제공하기 때문에 원한다면 B2B(기업간 거래) 외에 B2C(기업과 소비자간 거래) 서비스로도 서비스를 출시할 수 있다.”

- 네이버나 카카오 등 대기업에서 유사한 LLM 기반 유사 서비스를 준비하고 있다. 경쟁하기 불리할 수 있을 것 같은데.

서종훈 : “이번에 챗GPT와 우리의 MRC 기술을 접목한 서비스를 만들면서 느꼈던 점이 ‘챗GPT는 정말 뛰어난 대화형 모델이지만 이를 전문적으로 서비스하기 위해선 많은 노하우가 필요하다’였다. 챗GPT가 정말 많은 걸 해줄 수 있지만, 고객사의 필요에 맞춰 서비스하는 것은 바로 하지 못한다. 여기엔 자연어처리(NLP)에 관한 노하우가 정말 많이 필요하다. 국내 대기업들이 초거대 모델을 만들고 있지만, 이를 각 기업에 특화해 바로 서비스할 순 없다. 범용 모델과 전문화된 모델이 다른 이유다. 우리의 역할은 범용적으로 만들어진 모델을 전문화된 영역으로 만들어 내는 것이다. 따라서 우린 국내 대기업이 LLM을 잘 만들어 서비스를 공개해주면 사용자 맞춤형 서비스를 더 고도화할 수 있다. 경쟁 관계가 아닌 상호보완적인 관계라고 볼 수 있다.”

김도연 : “초거대 모델이든 LLM이든 거대 모델들은 범용적인 플랫폼이라고 보면 된다. 우리는 이를 활용해 고객사에서 필요로 하는 특화된 모델을 만든다고 이해하면 된다. 오픈AI 서비스만 이용할 필요도 없고, 네이버 서비스만 이용할 필요도 없다. 모델마다 특색이 다다르기 때문에 상황에 따라 다른 모델을 선택해 사용할 수 있다. 예를 들어 영어와 한국어의 프롬프트 사용료는 차이가 난다. 한국어가 영어보다 3배가량 비싸다고 볼 수 있다. 이 때문에 한국어 특화 LLM은 비용적으로 유리한 점이 있다.”

- 자체적으로 LLM을 만들면 특화된 서비스 제공이 쉬울 것 같은데.

서종훈 : “현재 준비 중에 있다. ‘스켈터LLM(가칭)’이다. 오픈AI와 네이버 등이 출시한 LLM과 달리 경량화된 모델이다. 이들 모델이 상당히 넓은 분야를 범용적으로 커버한다면, 우리는 한 분야에서 똑똑하게 말할 수 있는 모델을 만들고 있다. 사실 대부분 회사는 범용적인 부분을 커버하는 초거대 모델을 비즈니스로 사용하긴 어렵다. 많은 분야의 지식이 많고 말도 잘하지만, 실제 기업에서 필요로 하는 서비스는 그만큼의 지식이 없어도 된다. 그래서 우리는 기업이 소화할 수 있는 경량화된 LLM을 만드는 것이 목표다.”

김도연 : “고객사 사례를 보면 외부 API 서비스를 사용할 수 있는 회사도 있지만, 사용할 수 없는 회사도 많았다. 유출되면 안 되는 데이터 문제나 보안, 네트워크 등의 이유 때문이었다. 그래서 우리만의 작은 LLM을 만들어 이러한 고객에게 적합한 서비스를 제공하는 것을 준비 중에 있다. LLM을 사용하고 싶지만, 범용 모델에 데이터 학습이 어려운 기업들이 대상이다. 이러한 기업들에게 맞춤형 LLM 모델을 제공해 모두가 기술 발전으로 인한 혜택을 누리게끔 하고 싶다.”

- LLM을 만드는 것 자체가 쉽지 않은 영역일 텐데.

서종훈 : “그렇다. 오픈으로 공개된 연구 내용도 있지만, 이를 실제로 구현하는 것은 또 다른 문제다. 우리는 MRC를 자체적으로 만들었고, 또 이를 서비스한 경험이 있기 때문에 LLM 개발에 도전하게 됐다. 단 MRC와 달리 LLM은 베이스부터 만들진 않고 있다. 오픈소스 진형들이 지금 혁신적인 연구를 많이 하고 상용화 쪽에 무게를 두고 있어서 우리도 이 분야에 맞춰 모델을 개발 중이다.”

- 새로운 언어를 생성해내는 기술들은 새로운 윤리 문제에 부닥쳤다. 대비하고 있는 부분이 있나.

서종훈 : “AI 윤리 문제는 LLM에서 더 부각된다. 왜냐하면 생성형 모델로 사용되다 보니 어떤 메시지를 생성할지 모르는 부분이고, 좋지 않은 내용을 만들어 내게 되면 회사에 엄청난 손실이 발생하기 때문이다. 기업 이미지 추락은 기본이고, B2B 서비스의 경우 고객사 피해까지 책임져야 한다. 우리는 LLM 모델을 만들고 있다 보니, 데이터뿐 아니라 모델 자체도 신경 써야 한다. 최근 오픈소스 진영에서도 AI 윤리에 관해 관심을 두고 가이드라인 등을 만들어가고 있다. 우리는 개발팀 자체에서 AI 윤리를 중요시하고 있어 이러한 가이드라인을 최대한 준수해서 좋은 모델을 만들고자 한다. 아직 한계도 있지만, 데이터부터 모델, 서비스까지 문제되지 않은 AI를 만들기 위해 노력 중이다.”

김도연 : “적어도 초반에 다른 기업이 겪었던 데이터 수집 과정에서의 문제들은 최소화하고 있고, 모델 선택 과정에서의 문제도 줄여가고 있다. 아무래도 LLM 자체가 가지고 있는 위험성이 있다 보니 선례들을 참고해 위험성을 최소화하고, 이러한 위험성을 없앨 방법을 계속 찾고 있다. 이러한 연구는 LLM 모델을 만드는 모든 회사가 갖고 있는 책임감이 아닐까 싶다.”

홈으로 이동 상단으로 이동