[인터뷰] 허언증 없는 AI 조수 ‘바이브 자비스’가 온다
윤준태 바이브컴퍼니 부사장 “생성형 AI 실질적 활용, 데이터와 MRC 기술로 지원”
자체 LLM과 검색 기술 개발… 금융·법률 분야에 ‘자비스’ 같은 AI 서비스 제공
영화 아이언맨에 나오는 인공지능(AI) 조수 ‘자비스’가 현실로 다가왔다. 대형언어모델(LLM)을 기반으로 한 ‘생성형 AI’ 기술 발전 덕분이다. 자비스는 영화에서 아이언맨과 자연스럽게 대화하며 필요한 답과 정보를 척척 찾아 주고 스스로 데이터를 학습해 자가 발전하는 모습을 보여준다. 그리고 지금 이러한 자비스의 초기 버전이 등장하기 시작했다. 챗GPT와 같은 대화형 AI 모델이다.
‘어린이 자비스’와 같은 지금의 대화형 AI는 웹 페이지와 스마트폰 애플리케이션(앱) 등을 통해 사람과 자연스럽게 소통하며 필요한 정보를 제공한다. 여기에는 LLM 역할이 컸다. LLM은 대용량 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 학습한 모델이다. 기존 모델들이 초등학교 지식까지 공부했다면, LLM은 대학교 지식까지 학습했다고 볼 수 있다. 그만큼 더 많은 정보를 제공할 수 있다. 또 많은 양의 데이터를 학습한 모델 내 저절로 논리 구조가 생기는 등의 현상이 발생했고, 여기에 자연어처리(NLP) 기술을 결합하면 문장을 생성하는 것까지 가능해졌다.
하지만 지금의 텍스트 생성형 AI 모델은 아직 어린이 단계라 여러 오류가 발생하고 있다. 대표적인 현상이 ‘허언증’과 같은 할루시네이션(환각) 현상이다. 맞지 않은 내용을 사실처럼 얘기해 거짓 정보를 전파할 수 있는 위험이 있다. 외부에 공개해서는 안 되는 데이터를 여러 경로를 통해 학습해 국가나 기업에 보안 위협을 줄 수 있는 위험도 안고 있다. 이 때문에 여러 기업에서는 생성형 AI를 사용하고 싶지만, 활용하지 못하는 현상이 발생 중이다.
이에 발 벗고 나선 기업이 있다. 인공지능(AI)·빅데이터 기업 ‘바이브컴퍼니’다. AI 상장기업이기도 한 이 회사는 자체 개발한 한국어 특화 LLM을 개발, 이를 검색 기술과도 연계했다. 단, LLM을 기존 챗GPT처럼 범용적이지 않고 법률, 금융 등 특화에 전문화되게 제작해 환각 현상이 발생하는 문제를 해소했다. 자비스가 아직 어린이 수준인 만큼, 모든 과목을 가르치지 않고 특정 과목만 가르쳐 해당 분야에서만 활용할 수 있게 한 것이다. 기초 지식은 검증된 데이터를 활용하고, 여기에 AI를 활용하려는 기업의 데이터를 공부시켜 ‘정답’만 말할 수 있게 한 것이다. 또 그 정답에 근거까지 제시하게 해 사용자가 그 정보가 믿을 수 있는지 다시 확인할 수 있게 했다.
바이브컴퍼니가 이 같은 기술을 개발할 수 있었던 것은 빅데이터 사업을 하며 오랜 기간 데이터를 수집해 왔고, ‘기계독해(MRC)’ 기술 등을 고도화해 왔기 때문이다. MRC는 AI가 ‘질문하고 답하기’를 반복적으로 학습해, 스스로 문제를 분석하고 질문에 최적화된 답안을 찾아내는 기술을 뜻한다. 실제로 바이브컴퍼니는 현재 한국어 MRC 경진대회인 ‘코쿼드(KorQuAD) 1.0’ 기반 성능 평가에서 지난해 1위를 기록하고 꾸준히 선두 위치해 자리해 있다. 코쿼드 1.0은 지난 2018년 12월 LG CNS가 공개한 위키백과 기반 AI 학습용 한국어 표준데이터 7만 건을 포함한 한국어 질의응답 데이터셋을 뜻한다. 대회는 이 데이터셋을 바탕으로 AI가 약 10분 동안 수천 개의 비정형화된 주관식 질문에 답하는 방식으로 진행된다. 답변의 정밀도와 재현율에 따라 점수를 높게 산출한다.
그렇다면 바이브컴퍼니가 만든 LLM과 대화형 AI는 무엇이 다를까. 윤준태 바이브컴퍼니 부사장 겸 최고기술책임자(CTO)를 만나 자세한 얘기를 들어봤다.
- 최근 자체 LLM인 ‘바이브GeM’을 출시했다. 그 이유는 무엇인가.
“우리는 AI 자산 처리나 빅데이터 등의 사업과 연구를 지속해오고 있었다. 그 와중 2010년 이후부터 딥러닝 기반 자연어처리(NLP) 기술이 나오기 시작했고, 우리 나름대로 MRC 기술을 개발하고 고도화하며 상황을 지켜보고 있었다. 지난해에는 한국어 MRC 경진대회에서 1위를 하며 좋은 성과를 거뒀다. 그러면서 생긴 고민이 이러한 기술을 ‘어떻게 활용할까’였다. 그래서 우리만의 서치 기술을 만들었다. 하지만 답답한 부분이 존재했다. 답이 보이기는 하지만, 만족스럽지 못했다. 수학 문제가 아닌 이상 문제의 답은 하나가 아닌데, 이를 표현하지 못했다. 예를 들어 삼성전자 주가 전망을 물었을 때 A라는 사람과 B라는 사람, C라는 기사가 서로 다른 답을 제시한다. 이 중 하나만 답으로 알려주지 않고 종합적으로 보여주는 기술이 필요했다. 이 답은 오픈AI의 챗GPT에서 얻었다. 하지만 챗GPT는 환각 현상과 보안 등이 문제가 돼 기업에서 활용이 어려웠다. 그래서 기업이 생성형 AI를 제대로 활용할 수 있게 하기 위해 자체 LLM을 개발하게 됐다.”
- 빅테크 기업처럼 초거대 규모 LLM은 아니고 경량화 모델일 것 같다.
“맞다. 우리는 범용적으로 사용되는 LLM이 아닌 특정 분야에서 전문적으로 사용할 수 있는 모델을 원했다. 이 때문에 비싸고 전력 소모가 많이 들어가는 모델보단 경량화 모델이 필요했다. 경량화 모델을 처음부터 끝까지 다 개발하긴 보다는 지금 오픈돼있는 모델을 응용해 활용했다. 오픈돼 있는 모델을 우리 시스템에 맞게 재학습을 시켰다. 챗GPT는 1750억 개 파라미터를 가지고 있다 보니 설치만 하더라도 수십 대의 서버를 연결해야 한다. 우리는 한 대의 서버에서 LLM이 돌아가게끔 하는 것을 목표로 모델을 지속 경량화하고 있다.”
- 챗GPT의 주요 문제인 환각 현상을 해소했다고 들었다.
“정확히 말하면 환각 현상을 없앴다가 아니라 MRC 기반 QA 기술로 완화했다고 보면 된다. MRC와 검색 기술을 결합해 질문에 대한 답을 찾는 기술을 통해 정답만 제시하게끔 했다. 예를 들어 ‘반도체 산업 전망’을 우리 검색 기술인 ‘바이브 서치 GPT’에 물어보면 MRC 기술을 이용해 답을 먼저 찾는다. 보고서와 기사 등을 통해 답을 찾고 이를 글로 풀어 설명한다. 당연히 그 근거도 보여준다. 보통 전망에 대한 견해는 사람, 시기 등에 따라 다르게 된다. 이를 최신 뉴스와 보고서 등을 토대로 종합적으로 보여주는 것이다. 또 시기에 맞춰 구체적인 정보를 제시한다. ‘반도체 시장은 2분기에는 회복 신호가 나타날 것으로 예상되고. 3분기부터는 점진적인 회복세를 보일 것으로 전망된다. 중간재고 조정이 마무리되면 하반기부터 수요가 늘어날 것이다’와 같은 식이다. 그리고 왜 이러한 분석을 하게 됐는지 기사 링크 등을 제공한다. 챗GPT는 어떠한가. 구체적인 정보가 아닌 보편화된 답만 제공한다. 사람들이 알고 싶은 것은 당장 지금의 반도체 시장 전망인데, 시기에 상관없이 보편적인 답만 제시하는 것이다. 또 그 답에 근거가 없어 사실인지 아닌지도 알 수 없다. 2021년 데이터까지만 학습해 최신 정보를 제공할 수도 없다. 시장 전망과 같은 내용은 최근 정보가 아니면 모두 환각일 수 있다.”
- 바이브GeM이 경량화 모델이고 전문적인 내용만 학습한 만큼, 바이브 서치 GPT도 특정 분야만 서비스할 것 같은데.
“금융과 법률 쪽을 전문으로 한다. 시장 전망, 증권 분석 등도 해주고 보험약관을 학습시켜 추후 보험금 청구 등을 사용자가 질문하면 필요한 답을 찾아주는 서비스를 제공하고 있다. 기업 분석 리포트도 제공한다. 상장기업의 매출과 실적과 최신 뉴스 등을 통한 기업 전략, 전망 등을 분석해 리포트를 작성한다. 이 리포트엔 당연히 실적 분석과 전망 등에 관한 내용이 담겨 있다. 법률 분야에서는 그동안 판례 데이터를 학습시켜 법 쪽 궁금증을 풀어주는 서비스를 제공한다. 일례로 ‘전세 사기를 당했을 때 공인중개사에게도 처벌할 수 있나요?’라고 물어보면 판례 데이터를 근거로 관련 정보를 제공한다. 지금은 궁금한 내용이 있으면 법무법인을 방문하거나 네이버 지식인에 물어보면 법조인이 답을 달 때까지 기다리는 방식을 취하는데, 우리는 이 정보를 바로 제공하고 있다. 우리는 사용자가 편하게 검색을 할 수 있도록 ‘바이브 서치’라는 데모 사이트를 만들고 지속 고도화하고 있다. 여기서는 금융이나 법률 등에 관한 정보를 물어보면 필요한 답을 근거와 함께 제시한다.”
- 최근 다른 MRC, NLP 기술을 가진 기업에서도 자체적으로 LLM과 생성형 AI 모델을 선보이고 있다. 바이브컴퍼니만의 경쟁력은 무엇인가.
“첫 번째는 데이터다. 우리는 그동안 빅데이터 사업을 통해 많은 데이터를 수집해 왔다. 트위터·인스타그램 등 소셜네티워크서비스(SNS)부터 뉴스, 블로그 등 많은 데이터를 보유하고 있다. 이러한 양질의 데이터를 토대로 AI 학습을 잘 시켰다. 또 검색 결과 등을 바로 검증할 수 있도록 시스템을 구현해 계속 팩트체크를 해왔다. AI가 답하고 그 근거를 보여줄 때, 그 근거로 대답 내용을 다시 검증해가며 기술을 고도화한 것이다. 또 다른 장점은 1위에 랭크된 우리 MRC 기술력이다. 글을 만들거나 요약할 땐 답이 있어야 잘할 수 있다. 답이 있어야 그 안에서 정답을 생성하고 요약도 할 수 있기 때문이다. 우리 기술은 단락 검사 테스트에서 답을 찾을 확률이 94% 이상이다. 단락을 통해 답이 있는 명확하게 하이라이팅할 수 있는 것이다. 반면 다른 곳은 76% 정도의 정확도를 보인다. 따라서 우리는 더 정확한 답을 찾고 이를 토대로 문장 생성과 요약 등을 할 수 있다.”
- 기술 경쟁력과 더불어 상용화 부분도 중요할 것 같은데.
“최근 정부에서는 ‘초거대 AI 활용지원 사업’ 공급 기업을 선정했다. 민간의 초거대 AI 활용을 지원하기 위해 해당 기술을 공급할 수 있는 기업을 선정한 것이다. 여기에는 총 4개 업체가 기술 적격 판정을 받았는데, 여기에 바이브컴퍼니도 포함됐다. 같이 선정된 기업은 네이버, KT, 마음AI다. 그만큼 우리는 향후 B2B(기업간 거래)나 B2G(기업·정부간 거래) 쪽으로 더 적극적인 사업을 진행할 수 있을 것으로 생각한다. 또한 기업, 기관뿐만 아니라 나아가 개인들도 용이하게 활용할 수 있는 서비스 형태로 기술을 지속 발전시켜 시장을 확산해 나갈 계획이다.”
- LLM을 만들었고, 이를 기반으로 한 검색 기술도 만들었다. 현재 안고 있는 고민은 무엇인가.
“고민이 되는 부분은 사실 여러 가지다. 하루가 다르게 최신 AI 기술들이 쏟아지고 있고 이를 어떻게 접목하고 응용하고 차별화할 것인가는 항상 고민되는 부분이다. 최근에는 어떻게 글을 더 예쁘고 생성하고 보여줄까를 고민하고 있다. 요약 서비스도 만들고, 도표나 그래프 생성 기술 등도 만들었는데 지금은 또 사용자 입맛에 맞게 글을 자동화하는 AI 기술도 나오면서 이런 서비스와의 접목을 시도하고 있다.”
- AI가 언어를 생성하면서 발생하는 윤리적 논의도 많다.
“사실 우리는 이 문제에서는 다소 자유로운 편이다. 왜냐하면 우리는 임의의 대화를 만드는 것이 아니라 목적 지향적인 대화를 만들기 때문이다. 검색하면 그 검색 데이터를 바탕으로 정리하거나 리포트를 만드는 등의 용도로 사용한다. 또 검색 데이터는 범용적이지 않고 전문적인 부분에서 검증받고, 고객사로부터 받은 것을 사용하기 때문에 규제나 윤리 문제에 직접 접촉은 적다. 사실 규제가 필요한 영역은 AI가 어떤 말을 할지 모르는 분야다. 여기서는 차별, 범죄 등 편향 데이터를 만들어 낼 수 있다. 우리는 아무래도 우리가 추출한 데이터를 기반으로 목적 있는 내용을 만들어 내기 때문에 상대적으로 문제가 되지 않는다고 볼 수 있다.”
- 금융, 법률 외 도메인을 더 늘릴 계획은 없나.
“바이오 쪽 서비스도 염두에 두고 있다. 바이오 분야도 지금 엄청난 양의 논문이 나오고 있고 이를 빠르게 분석하면 여러 가지 좋은 장점이 발생할 것으로 생각한다. 서로 다른 유전자 사이에 어떤 상호작용이 발생할지, 또 어떤 변이가 이뤄 날 지 등을 빠르게 찾을 수 있다고 본다. 이 부분은 지금 고민하고 있고, 우선은 금융과 법률 쪽에 집중하고 있다.”