카카오브레인, 한국어판 챗GPT 개발 착수
올 상반기 한국어 초거대AI 모델 ‘코GPT-3.5’ 출시… 파라미터 390억 개로 확대
카카오브레인이 한국어판 대화형 인공지능(AI) 모델 ‘코챗GPT(가칭)’ 개발에 나섰다. 올해 상반기 코챗GPT의 기반 모델인 ‘코GPT-3.5’를 공개한 후 이를 토대로 대화형 AI를 완성한다는 계획이다.
카카오브레인은 2일 기업 설명회를 열고 올해 상반기 ‘코GPT-3.5’를 공개하겠다고 밝혔다. 코GPT는 2021년 카카오브레인이 출시한 한국어 초거대 언어모델이다. 회사는 처음 60억 개 파라미터를 보유한 코지피티 출시한 후 300억 개, 390억 개로 계속 성능을 높여왔다. 초거대 AI는 대용량 연산이 가능한 컴퓨팅 인프라를 기반으로 인간의 뇌에서 정보를 학습하고 기억하는 시냅스를 인공신경망 파라미터로 구현한 기술을 뜻하는데, 보통 파라미터가 많을수록 AI는 더 정교한 학습을 할 수 있는 것으로 알려져 있다. 김광섭 카카오브레인 최고기술책임자는 이날 코GPT에 대해 “한국어를 사전적, 문맥적으로 이해해 사용자가 원하는 결과를 보여주는 카카오브레인의 초거대 AI 언어모델”이라고 소개했다.
카카오브레인은 코GPT-3.5를 토대로 오픈AI의 챗GPT와 같은 대화형 AI 모델 코챗GPT를 출시한다는 계획이다. 챗GPT가 한국어에 특화된 모델은 아닌 만큼 한국어 특유 문법이나 문체 등을 이해하지 못하지만, 코챗GPT는 한국어 기반 초거대 AI를 기반으로 만들어졌기 때문에 한국어에서만큼은 높은 성능을 낼 수 있다고 설명했다. 회사 관계자는 “코GPT-3는 양질의 데이터셋 구축과 대규모 인프라 등으로 기술을 고도화했다”며 “이를 기반으로 한 코챗GPT는 한국어에서 높은 성능을 낼 것”이라고 기대했다.
카카오브레인은 이외에도 올해 중점적으로 두고 있는 사업 방향으로 이미지 생성 AI 모델과 헬스케어를 꼽았다. 김재인 카카오브레인 실장은 “우리의 초거대 이미지 생성 AI 기술을 글로벌 이미지 생성 AI 분야의 선두로 만들겠다”는 포부를 밝히며 “올 상반기에 한국어버전의 ‘칼로’와 새로운 AI 프로필 생성 기능을 선보일 것”이라고 말했다. 또 “이미지 생성 AI 분야 생태계 확장을 위해 칼로 기술을 중심으로 국내 스타트업을 선발해 지원하는 ‘칼로 100X 프로젝트’를 올 상반기에 시작할 계획”이라고 말했다.
배웅 최고헬스케어책임자(CHO)는 카카오브레인의 AI 헬스케어 사업에 대해 소개하면서 “흉부 엑스레이 의료영상의 판독문 초안을 생성하는 연구용 데모 공개를 올해 목표로 삼고 있다”며 “판독문 초안 생성 기술의 완성도를 높이는 것과 더불어 이를 시작으로 CT, MRI, 초음파 같은 다양한 모달리티 확장을 고려하고 있다”고 설명했다. 카카오브레인 AI 신약 연구을 맡고 있는 이유한 리더는 “카카오브레인은 5~10년 걸리던 신약물질 발굴 프로세스를 2~3년으로 단축해 인류의 건강한 삶과 행복을 증진시키고자 한다”며 “카카오브레인 AI모델에 현재 사용되고 있는 전문 기법을 보강해 신뢰도 높은 신약 개발에 일조할 것”이라고 발표했다.