인더스트리

카카오 생성 AI ‘칼로’, 구글 클라우드로 더 강해진다

기사입력 2022.12.15 13:27
카카오브레인, ‘칼로’ 머신러닝 고도화, 구글 클라우드에서 진행
대규모 데이터 처리에 따른 ‘병목현상’ 등의 문제, 클라우드로 해결
  • 카카오브레인이 개발한 생성 AI ‘칼로’로 생성한 이미지의 모습 /카카오브레인
    ▲ 카카오브레인이 개발한 생성 AI ‘칼로’로 생성한 이미지의 모습 /카카오브레인

    구글 클라우드는 카카오브레인이 자사 기술로 최근 공개한 생성 인공지능(AI) 모델 ‘칼로’를 고도화한다고 15일 밝혔다.

    칼로는 카카오브레인이 일찍이 공개한 이미지 생성 AI 모델 ‘민달리(minDALL-E)’와 ‘RQ-트랜스포머’를 발전시켜 새로 만든 ‘생성 AI’ 모델이다. 1억 2000만 장 규모의 텍스트·이미지 데이터셋을 학습해 이를 이해한 문맥을 바탕으로 다양한 화풍과 스타일로 이미지를 생성한다. 일례로 ‘르네 마그리트 화풍으로 그린 아보카도 얼굴을 한 남자’라는 제시어를 입력하면 제시어의 맥락을 이해하고 아보카도 얼굴을 한 남성의 모습을 르네 마그리트 화풍으로 상상해 이미지를 그려낸다.

    칼로는 텍스트와 이미지 등 여러 형태의 많은 데이터셋을 반복 학습하고 학습 속도도 빨라야 하기 때문에 대규모 컴퓨팅 자원이 요구된다. 또 많은 양의 자원과 빠른 성능을 유지하기 위해 이를 효과적으로 묶을 수 있는 시스템도 필요하다. 연산 데이터를 관리하는 노드가 늘어날수록 상호 처리해야 하는 데이터양이 많아져 ‘병목 현상’이 발생, 속도 저하나 시스템 장애 등의 문제를 발생시킬 수 있기 때문이다.

    카카오브레인은 이 문제를 줄이기 위해 구글 클라우드의 인프라와 솔루션을 활용하고 있다. 구글 클라우드의 그래픽처리장치(Cloud GPU)는 엔비디아 대표 GPU ‘A100’ 16개를 단일 노드로 운영할 수 있다. 카카오브레인은 이를 활용해 GPU 자원을 노드당 16개까지 묶어 사용함으로써 병목 현상을 줄였다. 이를 통해 성능 손실을 최소화하고 컴퓨팅 효율을 강화했다. 모델 개발 기간을 단축해 비용도 절감했다.

    카카오브레인은 또 생성 AI 모델의 활용도를 높이기 위해 구글 클라우드의 ‘비전 API(응용프로그램 인터페이스)’를 활용하고 있다. 비전 API는 이미지에 라벨을 할당하고 사전 정의된 수백만 개의 카테고리에 따라 이미지를 빠르게 분류할 수 있다. 이를 활용해 칼로가 그린 그림의 맥락을 분석하고 사회적 기준에 부합하는지 실시간으로 파악해, 사용자에게 불편함을 줄 수 있는 그림을 사전에 방지하고 있다.

    이외에도 구글 클라우드는 카카오브레인이 ‘클라우드 스토리지’와 ‘GPU 인스턴스’ 등의 기능도 이용하고 있다고 밝혔다. 클라우드 스토리지를 통해 학습 데이터를 저장·관리하고 컴퓨트 엔진의 GPU 인스턴스를 활용해 기술 고도화를 이루고 있다고 설명했다.

    김세훈 카카오브레인 AI디렉터는 “칼로의 AI 모델은 지금도 계속해서 진화하고 있으며 학습에 수반되는 데이터셋 규모 역시 커지는 중”이라며 “구글 클라우드는 편리한 기술 제공은 물론 고성능의 리소스를 빠르게 확장할 수 있어 모델 학습에 필요한 자원이 갑자기 늘어나더라도 유연한 대응이 가능하다”고 평가했다.

    장화진 구글 클라우드 코리아 사장은 “구글 클라우드는 지난해부터 카카오브레인의 초거대 AI 언어 모델 연구개발을 지원해왔다”며 “언어 모델을 넘어 인간의 창의성과 가능성을 극대화하는 이미지 생성 AI 분야까지 협업을 확대하게 된 것을 매우 기쁘게 생각한다”고 말했다.

최신뉴스