AI

카카오브레인, 3초 만에 이미지 생성하는 AI ‘칼로 2.0’ 공개

  • 메타리즘
기사입력 2023.07.10 14:04
약 3억 장 규모의 텍스트·이미지 학습… 부정 명령어도 인지
  • (사진제공: 카카오브레인)
    ▲ (사진제공: 카카오브레인)

    카카오브레인이 10일 초거대 인공지능(AI) 이미지 생성모델 ‘칼로(Karlo) 2.0’을 공개했다.

    ‘칼로 2.0’은 기존 모델에서 업그레이드되면서 약 3억 장 규모의 텍스트와 이미지 데이터셋을 학습한 초거대 AI 아티스트다. 글로벌 최고 수준의 언어 이해력을 기반으로 완성도 높은 그림을 생성할 수 있는 성능을 갖췄다. 예를 들어 ‘밝은 파란 눈동자를 가진 고양이’와 같은 복잡한 프롬프트(명령어)를 입력해도 명확하게 그려낸다.

    해상도는 최대 2048X2048을 지원한다. 생성하는 이미지의 해상도가 높을수록 다양한 이미지 사이즈로 작업이 가능해 표현하고자 하는 그림을 보다 심도 있고 섬세하게 그려낼 수 있다.

    이미지상의 공간감, 입체감, 동물의 털과 같은 텍스처를 디테일하게 표현하는 세밀함 등이 보강돼 실사에 가까운 고품질 이미지 생성이 가능하다. ‘모던 아티스트’ 등을 포함한 각종 화풍 구현 능력도 탁월하며, 이미지 생성 속도 역시 기존 모델 칼로 1.4 대비 단축돼 3초 만에 원하는 이미지를 만들어 낼 수 있다.

    카카오브레인은 국내 AI 생태계 발전을 위해 칼로 2.0 오픈 API를 카카오디벨로퍼스에 공개했다. 기존 칼로 1.4에 비해 다양한 크기 및 비율의 이미지 생성이 가능하며, 높은 이해도와 부정 명령어 기능을 통해 이미지 생성 시 제외해야 하는 표현이나 키워드를 제어할 수 있다.

    김일주 카카오브레인 각자 대표는 “인체 비율 및 구도, 공간감과 입체감을 표현하는 투시도 등 다양한 이미지 데이터 학습 및 기술 고도화 과정을 거쳐 칼로 2.0을 선보이게 됐다”며 “많은 데이터와 사용자 피드백을 학습시켜 실사 수준의 이미지를 생성하는 동시에 보다 다양한 사용자의 니즈를 반영할 수 있는 이미지 생성 모델로 발전시켜 나갈 것”이라고 말했다.

  • 메타리즘

최신뉴스