-
카카오브레인이 자체 개발한 인공지능(AI) 아티스트 ‘칼로(Karlo)’를 공개했다. 지난해 LG AI연구원이 AI 아티스트 ‘틸다’를 공개한 지 약 1년 만이다. 단 카카오브레인은 칼로를 오픈소스로 공개하며 ‘초거대 AI’ 생태계 발전에 힘을 보탠다고 밝혔다.
카카오브레인은 입력한 제시어를 바탕으로 고품질의 이미지를 빠르게 만들어내는 AI 아티스트 ‘칼로 1.0’ 모델을 오픈소스 커뮤니티 깃허브(GitHub)에 공개했다고 1일 밝혔다. 칼로는 카카오브레인이 공개한 ‘민달리(minDALL-E)’, ‘RQ-트랜스포머’ 등 이미지 생성 AI 모델을 발전시켜 재탄생한 AI 아티스트다. 1억 2000만장 규모의 텍스트·이미지 데이터셋을 학습해 이를 이해한 문맥을 바탕으로 다양한 화풍과 스타일로 이미지를 생성한다.
일례로 ‘르네 마그리트 화풍으로 그린 아보카도 얼굴을 한 남자’라는 제시어를 입력하면 제시어의 맥락을 이해하고 아보카도 얼굴을 한 남성의 모습을 르네 마그리트 화풍으로 상상해 이미지를 그려낸다.
칼로의 활용 분야는 다양하다. 교육 및 발표에 필요한 시각자료 제작에 활용할 수 있고, 신규 브랜드 로고 디자인, 구조물 디자인 등 고도의 창의성을 요하는 산업군에서도 도움을 받을 수 있다. 카카오브레인은 내년 초 품질과 기능을 개선한 모델을 오픈 API(응용프로그램 인터페이스) 형태로 공개할 예정이다. 또 지속적으로 텍스트·이미지 데이터셋 추가 학습을 하는 한편 이미지에서 불필요한 부분을 자연스럽게 제거하거나 편집할 수 있는 ‘이미지 인페인팅’, 기존 이미지를 보고 빛과 그림자, 주변 사물 등을 상상해 이미지를 확장할 수 있는 ‘이미지 아웃페인팅’ 등의 기능을 추가할 계획이다.
AI 아티스트가 등장한 것은 이번이 처음은 아니다. LG AI연구원은 지난 2월 세계 4대 패션위크 중 하나로 불리는 뉴욕 패션위크에서 자체 개발한 AI 아티스트 ‘틸다’를 공개했다. 이날 틸다는 박윤희 디자이너(그리디어스 대표)와 함께 ‘금성에서 핀 꽃’을 모티브로 디자인한 의상들을 선보였다. 의상은 틸다가 기존에 없던 새로운 이미지를 창작하면 박윤희 디자이너가 여기서 영감을 얻어 디테일을 더해 제작했다. 틸다는 ‘금성에 꽃이 핀다면 어떤 모습일까?’, ‘너는 무엇을 그리고 싶니?’라는 질문을 듣고 이를 토대로 새로운 이미지를 창작했다.
박윤희 디자이너는 틸다와 협업에 대해 긍정적으로 평가했다. 새로운 디자인과 영감을 찾는 도구로 사용해 업무효율을 높일 수 있었다고 밝혔다. 그는 “뉴욕 패션위크와 같은 큰 무대에 서기 위해 가장 중요한 것은 상상력”이라며 “새로운 디자인과 영감을 찾기 위해서 몇 달 전부터 수십 명의 디자이너와 컬렉션을 준비해야 했는데 이번에 틸다와 함께 작업하며 한 달 반 만에 모든 준비를 끝낼 수 있었다”고 말했다. 또 “패션위크에선 틸다만이 갖고 있는 창조성과 인간만이 가지고 있는 감정을 교감하면서 영혼의 옷을 만들고자 했다”며 “엄청난 시너지를 낼 것이라는 확신이 있었고 예상은 틀리지 않았다”고 평가했다.
이번에 카카오브레인이 공개한 칼로는 LG의 틸다보단 한 단계 낮은 AI 모델로 평가된다. 틸다의 경우 초거대 멀티모달 ‘엑사원’을 두뇌로 탑재했는데 이 모델은 텍스트를 이미지로 그려낼뿐 아니라 이미지를 보고 텍스트를 설명할 수 있는 양방향 소통이 가능한 멀티모달이기 때문이다. 카카오브레인의 칼로는 텍스트를 이해해 이미지를 설명할 수 있는 일방형 소통만 가능하다.
단 카카오브레인은 해당 모델을 모두가 사용할 수 있는 오픈소스로 공개함으로써 LG와 전략을 차별화했다. LG의 경우 해당 기능을 엑사원을 오픈소스로 공개하지 않고 필요로 하는 기업과 업무협약 체결을 통해 기술을 제공하고 있다.
김일두 카카오브레인 대표는 “이번에 공개한 칼로 모델로 AI 아티스트의 무궁무진한 가능성을 다방면에 활용할 수 있을 것”이라며 “앞으로도 카카오브레인은 세계적 수준의 AI 모델들을 오픈소스로 공개하며 AI 생태계 발전 가속화에 힘을 보탤 것”이라고 말했다.
- 김동원 기자 theai@chosun.com