인더스트리

LG AI연구원, 초거대 AI ‘엑사원’ 미디어아트 작가로 데뷔

기사입력 2024.06.21 18:32
미디어아트 전 과정 수행… CVPR 2024에 전시
  • LG AI연구원이 초거대 AI 엑사원으로 만든  ‘화담숲의 사계’ 미디어아트를 CVPR 2024에 전시했다. /LG AI연구원
    ▲ LG AI연구원이 초거대 AI 엑사원으로 만든 ‘화담숲의 사계’ 미디어아트를 CVPR 2024에 전시했다. /LG AI연구원

    LG AI연구원의 초거대 인공지능(AI) ‘엑사원’이 미디어아트 작가로 데뷔했다.

    LG AI연구원은 17일(현지시각)부터 닷새간 미국 시애틀에서 열린 ‘CVPR(국제 컴퓨터 비전 및 패턴 인식 학술대회) 2024’에 참가해 엑사원이 디렉팅한 미디어아트 ‘화담숲의 사계’를 LG 통합부스에 전시했다. 엑사원이 계절별 영상 기획 단계부터 이미지 생성, 모션 그래픽 구성 등 전 과정을 수행한 작품이다.

    LG AI연구원에 따르면, 이 작품을 만들기 위해 엑사원에 저작권 문제가 없는 이미지 3.5억 장과 화담숲 이미지 6700여 장을 추가 학습시켰다. 회사는 블로그를 통해 “화담숲의 사계는 엑사원이 미디어아트 기획부터, 구성, 생성까지 모두 수행할 수 있다는 가능성과 잠재력을 보여준 점에서 의미가 크다”고 했다.

    엑사원은 이미지를 보고 텍스트로 설명할 수 있고, 텍스트를 이해해 이미지를 생성할 수 있는 세계 첫 양방향 멀티모달이다. 2021년 12월 처음 공개된 후 지난해 7월 비즈니스에서 활용이 유리할 수 있도록 전문성과 신뢰성을 고도화한 ‘엑사원 2.0’ 버전이 선보여졌다.

  • LG AI연구원은 CVPR 2024에서 서울대, AWS와 함께 ‘제로샷 이미지 캡셔닝’을 주제로 한 워크숍도 개최했다. /LG AI연구원
    ▲ LG AI연구원은 CVPR 2024에서 서울대, AWS와 함께 ‘제로샷 이미지 캡셔닝’을 주제로 한 워크숍도 개최했다. /LG AI연구원

    LG AI연구원은 이번 학회에서 엑사원을 만든 기술력을 토대로 서울대, 아마존웹서비스(AWS)와 함께 ‘제로샷 이미지 캡셔닝’을 주제로 한 워크숍도 개최했다. 제로샷 이미지 캡셔닝은 AI가 학습하지 않은 이미지도 텍스트로 설명하는 기술이다. 사람의 시각 인지 능력처럼 처음 본 사물이나, 동물, 풍경 등이 포함된 이미지를 보고 AI가 기존 학습한 데이터를 기반으로 스스로 이해하고 유추한 결과를 텍스트로 설명할 수 있다. 토끼를 한 번도 본 적이 없는 사람이 토끼 여러 마리와 고양이 한 마리가 함께 있는 것을 봤을 때 동물들의 생김새와 특성의 공통점과 차이점을 학습하고 ‘토끼도 털은 있지만 고양이와는 다르게 귀가 길고, 뒷다리가 발달했다’라고 설명할 수 있는 것과 유사하다. 이번 워크숍에는 아마존, 구글, 메타 등 빅테크 기업 전문가와 학계 전문가가 참석했다.

    이외에도 LG AI연구원은 CVPR 2024에서 논문을 발표한 석·박사 인재 100여 명을 초청해 ‘LG AI Day’를 진행했다. LG AI Day는 LG AI연구원이 추진하는 네트워킹 행사로, 주요 학회에서 AI 인재를 마난 연구에 대한 인사이트를 공유하고 연구자끼리 교류하는 소통의 장이다. LG AI연구원과 LG전자는 지난 2년간 CVPR을 포함해 세계적인 AI 학회에서 이 행사를 진행했다.

    한편, 이번 학회에서 LG그룹은 LG AI연구원이 5편, LG전자가 4편, LG CNS가 2편 총 11편의 논문을 발표했다.

최신뉴스