인더스트리

LG, ‘초거대 AI’ 상용화 첫 단추

기사입력 2022.12.08 16:35
LG AI연구원, 초거대 멀티모달 ‘엑사원’ 제조·금융 등 전 산업에 적용
텍스트와 이미지 모두 이해하는 ‘멀티모달’ 강점으로 범용성 확장
  • 배경훈 LG AI연구원장(왼쪽)이 초거대 멀티모달 AI '엑사원'을 두뇌로 탑재한 AI 휴먼 '틸다'와 인사하고 있다. /LG AI 토크콘서트 캡처
    ▲ 배경훈 LG AI연구원장(왼쪽)이 초거대 멀티모달 AI '엑사원'을 두뇌로 탑재한 AI 휴먼 '틸다'와 인사하고 있다. /LG AI 토크콘서트 캡처

    LG가 ‘초거대 인공지능(AI)’ 상용화 첫 단추를 꼈다. 

    LG AI연구원은 8일 설립 2주년을 맞아 온라인으로 진행한 ‘LG AI 토크콘서트’에서 자체 개발한 초거대 멀티모달 AI ‘엑사원’을 제조, 헬스케어, 디자인 등 다양한 분야에 접목했다고 밝혔다.

    초거대 AI는 대용량 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 학습한 AI 모델이다. 기존의 AI가 특정 분야 데이터를 학습해 그 분야에 맞는 결과물만 낼 수 있었다면 초거대 AI는 방대한 양의 데이터를 학습한 만큼 범용적으로 사용할 수 있다.

    하지만 초거대 AI는 실제 산업에서 사용하긴 어렵다고 평가됐다. 한 번 학습하는 데 많은 자원과 컴퓨팅 인프라를 사용해 높은 비용이 들기 때문이다. 기업의 경우 필요에 따라 제공하는 서비스의 성능 업데이트나 소프트웨어 업그레이드가 필요하다. 따라서 주기적으로 사용하는 AI 모델의 추가 학습을 해야 한다. 그런데 초거대 AI의 경우 추가 학습을 할 때마다 큰 비용이 들기 때문에 이 모델을 사용하는 기업 입장에선 손해다. 따라서 초거대 AI가 아무리 높은 성능을 낸다 해도 비즈니스에 도입하긴 사실상 불가했다.

    ◇LG 초거대 AI ‘엑사원’, 산업 활용 위한 모델로 진화

    LG AI연구원은 지난해 엑사원을 공개한 후 지난 1년간 초거대 AI를 산업현장에 사용할 수 있는 방안을 연구했다. 그 결과로 올해 기존보다 경량화된 엑사원 모델을 선보였다. 지난해 공개한 엑사원 대비 그래픽처리장치(GPU) 사용량을 63% 줄이면서도 AI 개발 속도를 좌우하는 추론 속도는 40% 더 빠른 모델이다. 성능은 글로벌 최고 성능을 의미하는 ‘SOTA(Sate-of-the-art)’를 상회한다. 한국어 성능 평가 결과 △분류 △번역 △기계독해 △요약 등 4개 영역 16개 평가 지표 중 15개에서 SOTA를 상회하는 성능을 보였다.

  • 올해 공개한 경량화된 엑사원은 한국어 성능 평가 결과 16개 성능 지표 중 15개에서 글로벌 최고 성능을 의미하는 'SOTA'를 상회했다. /LG AI 토크콘서트 캡처
    ▲ 올해 공개한 경량화된 엑사원은 한국어 성능 평가 결과 16개 성능 지표 중 15개에서 글로벌 최고 성능을 의미하는 'SOTA'를 상회했다. /LG AI 토크콘서트 캡처

    LG AI연구원은 이 기술을 토대로 LG 계열사 및 국내외 파트너사들과 협업해 실제 산업현장에 AI 기술을 적용했다. LG전자는 주 단위로 국가별, 지역별 제품 판매 수요를 예측하는 데 AI 기술을 적용하기 시작했고 LG이노텍은 카메라 렌즈와 센서의 중심을 맞추는 공정에 AI 기술을 도입, 최적화 기간을 50% 이상 단축하는 성과를 냈다. LG생활건강은 엑사원으로 일상 용품 디자인을 하고 있고 우리은행은 ‘AI 뱅커’를 개발 중이다.

    ◇텍스트와 이미지 모두 이해…’범용 AI’로 확장

    LG AI연구원은 엑사원을 산업에 적용하는 것을 넘어 대중이 범용적으로 사용할 수 있는 방향으로도 발전시키고 있다. 엑사원은 텍스트를 이미지로 그려낼 뿐 아니라 이미지를 보고 텍스트를 설명할 수 있는 ‘멀티모달’ 기능을 갖췄다. 미국 연구기관 오픈AI의 ‘달리2’나 AI 기반 이미지 생성기로 유명한 ‘미드저니’, 카카오브레인이 최근 출시한 ‘칼로’ 등이 텍스트를 이해해 이미지로 바꿀 수 있지만 이미지를 텍스트로 설명하지 못하는 것과 달리, 엑사원은 양방향 소통이 가능하다. 그만큼 범용적으로 활용도가 크다.

    대표적인 서비스가 ‘엑사원 유니버스’와 ‘엑사원 아틀리에’다. 엑사원 유니버스는 코딩에 관한 전문 지식이 없어도 쉽게 엑사원을 활용할 수 있는 서비스 플랫폼이다. AI를 개발할 때 일일이 코딩 작업을 할 필요 없어 개발자는 작업 속도를 크게 높일 수 있고 일반인은 전문 지식이 없어도 필요한 AI 모델을 만들어낼 수 있다.

    엑사원 아틀리에는 사람과 AI가 협업해 디자인을 생성하는 플랫폼이다. 엑사원만이 가진 멀티모달 특성을 살려 텍스트와 이미지 모두 데이터값으로 입력해 새로운 디자인을 만들어낼 수 있다. 이 기능은 현재 세계 3대 디자인스쿨인 ‘파슨스’, 글로벌 크리에이티브 플랫폼 기업인 ‘셔터스톡’ 등과 공동 연구하고 있다. 배경훈 LG AI연구원장은 “현재 셔터스톡과 협약해 이미지에서 텍스트, 텍스트에서 이미지를 생성하는 플랫폼을 제공하고자 하고 있다”며 “엑사원의 이미징 캡셔닝 기술은 세계 최고 수준이라는 평가를 받기도 했다”고 말했다.

  • 배경훈 LG AI연구원장은 “엑사원의 이미징 캡셔닝 기술은 세계 최고 수준이라는 평가를 받았다”고 말했다. /LG AI 토크콘서트 캡처
    ▲ 배경훈 LG AI연구원장은 “엑사원의 이미징 캡셔닝 기술은 세계 최고 수준이라는 평가를 받았다”고 말했다. /LG AI 토크콘서트 캡처

    실제로 현재 셔터스톡 홈페이지에는 ‘AI 이미지 생성기’란 카테고리가 새로 만들어져 있고 LG AI연구원과의 협업 내용도 소개돼 있다. 이곳에서 엑사원 기반의 ‘AI 이미지 생성 기능’을 이용할 수 있을 것으로 전망된다. 콘텐츠 제작자가 이미지를 올리면, AI가 자동으로 이미지에 대한 설명 텍스트를 만들어 업로드 하는 기능 등이다. 

    배 원장은 “우리는 초거대 AI를 연구하는 데 있어 크게 두 가지 전략 방향을 세우고 차별화된 서비스를 제공하고 있다”며 “하나는 모델 파라미터를 키워 다양한 분야에 적용할 수 있는 ‘범용성’과 다른 하나는 실제 산업현장에서 상용 수준으로 활용할 수 있도록 하는 ‘경량화’다”라고 말했다. 이어 “우리가 지향하는 방향은 AI가 인간과 협력해 인류의 난제를 해결하며 ‘기존에 없던 새로운 고객 가치’를 창출하는 것”이라며 “세상의 지식을 실시간으로 활용해 현실 세계의 복잡한 문제들을 해결하고 최적의 의사결정을 돕는 ‘전문가 AI’ 구현을 목표로 연구를 지속하겠다”고 강조했다.

최신뉴스