가상현실

스스로 생각하고 말하는 ‘가상인간’? 3년 내 나온다

  • 메타리즘
기사입력 2022.05.02 18:27
상호작용 가능한 가상인간 만들기 위해서는 고도화된 언어 모델 필수
  • (사진설명: 버추얼휴먼 로지/ 사진제공: 팔도)
    ▲ (사진설명: 버추얼휴먼 로지/ 사진제공: 팔도)

    빠르면 3년 내 AI 가상인간이 나올 수 있다는 전망이 나왔다.

    지난 27일 카카오브레인이 카카오톡 오픈채팅방 보이스룸에서 '디지털 휴먼과 AI 가상 캐릭터'를 주제로 실시간 토크세션을 진행했다. 발표자로는 김일두 카카오브레인 대표와 박병은 부사장 등이 참석했다.

    이날 토크세션에서 김대표는 "대화 상대에 따라 직접 생각하고 대답하는 수준의 AI 모델이 빠르면 3~5년 내 만들어질 것으로 보인다. 수학 문제를 읽고, 이를 코딩으로 변환해 문제를 풀어내는 AI는 이미 나와 있다. 여기서 조금만 더 발전하면 금방 도달할 수 있다"라고 전했다.

  • (사진설명: 버추얼휴먼 수아/ 사진제공: SK텔레콤)
    ▲ (사진설명: 버추얼휴먼 수아/ 사진제공: SK텔레콤)

    현재 시장 대부분을 차지하고 있는 AI는 ‘시나리오에서 벗어난 상황에 놓이거나, 복잡한 사고를 해야 하는 경우 AI는 제대로 대응할 수 없다’는 한계가 있다. 현재 기술로는 AI 콜센터 직원, 은행원 등 정해진 시나리오대로 말하는 AI만 가능한 상황이다.

    상호작용이 가능한 가상인간을 만들기 위해서는 고도화된 언어 모델이 필수다. 대규모 데이터를 학습시키는 과정이 필요한데, 이 과정에서 막대한 자본과 시간이 투입된다. 하지만 지름길은 있다는 게 카카오브레인 측 의견이다. 카카오브레인은 어린아이가 언어를 배우는 과정에 주목했다.

    김대표는 "24개월 된 아이가 있는데 본인이 말하는 게 무슨 뜻인지 모르면서, 그다음에 말할 단어를 맞히는 식으로 언어를 배우더라. 예를 들면 '엄마 옷은 핑크'라고 알려주면 핑크가 무슨 의미인지 모르지만 옷과 핑크를 연결한다. 또 '자동차는 블루'라고 알려주면 블루가 무슨 뜻인지 몰라도 자동차 하면 곧바로 블루가 입 밖으로 튀어나오는 식"이라고 실제 경험을 말했다. 쉽게 말해 다음에 올 단어를 잘 만들어내는 '넥스트 토크 제너레이터’에 단계에 불과하다고 설명했다.

    하지만 아이가 색깔의 개념을 알게 되면 실제 파란색인 물체를 보고 '블루'라고 말할 수 있다. 김 대표는 "어느 순간 아이가 '블루'가 뭔지 알기 시작하더라. 이후부터는 파란색을 봤을 때 블루라는 단어를 말하기 시작했다. 이러한 경험을 해보니 뇌과학이나 어떤 인텔리전스 성장을 잘 찾아보면 (AI 언어 모델 학습과) 접점이 있을 수도 있겠다고 생각했다"라고 첨언했다.

  • (사진설명: 버추얼휴먼 한유아/ 사진제공: 한유아 인스타그램)
    ▲ (사진설명: 버추얼휴먼 한유아/ 사진제공: 한유아 인스타그램)

    박부사장도 의견을 더했다. 그는 "둘째가 첫째 말을 따라 할 때 되게 또 비슷한 현상이 있다"며 "본인은 무슨 말인지 모르는데 누나가 어떤 얘기를 하니까 따라 한다. 그 말을 이해하지 못하더라도 말소리를 따라 하는 거다. 소리를 따라 하다가 비슷한 단어를 책에서 보면 붙여보고 (맞는지) 눈치를 본다. 이 말이 맞았나 틀렸나. 어떻게 보면 머신러닝의 학습과정과 되게 비슷하다고 본다"라고 전했다.

    인간과 소통이 어렵더라도 가상인간 자체로 갖는 시장 가치가 크다는 의견도 있었다.

    김대표는 "수아 등 가상인간이 이미 마케팅적인 부분에서 많이 활동하고 있다. 전형적인 마케팅 사례다. 지능적인 측면도 중요하지만 가상 인간 외형만으로도 할 수 있는 영역이 여전히 많을 것 같다. 마케팅 분야가 아니더라도 말"이라고 전했다.

  • (사진설명: 버추얼휴먼 질주/ 사진제공: 비브스튜디오스, 노블레스)
    ▲ (사진설명: 버추얼휴먼 질주/ 사진제공: 비브스튜디오스, 노블레스)

    한편 최근 카카오브레인은 민달리의 업그레이드 버전인 이미지 생성 모델(RQ-Transformer)을 오픈소스 커뮤니티 깃허브에 공개했다. 39억 개의 매개변수로 구성된 이 모델은 '텍스트-투-이미지' AI 모델로 3,000만 쌍의 텍스트와 이미지를 학습했다. 계산 비용을 줄이고 이미지 생성 속도를 높인 동시에 이미지의 품질을 크게 향상시킨 것이 특징으로, 카카오브레인은 이 모델이 공공 목적을 위해 활용될 것이라고 기대하고 있다.

  • 메타리즘

최신뉴스