“한국의 정체성 지켜온 한글, 이젠 초거대 AI 기술이 우리 정체성 지킨다”
-
한국이 인공지능(AI) 주권을 가져왔다. 해외 생성형 AI를 사용하면서 해외기업에 중요 데이터를 넘겨주지 않아도 되고, 해외기업이 마련한 시장판에서 외화를 낭비하지 않아도 된다. 한국은 생성형 AI의 기반이 되는 초거대 AI 기술력을 갖추고 있어서다.
하정우 네이버클라우드 AI 이노베이션 센터장은 7일 부산 벡스코에서 열린 국제 AI 컨퍼런스 ‘AWC 2023 in Busan’에서 “한국은 초거대 AI에 한정해 미국, 중국과 더불어 3위권에 안에 있는 국가”라며 “네이버는 초거대 AI ‘하이퍼클로바’를 세계에서 3번째로 만들었고, 2년 6개월 가까이 초거대 AI를 만드는 법부터 학습 방법, 서비스 방법을 배우고 경험치를 쌓아 왔다”고 말했다. 이어 “네이버는 여러분이 잘 알고 있는 구글, 마이크로소프트(MS), 딥마인드, 메타보다 빠르게 초거대 AI를 만들었고, 700개 이상 스타트업이 하이퍼클로바를 이용해 응용프로그램인터페이스(API)를 만들고 있다”며 “이러한 생태계를 가진 국가는 미국, 중국, 그리고 한국밖에 없다”고 강조했다.
◇韓, 초거대 AI 보유국으로 ‘데이터 주권’ 지켰다
한국이 가진 초거대 AI 생태계는 중요하다. 현재 초거대 AI 기반 생성형 기술은 많은 인기를 누리고 있다. 하 센터장의 말에 따르면, 현재 생성형 AI는 데이터 분석가나 디자이너 업무에 변화를 이끌고 있다. 데이터 분석가는 챗GPT가 엑셀의 행과 열에 입력된 내용을 이해해 그림 등을 알아서 그려줘 업무 효율이 높아졌고, 디자이너도 달리2와 같은 이미지 생성 AI를 활용해 직접 그림을 그리는 것보다 원하는 결과가 나올 때까지 프롬프트 입력을 실험하고 있다.
일상에서도 마찬가지다. 챗GPT는 허언증처럼 없는 사실을 진짜처럼 얘기하는 ‘할루시네이션(환각) 현상’ 문제가 논란이 됐음에도 생성형 AI 활용은 계속되고 있다. 최근에는 할루시네이션 문제에 제약받지 않기 위해 외부에 있는 애플리케이션(앱)들을 연계해 외부 앱을 사용자 의도대로 작동할 수 있는 용도로도 활용 중이다. 사용자가 “휴지가 다 떨어졌네”라고 대화형 AI에 입력하면 AI는 연결된 앱을 활용해 “이 쇼핑몰에서 주문해도 될까요?”라고 물어보는 식이다. 하 센터장은 “텍스트를 통해 액션을 할 수 있는 ‘텍스트 투 액션’(Text to action)이 가능해졌다”면서 “기차를 타고 오면서 직접 세어보니 챗GPT 플러그인 서비스가 출시된 후 5~6개월 만에 918개의 앱이 플러그인 형태로 나왔다”고 했다.
문제는 현재 사용되는 생성형 AI가 모두 글로벌 기술 기반이라는 것이다. 한국 중소기업과 스타트업에서 생성형 AI 서비스를 출시하는 경우가 있지만, 이 모델들의 배경도 GPT-3.5나 GPT-4 등 해외 기술인 경우가 많다. 이처럼 초거대 AI가 글로벌 테크 시스템에 종속되면 우리는 데이터를 뺏기게 된다. 언어 생성형 AI는 처음 프리트레이닝(Pre-Training, 사전학습)을 통해 말을 잘하게 되는 모델이 만들어진다. 이후 이 모델은 슈퍼바이즈드 파인 튜닝(Supervised fine-tunung)을 통해 각 분야 전문 데이터를 학습, 전문가 AI로 거듭난다. 이후에는 사용자가 직접 사용하며 남기는 피드백을 통해 강화학습을 한다. 이 단계를 모두 거치면 지금과 같은 챗GPT가 완성된다. 그런데 여기서 남겨지는 사용자 피드백 등은 모두 데이터다. 비즈니스용으로 사용했을 경우 문서 내용이나 회의 내용 등이 모두 모델을 강화하기 위한 데이터로 쓰인다. 반도체나 이차전지와 같은 국가전략과 밀접한 산업의 내용도 마찬가지다. 이 데이터들이 모두 해외 생성형 AI 고도화에 사용되며 해외기업 손아귀에 들어가는 것이다.
하 센터장은 “해외기업이 초거대 AI에 종속된다면 데이터 주권이 사라진다”면서 “우리 기업과 개인의 중요 데이터들이 글로벌 기술 기업의 클라우드에 저장되고 그중엔 국가전략 등도 포함될 수 있다”고 지적했다.
더 큰 문제는 ‘미국 클라우드 법안’(ACT) 내용이다. 여기에는 미국이 국가 안보에 심각한 위협이 있는 경우 자국 클라우드 기업의 해외 데이터센터의 데이터도 열어볼 수 있는 내용이 명시돼있다. 아마존웹서비스(AWS), MS 애저, 구글 등의 해외 리전에서 데이터를 획득할 수 있는 법적 권한이 만들어져 있는 것이다. 하 센터장은 “이 문제 때문에 일본도 일본만의 초거대 AI를 만들기 위해 소프트뱅크 등에서 많은 투자를 하고 있고, 프랑스와 중동도 마찬가지”라고 밝혔다.
-
◇글로벌 AI 기업 네이버, 수출길 마련한다
한국의 초거대 AI는 언어 측면에서도 필요하다. 현재 해외기업들이 출시한 생성형 기술들은 모두 영어로 최적화되어 있다. 토큰이 한국어에 비효율적인 구조다. GPT-4만 봐도 영어가 기준이다 보니 한국어를 생성할 때 속도가 영어보다 턱없이 느리다. 이 모델을 활용해 기업용 챗봇 등 새로운 모델을 만드는 경우 운영 효율에서 떨어질 수밖에 없다. 말을 생성하는 속도도 느리고 토큰 당 들어가는 비용도 영어에 비해 한국어가 높아서다.
해외 모델은 영어 문화권에 편향된 AI가 만들어질 가능성도 있다. 영어 데이터만 주로 사용해 여기에 자연스럽게 녹아 있는 영어권 문화가 AI 모델에 들어갈 수 있어서다. 하 센터장은 “해외기업은 영어 데이터를 최소 90%가량 사용하는데, 이 때문에 사용자들은 자연스럽게 영어 문화권에 익숙해지고 편향된 데이터에 노출될 수밖에 없다”고 지적했다.
초거대 AI 기술이 해외에 종속되게 되면 생성형 AI를 사용하는 데 비용이나 속도 등에서 차별을 받게 되고, 영어권 문화에도 알게 모르게 종속될 수 있다는 것이다. 세계에서도 인정받는 언어 ‘한글’이 우리 정체성을 지켰듯, 이제 세계를 리딩하는 AI 기술력으로 한국의 전체성을 지켜야 한다는 뜻으로 해석된다.
-
네이버는 초거대 AI 기술력을 토대로 AI 주권 확보에 앞장서는 기업 중 하나다. 프리트레이닝 단계서부터 초거대 AI 기술력을 보유하고 있고, 구글에 밀리지 않은 검색엔진으로 데이터도 보유하고 있다. 기업 차원에서도 AI 기술에 큰 투자를 하고 있고, 우수 인재들이 모여 글로벌 권위 AI 학회에 상당한 양의 논문을 제출하며 기술력을 끌어올리고 있다. 포털사이트로만 알려진 네이버가 이제 구글, 딥마인드, 오픈AI 등과 어깨를 나란히 할 수 있는 AI 기업으로 탈바꿈했다고 해도 과언이 아니다. 실제로 구글의 AI 편향성을 전 세계에 알린 팀닛 게브루 박사(DAIR 설립자·전 구글 AI윤리팀 공동리더)는 지난해 기자와 인터뷰에서 한국 AI 기업 중 아는 곳이 있느냐는 질문에 “(다른 곳은 몰라도) 네이버는 잘 알고 있다”고 답하기도 했다.
네이버는 지난달 글로벌 AI 전쟁을 주도할 수 있는 ‘하이퍼클로바X’를 선보였다. 기업과소비자간거래(B2C), 기업간거래(B2B), 기업정부간거래(B2G) 등 모든 분야에서 생성형 AI 기술을 활용할 수 있는 한국어 특화 초거대 AI 모델이다. 또 이러한 거대 모델을 안정적이고 효율적으로 운영할 수 있는 반도체도 삼성전자와 개발 중이다. 프로그래머블(FPGA) 기반으로 완성된 시제품이 현재 나온 상태도 곧 공개될 예정이다. 하 센터장은 “하이퍼클로바는 네이버 쇼핑 등에서 마케팅 문구 작성, 상품 설명 등을 자동으로 해주는 등에 많이 사용됐다”며 “독거노인을 위한 케어콜 서비스 역시 AI가 좋은 곳에 활용된 사례”라고 소개했다.
네이버는 해당 기술을 해외로도 수출할 계획이다. 한국어 전용 초거대 AI 기술을 만든 기술력을 해외로 가져가 해당 국가와 데이터 구축부터 모델 제작, 생태계 구성 등을 함께 한다는 전략이다. 그는 “해외에서 생태계를 만드는 과정에서 현지 기업과 협업할 것이고 당연히 우리 스타트업이 진출할 기회도 있을 것”이라면서 “이것이 네이버가 가진 글로벌 전략”이라고 말했다. 이어 “초거대 AI를 보유하고 싶은 국가는 많은데 미국과 함께하긴 무섭고, 중국은 또 다른 무서움이 있는데 한국은 다르지 않을까 생각한다”면서 “경쟁력을 키워 미국, 중국과 어깨를 나란히 하겠다”고 강조했다.
AWC 부산은 인공지능 전문매체 더에이아이(THE AI)와 디지틀조선일보, 부산시, 부산정보산업진흥원이 공동 주최·주관하는 AI 컨퍼런스다. 올해는 ‘디지털 전환과 지속가능성’을 주제로 열렸다.
- 김동원 기자 theai@chosun.com