“한국, AI 연구 분야에서 최초 사례 다수 발표… ‘퍼스트 무버’ 자격 충분”
“韓 AI 기업들은 전쟁터에서 전투 중… 정부와 사회의 관심과 지원 필요”
-
지난 2월 서울 성수동에서는 ‘성수 AI 데이’란 행사가 열렸다. AI 스타트업 띵스플로우가 주최한 이 행사에는 하정우 네이버클라우드 AI 이노베이션 센터장의 강연이 예정돼 있었다. 네이버의 AI 연구를 주도하고 있을 뿐 아니라 대통령직속 디지털플랫폼정부위원회 AI-데이터 분과위원장, 서울대-네이버 초대규모 AI 연구센터 공동센터장, KAIST-네이버 초창의적 AI 연구센터 공동센터장을 역임하고 있는 인물이다. 최근 챗GPT와 바드 등 초거대 AI 기반 생성형 기술 등장으로 AI 기술에 관한 관심이 커졌는데, 한국에서 이 기술을 리딩할 수 있는 인물로 꼽힌다.
하 센터장의 강연 소식에 이 행사에 신청했다. 당시 생성형 AI가 크게 주목받고 있던 터라 어떤 발표일지 궁금했다. 하지만 행사 며칠 전에 하 센터장의 방문이 어렵다는 소식을 알게 됐다. AI 관련 다른 일정이 겹쳐 부득이하게 행사 참석이 어렵다는 내용이었다. 아쉽지만 다른 유익한 강연도 많아 행사장에 향했다. 그리고 강연이 어느 정도 끝나고 패널토론 시간이 됐을 때 그가 나타났다. 강연은 못 했지만, 패널토론자로라도 출연해 AI 연구 방향을 공유하기 위해서다. 행사장 참관객 사이에서는 웅성거림이 있었고 하 센터장은 숨을 헐떡이면서도 참관객들의 질문에 하나씩 답을 했다.
사실 이 행사는 네이버 주최 행사도 아니었고, 정부 관련 행사도 아니었다. 네이버와 크게 상관없는 AI 스타트업 행사였다. 그가 오지 않았어도 사전에 동의가 된 사항이어서 행사장 내에서도 불평이 없었다. 하지만 그는 강원도 춘천에서의 일정을 마치고 서울 성수까지 왔다. 이유는 하나다. 행사장엔 AI 관련 연구자들과 학생들이 많아서다. 이들에게 자신이 알고 있는 AI 지식을 공유해 한국 AI 발전에 미력하게나마 도움이 되고 싶었던 것이다.
그런 그가 책을 썼다. 제목은 ‘AI 전쟁’이다. 소속된 기업에 상관없이 AI 기술을 공유하며 평화롭게 기술 발전을 리딩하던 그였기에 전쟁이란 말은 어색하게 느껴졌다. 책에서는 우리의 의지와 상관없이 시작된 글로벌 AI 전쟁에서 한국이 어떤 전략을 취해야 하는지 상세한 내용이 질의응답 형식으로 적혀 있다. 기술적인 내용뿐 아니라 정책, 방향, 윤리 등 다양한 내용이 다뤄져 있다. 질문은 국내 1세대 AI 연구자이자 ‘신뢰할 수 있는 인공지능’ 저자인 한상기 테크프론티어 대표가 했고, 답은 하정우 센터장이 했다. 수많은 AI 서적 중에 이 책은 진짜 AI 전문가들의 내용이 담긴 책인 것이다.
그렇다면 하정우 센터장은 왜 책을 집필하게 됐을까. 또 AI 전쟁이란 타이틀의 책을 통해 대중에게 알리고 싶었던 내용은 무엇이었을까. 지난 8일 경기도 성남에 있는 네이버 1784 사옥에서 그를 만나 자세한 얘기를 들어봤다.
-
- 한상기 대표가 책을 쓸 때 하정우 센터장을 추천했다고 알고 있다. 그 이유는 무엇일까.
“한상기 테크프론티어 대표가 한 출판사에서 AI 관련된 책을 써야 하는 데 관련 전문가가 필요하다는 요청을 받았다고 한다. 여기서 요청받은 전문가는 AI 기술에 관한 연구를 하면서도 서비스와 프로덕트 산업 쪽에도 이해가 있고, 한국 AI 생태계 발전을 위해 정부와도 얘기를 많이 하는 사람이었다. 그래서 저를 추천해주신 것 같다. 참 감사한 일이다.”
- AI 전쟁이라는 제목을 보고 놀랐다. 하정우 센터장과 전쟁은 이미지가 맞지 않은 느낌이었다. 한국 AI 생태계 발전을 위해 평화롭게 협업을 논하는 이미지가 더 강했던 탓이다.
“제목에 대해선 정말 고민이 많았다. 공동 저자인 한상기 대표를 포함해 출판사에서도 많은 고민이 있었다. 임팩트 있는 제목이 필요하다는데 공통으로 의견이 모아졌다. 그래서 나온 제목이 AI 전쟁이다. 사실 지금은 전쟁 시국이다. AI 기술 주권 확보에 있어서 전 세계적으로 총성 없는 전쟁이 이뤄지고 있다. 그래서 명확하게 AI 전쟁이라고 표현하면 좋을 것 같았다. 당연히 평화를 좋아한다. 평화를 추구해야 하지만 지금 현시점은 전시 상황이다. 우리의 의지와 상관없이 이미 전쟁이 벌어졌다. 이 전쟁통에서 한국은 어떤 걸 준비해야 하고 어떻게 움직여야 할까를 고민했고 그 내용을 책에 담았다.”
- 기술 확보를 위한 총성 없는 전쟁이 발생하고 있다. AI 전시 상황에서 한국은 어느 위치에 있나. 퍼스트 무버인가 패스트 팔로어인가 혹은 그 아래인가.
“기술적으론 아무래도 미국 실리콘밸리 쪽이 앞서 있는 게 사실이다. 중국도 잘하고 있다. 특히 중국은 체제 유지와 관련된 비전 분야에서 높은 기술력을 갖고 있다. 안면 인식이나 물체 인식 등의 기술을 상당히 잘한다. 퍼스트 무버와 패스트 팔로워 측면에서 나누자면 한국은 패스트 팔로어에 가까운 것은 사실이다. 하지만 일부 분야에서는 퍼스트 무버 역할도 하고 있다. 왜냐하면 한국에서 세계 최초로 나온 모델도 꽤 있기 때문이다. 물론 구글이 발표한 ‘트랜스포머’처럼 전 세계 판을 완전히 갈아엎는 논문들은 미국에서밖에 나오지 않고 있는 것은 맞다. 하지만 한국에서도 상당히 많은 양의 AI 논문이 나오고 있고, 이중 처음으로 소개된 연구 내용도 있다. 한국도 충분히 퍼스트 무버의 자격이 있다고 생각한다.”
- 그렇다면 현재 전쟁 상황 속에서 한국은 어떤 경쟁력을 확보해야 할까.
“AI는 기술 연구에서 끝나는 분야가 아니다. 기반 기술이 발전해야 하고 이를 토대로 다양한 산업 분야에 적용해야 한다. 연구된 기술이 실제 비즈니스 모델로 이어지고 새로운 가치를 만들어야 한다. 이러한 관점에서 보면 아직 그 누구도 답을 찾지 못했다. 샘 알트만 오픈AI 최고경영자(CEO)가 방한했을 때도 여러 많은 이야기를 했지만, 그중 하나가 아직 ‘킬러 애플리케이션(앱)’을 찾지 못했다는 것이었다. 구글도 자사 검색 서비스에 대규모언어모델(LLM)인 ‘팜2’(PaLM2)를 적용한다고 했지만, 무언가 혁신 서비스를 만든 것은 아니다. 실험 중인 단계에만 있다. 마이크로소프트(MS)도 검색 서비스 ‘빙’(Bing)에 AI를 접목했지만 생각보다 트래픽이 많이 늘어나진 않고 있고, 구글의 아성을 넘지 못하고 있다. 그러면 과연 누가 이 강력한 초거대 생성 AI를 활용해 혁신을 만들어낼 수 있을까? 실제 사용자, 비즈니스 관점에서 의미 있는 결과를 성공적으로 만들어낼 수 있을까? 한국의 AI 경쟁력은 여기서 찾을 수 있다. 우리는 상당히 다양한 산업군을 갖고 있다. 제조를 포함해 의료, 국방, 법률, 교육 등 다양한 산업군이 있지 않나. 네이버만 봐도 상당히 다양한 서비스를 갖고 있다. 여기서 어떻게 가치를 잘 만들어내느냐가 진짜 성공을 결정하는 요소가 될 것이다.”
- AI는 투자비가 상당하기 때문에 비즈니스 경쟁력 확보가 정말 중요할 것 같다.
“맞는 말이다. 컴퓨팅 구축 등만 해도 큰 비용이 투자되기 때문에 지속 가능성을 만들어야 한다. 지금까지 AI 기업들은 기대 수익은 고려하지 않고 기술 경쟁에만 몰두해왔었다. 기술 확보가 먼저였기 때문이다. 하지만 이제는 비즈니스 성과가 뒷받침돼야 할 때가 됐다. 투자가 계속되기 위해선 성과가 뒤따라야 하기 때문이다. 이러한 관점에서 우리는 퍼스트 무버가 될 수 있다. 대표적인 사례가 ‘클로바 케어콜’(초거대 AI 기술이 적용된 전화 돌봄 서비스, 일상적인 주제의 대화를 통해 안부와 건강을 확인한다) 서비스인 것 같다. 사회 문제를 해결하는데 초거대 AI라는 기술을 통해서 기존의 챗봇 시스템으로는 상상도 하지 못했던 걸 가능하게 만들었지 않나. 이러한 사례들을 사회 문제뿐 아니라 비즈니스 영역에서도 만들 수 있고 공공 영역에서도 만들 수 있을 것이다. 이러한 사례를 누가 먼저 잘 만들어내느냐가 국가 AI 경쟁력을 한 단계 올릴 수 있는 기회가 될 수 있다.”
- 네이버의 초거대 AI ‘하이퍼클로바X’가 이달 정식 공개된다. 그렇다면 네이버가 생각하는 ‘킬러 애플리케이션’은 무엇인가.
“기본적으로 네이버 내부에 있는 홈쇼핑, 블록, 예약 등 다양한 서비스와 콘텐츠 플랫폼에 적용할 예정이다. 우리 플랫폼 위에 있는 많은 구성원의 역량을 향상하는 데 도움이 되는 도구가 될 수 있다. 또 네이버 쇼핑을 이용하는 50만 중소상공인분들이 마케팅 요소나 이미지 등을 편하면서 높은 퀄리티로 제작할 수 있는 도구로도 사용 가능하다. 블로그에 글을 쓸 때도 마찬가지다. 글쓰기에 도움을 줄 수 있고, 네이버 웹 브러우저 ‘웨일’을 통해 학생들을 교육하는 시스템과 연계해서 생성 AI 기반 교육 콘텐츠를 서비스하는 것도 가능하다. 긴 호흡이 필요하겠지만 경우에 따라선 디지털 교과서와 연결되는 서비스도 만들어낼 수 있다. 이처럼 네이버가 자체적으로 보유한 생태계에서의 활용이 가능하다. 하지만 이는 어쩌면 당연한 내용이다. 우리는 이 외에 네이버가 커버하고 있지 않은 산업군에서도 서비스를 창출하고자 하고 있다. 기업간 파트너십과 플러그인 기능을 통해 가능할 것이다. 네이버가 커버하고 있지 않은 도메인 영역에서 플러그인 스타일로 서비스 앞단에서 강력한 대화형 인터페이스들을 사용자에게 제공할 수 있다. 최근에 모빌리티 ‘쏘카’와 협업을 맺은 것이 대표 사례다. 유통 분야에서는 CJ와 하는 사업이 있고 법률 분야에서도 여러 협업 제의가 오고 있다.”
- 네이버가 초거대 AI 기반 기업간거래(B2B)에 속도를 낸다고 이해해도 되나.
“네이버는 그동안 클라우드 기반으로 기업과소비자간거래(B2C) 사업에 무게를 뒀었다. 그렇다고 B2B를 생각하지 않은 것은 아니다. B2B도 중요한 비즈니스 포트폴리오가 될 것으로 보고 있다. 기업들은 LLM 기반 서비스를 만드는 것을 원할 텐데, 이를 직접 만드는 것은 쉽지 않기 때문이다. AI가 분명히 업무 생산성을 크게 높일 수 있는 도구이긴 하지만, 데이터 보안 이슈나 할루시네이션(환각) 현상 등 여러 문제 탓에 AI를 도입하지 못하는 기업들이 있다. 이러한 조건을 만족시키는 형태로 우리가 솔루션을 제공하려 한다.”
- 기업이 LLM을 사용하기 어려운 이유 중 하나가 할루시네이션 현상이다. 이달 출시할 하이퍼클로바X는 괜찮을까.
“네이버와 파트너십을 체결한 기업에 파이프라인(데이터 처리 단계의 출력이 다음 단계의 입력으로 이어지는 형태로 연결된 구조)을 통째로 제공하려 한다. 파트너 기업이 보유하고 있는 많은 양의 문서 데이터를 추가 학습할 수 있는 파이프라인을 제공하는 것이다. 그렇게 되면 그 기업이 보유한 전문 데이터를 LLM이 학습해 할루시네이션 현상을 줄일 수 있다. 지금 오픈AI의 GPT-4도 전문 지식을 프롬프트로 입력하면 할루시네이션 현상을 남발한다. 해당 분야 데이터들을 많이 학습하지 못한 영향이다. 그 데이터들은 해당 기업들이 갖고 있다. 이 전문 지식을 보유하고 있는 기업에 추가 학습할 수 있는 파이프라인을 통째로 제공하면 할루시네이션 현상을 줄일 수 있고, 그 기업은 생산성을 혁신할 수 있는 도구로써 AI를 활용할 수 있다. 이것이 우리가 중요하게 생각하는 비즈니스의 한 꼭지다.”
- 지난달 LG AI연구원이 ‘엑사원 2.0’을 공개하며 발표한 전략과 비슷한 것 같다.
“LG도 LLM 발전을 위해 노력하고 잘하고 있는 회사다. LG와의 차별점은 같은 B2B더라도 LG는 그 출발점이 내부 계열사 중심이라는 점이다. 그래서 LG는 화학, 생명공학 같은 분야 전문 데이터가 많고 여기서 전문성을 발휘할 수 있다. 엑사원을 상위 1% 전문가라고 할 수 있는 이유도 여기에 있다. 우리는 더 넓은 비즈니스 스펙트럼에서 데이터를 학습했다. 일반적인 문서 데이터양이 더 많다. 이 때문에 일반적인 글쓰기 능력은 더 뛰어날 수 있다. 거기에 더 다양한 인더스트리 도메인 영역에서 서비스할 수 있다. 네이버는 계열사라고 해도 제조나 화학 등은 없다. 반대로 말하면 이러한 영역에서 더 많은 기업과 협업을 맺을 수 있다. 금융이나 법률이나 의료 등 어느 도메인들과도 협업할 수 있는 장점이 있다. 전자나 화학 등도 마찬가지다. LG는 이 분야 계열사들이 있는 만큼 그 선택지가 자유로울 수 없지만 우린 상대적으로 더 자유롭다. 그렇다고 절대 LG AI연구원의 AI가 못하다는 것은 아니다. 오해가 없길 바란다. 서로 할 수 있는 분야에서 더 잘하면 된다. 그것이 한국이 AI 강국이 될 수 있는 길이고, 글로벌 전쟁에서 이길 수 있는 전략이다.”
- 그런데 하이퍼클로바는 한국어 중심 초거대 AI로 알려져 있다. 글로벌 전략 관점에서 봤을 때 수출도 가능할까.
“2021년 하이퍼클로바가 처음 나왔을 때는 한국어 데이터가 97%였다. 지금은 아니다. 한국어와 영어가 반반이다. 중요한 건 현지어다. 우리가 하이퍼클로바를 수출하려면 한국어, 영어뿐 아니라 현지어도 잘해야 한다. 우리가 수출하고자 하는 건 한국어와 영어, 현지어를 함께 프리 트레이닝(Pre-Training, 사전학습)한 모델이고, 이 모델을 기반으로 현지 애플리케이션 혹은 언어 모델이다. 그래서 중요한 것이 프리 트레이닝 능력이다. 이 능력이 없으면 현지어 데이터가 있더라도 LLM을 만들지 못한다. 반대로 이 능력이 있으면 한국어, 영어, 현지어를 갖고 프리 트레이닝을 잘한 모델을 가져가 그 시장에 타겟팅한 서비스를 출시하면 새로운 생태계를 만들 수 있다. 다른 기업들은 보통 프리 트레이닝 없이 구글 클라우드에 맡겨 초거대 AI를 만드는 경우가 많다. 기술적으로 어렵기 때문에 구글 클라우드 기술을 사용하는 것이다. 네이버는 다르다. 우리가 슈퍼컴퓨터를 자체적으로 구축했던 이유도 이 프리 트레이닝을 위해서다. AI 기업은 초거대 AI를 가진 기업과 가지지 않은 기업으로 나뉜다고 종종 얘기하는데, 바로 잡자면 ‘프롬 스크래치(From Scratch, 맨 처음부터)로 프로 트레이닝을 할 수 있는 기업과 아닌 기업으로 나뉜다가 정확한 표현이다. 저번에 앤드류 응 스탠퍼드대 교수가 방한했을 때 우리의 기술을 설명을 듣고 프롬 스크래치에서 프리 트레이닝 한 것이냐고 물었고, 그렇다고 답했더니 놀랬다. 이걸 할 수 있는 회사와 학교는 전 세계적으로도 드물다고 했다. 한국에서도 이러한 역량이 있다고 외부에 공개한 기업은 네이버밖에 없다.”
-
- AI 전쟁 책을 보면 한상기 대표가 질문하고 하정우 센터장이 답하는 형태로 되어 있다. 한상기 대표의 질문 중에 가장 어려웠던 점은 무엇인가.
“한상기 대표는 신뢰할 수 있는 AI에 관심이 많은 분이다. AI 기술을 사용하는 데 있어 신뢰할 수 있는지, 안전한지에 대해 고민하시고 범용인공지능(AGI)에 대해 비관적인 분이다. 이 때문에 딥러닝이나 LLM의 한계에 대해 명확히 짚을 수 있는 전문가라고 볼 수 있다. 이러한 고민을 담은 ‘신뢰할 수 있는 인공지능’ 책도 상당한 인기를 끌었다. LLM을 연구하고 여기서 가능성을 찾으려는 나와는 상반될 수 있다. 다행인 것은 최근 GPT-4 등 새로운 논문들에 대해 보면서 생각이 많이 바뀌셨다는 점이다. AI가 논리적 추론까지 보면서 ‘내 생에 안 될 줄 알았던 것들이 된다’는 얘기하신다. 사실 AI 기술의 한계 극복에 대해 많이 전도가 되신 상황이고 저도 많이 노력했다.(웃음) 이번 책 집필에서 논의했던 점 중 하나는 기술 규제와 진흥에 대한 부분이었다. AI 발전을 위해선 인간이 규제와 진흥 중간의 밸런스를 맞춰야 하는데, 이를 어떻게 맞춰야 한다는 점이었다. 저는 규제가 필요하긴 한데 이 규제라는 게 악의적인 활용과 같은 부분에 더 집중해야 한다는 주의였고, 한상기 대표는 이보다는 더 근본적으로 신뢰할 수 있는 전체 시스템 관점에 규제를 강하게 할 필요가 있다는 쪽이었다. 이 차이는 있었지만, 이 책을 쓰면서 한상기 대표는 본인 의견에 무게를 두지 않고 제 의견에 중점을 두었다. 질문을 하는 데 주로 집중했고, 제 대답이 설령 자신의 생각과 맞지 않더라도 책에는 제 생각을 중점으로 써주었다. 현시점에서 기술 발전과 산업 적용 등에 있어 제가 필드에 더 붙어 있으니 이쪽 정보를 더 공유하고 싶은 생각 때문이었을 것이다. 어차피 맞고 틀린 것을 검증하는 것은 불가능하니 필드에 있는 제 생각을 더 공유하는 게 중요하다고 생각하신 것 같다. 그래서 의견이 맞지 않더라도 책에는 제 생각이 주로 담겨있게 됐다. 감사하다.”
- 책에서 AI가 워낙 많은 양의 전략을 사용하기 때문에 환경에 부정적 영향을 줄 수 있단 내용이 있다. 이 때문에 네이버에서는 삼성전자와 협력해 AI 반도체를 개발하고 있다고 했다. 왜 삼성전자인가? AI 반도체 분야에선 이미 성과를 낸 해외 기업들도 많지 않은가.
“여러 이유가 있지만 첫 번째는 AI 주권과 직접 연관된 부분이라고 보면 된다. 네이버는 LLM에서의 주권을 강조하고 있는데, LLM은 주로 그래픽처리장치(GPU)로 가동된다. LLM을 적용해 서비스하는 산업은 앞으로 상당히 커질 것인데 여기에 최적화되는 반도체를 한국 기술로 함께 만들 수 있으면 좋겠다는 생각이 들었다. LLM을 사용할 때 사용 행태나 서비스 형상 등을 고려하면 실제 연산에서 병목현상은 보통 메모리에서 생긴다. 따라서 메모리 관점에서의 기술이 중요하다. 여기서 네이버가 최적화된 모델을 만들고 서비스를 제작할 때 얻은 경험을 반도체 설계 업체에 공유하면 좋은 메모리 기술이 나올 것이고, 그 분야 최적의 업체가 바로 삼성전자였다. 반대로 삼성전자는 반도체 설계 역량도 갖추고 있고 칩을 생산하는 파운드리도 보유하고 있지만, LLM에 대한 경험이 없었다. LLM이 서비스에 적용됐을 때 트래픽이 어떻게 발생하는지, 연산에서 병목현상에 어디서 생기는지에 대한 정보는 없었다. 그래서 우리와 삼성전자의 역량을 더하면 괜찮은 모델이 나올 수 있다는 생각이 들었다. 앞으로 이 시장 수요가 크게 늘어날 가능성이 있는데, 한국 기업끼리 제대로 된 반도체를 만들어보자는 생각이 맞았고, 함께 하게 됐다.”
- 전력 사용 문제를 AI 반도체 외에 데이터로 풀어야 한다는 의견도 많다. 현재 LLM은 워낙 많은 양의 데이터를 학습하는데 여기엔 중복 데이터 등이 많아서다.
“결국은 프리 트레이닝이 중요한 부분이다. 최근 나온 여러 연구를 보면 모델 크기와 학습하는 프리 트레이닝 데이터의 크기가 어느 정도 비율이 있는 것 같다. 이게 요리의 레시피와 같아서 데이터가 부족하면 음식이 맛이 없게 되고 반대로 모델이 너무 작으면 데이터가 아무리 많아도 담을 수 있는 그릇에 한계가 있다. 이 때문에 프리 트레이닝 데이터를 얼마만큼 최적화해서 모델을 잘 구축할 것이냐가 중요하다. 우리도 이 부분에 대해 상당히 많이 신경을 쓰고 있다. 에너지 문제를 따라서 중복 데이터가 많으면 성분 자체가 나빠진다. AI는 어떤 문서에서, 어떤 소스에서 나온 데이터에 따라 성능이 달라지기도 한다. 이와 관련된 논문을 우리가 내기도 했다. 예를 들면은 특정 소스의 데이터가 다른 소스 데이터보다 더 낫다면 같은 양의 데이터를 사용할 때 그 소스를 사용하는 실험 등을 계속해오고 있다. AI가 워낙 비싼 장비를 사용하고 오래 걸리기 때문에 그런 연구를 계속해오고 있다고 보면 된다. 프리 트레이닝 외에 파인튜닝(기존 학습돼있는 모델을 기반으로 새로운 목적(데이터)에 맞게 모델을 변형) 과정도 있다. 우리가 AI를 활용하려면 파인튜닝을 해야 하지 않나. 이 파인튜닝을 할 때도 어떻게 하면 데이터를 덜 사용할 수 있을지에 대한 연구도 많이 하고 있다. 이런 부분이 결국 에너지와 연결되는 부분이다. 나머지는 AI 반도체를 통해 전력 효율을 극대화하는 노력도 해야 한다. 이 부분들은 크게 AI 발전을 위한 지속 가능성 관점에서 무척 중요한 부분이다. 운영 비용과도 연관되기 때문이다.”
- 기업들이 LLM을 활용할 때 또 다른 장애물은 데이터 보안이다. 책에 국방 관련 얘기가 있던데, 국방 데이터는 정말 보안이 철저해야 하는 데이터다. 미국은 육해공군과 해병대가 클라우드 기반으로 데이터를 공유하고 사용하는데, 한국에서도 가능할까. 네이버 클라우드에를 사용하면 안전할지도 궁금하다.
“이미 미국은 제다이(JEDI) 프로젝트를 통해 합동 방어 인프라스트럭처를 클라우드 형태로 구축하고 있고, 그다음 버전도 나온 상태로 알고 있다. 마이크로소프트(MS)와 구글, 아마존의 클라우드를 사용해 데이터를 가공하고 학습하고 있다. 하나의 클라우드를 사용하는 경우 문제 발생 시 대처가 어려우니 다른 클라우드들을 병행해서 사용하고 있다. 국방 문제는 정부 정책 관점에서 봐야 한다. 망 분리 관점에서 볼 때 한국은 지금 ‘물리적 망 분리’로만 접근하고 있다. (망 분리는 크게 ‘물리적 망 분리’와 ‘논리적 망 분리’로 나뉘는데, 물리 망 분리는 PC나 네트워크 카드 등 하드웨어를 내부용과 외부용으로 나눈 방식이고, 논리 망 분리는 VM웨어 등 가상머신을 사용하는 망 분리 방식을 뜻한다) 그런데 아무것도 신뢰하지 않는다는 것을 전제로 한 보안 모델인 ‘제로 트러스트’ 관점에서 보면 물리 망 분리에서도 사실 제대로 된 트러스트를 할 수 없다는 의견이 강하다. 사실상 기능적으로 보면 논리적인 망 분리로도 물리 망 분리를 대안할 수 있을 정도로 기술이 발전했으니 논리 망 분리를 검토하는 단계까지 온 상황이다. 이 부분에 대한 의사결정 권한을 갖은 곳은 국정원과 행안부다. 이제야 출발한 상태다. 정부에서 과연 얼마만큼 의지를 갖고 클라우드 전환을 할 것인지가 문제지, 네이버 클라우드를 사용할 것인지가 문제가 아니다. 클라우드 기업들은 네이버뿐 아니라 KT, NHN 등 얼마든지 잘할 수 있다는 입장이다. 논리적 망 분리도 물리적 망 분리와 크게 차별되지 않을 정도로 기술이 발전했다고 들었다. 물리적 망 분리가 100%의 안전을 보장하는 것도 아니고 논리적 망 분리가 물리적 망 분리보다 덜 안전한 수준도 아니기 때문에 이제 제대로 검토할 때가 되지 않았나 생각한다.”
- 의료 쪽 도메인에서도 궁금한 부분이 있다. 사실 의료 데이터에 노이즈 현상이 심해 LLM 적용이 쉽지 않다고 들었다.
“네이버에는 헬스케어 팀이 있다. 사내 병원도 있고 내부적으로 AI 연구 관점에서 별도 팀도 있다. 2~3년 전에는 헬스케어 분야 연구를 직접 했었다. 관련 연구를 하면서 느낀 점은 의료 분야 AI 기술이 발전하려면 데이터에 대해 병원과 AI 기업 간 합의점이 필요하다는 것이었다. 병원과 AI 기업 간 데이터를 보는 시각이 다르다. 병원에서는 의료 데이터가 정말 중요하고 값어치 있게 생각한다. 그래서 이 데이터들을 공유하게 되면 비싼 값을 받아야 한다고 보는 것 같다. AI 기업 입장은 다르다. 의료 데이터는 정말 노이즈 현상이 심하다. 이 데이터를 가지고 정말 가치 있는 AI 모델을 만들 수 있을 것인가에 대해 의구심이 있다. 다이아몬드 원석과 비슷하다. 열심히 가공해야 좋아지는 데 가공에 성공할 가능성은 불확실하다. 성공할지 아닐지 모르는 상황에서 데이터를 가진 쪽은 높게 평가하고 이를 활용하려는 쪽은 그만큼 가치를 매기지 못하니 거래가 잘되지 않는 경향이 있다. 게다가 의료 데이터는 민감 데이터다 보니 그러한 현상이 더 심하다. 앞으로 AI 기술은 틀림없이 발전할 것이다. 노이즈가 많은 데이터를 분석하는 기법도 나올 것이고, 분석하다 보면 데이터를 어떻게 구축하면 좋은지 등에 대한 피드백도 생길 것이다. 이렇게 되면 의료 AI를 성장시킬 수 있는 하나의 시스템이 발전할 수 있다. 따라서 원활하게 데이터를 공유할 수 있는 합의점이 생기길 바란다. 이 때문에 네이버에선 별도 사내 병원을 둔 것이다. 데이터 공유는 결국 시간의 문제라고 본다. 최근 병원에서 데이터를 보는 시각이 많이 달라졌고, 의료 AI 모델이 중요하다고 생각하는 의료진도 많아졌다. 의료 AI도 긍정적인 방향으로 가고 있다.”
- AI 확산에 있어 큰 문제 중 하나는 기술로 인한 양극화다. AI를 쉽게 사용할 수 있는 세대가 있는 반면, 어려워하는 세대도 분명히 있다.
“디지털 디바이드(Digital Divide) 문제다. 우선 회사 차원에선 커넥트 재단을 운영하며 이 문제를 줄이기 위해 노력하고 있다. 비영리 사회공헌 재단인데 여기에서 AI 리터러시와 관련된 교육을 많이 하고 있다. 아직 어르신 분들과 관련된 프로그램들이 직접 있진 않은데, 이와 관련해 정부에 AI 리터러시 얘기를 많이 드리고 있다. 중앙부처가 됐든 자지체가 됐든 정부엔 평생교육원과 같은 곳이 있다. 최근 AI 공부할 수 있는 도구도 많아졌고 사용도 편리하기 때문에 이런 곳에서 어르신 분들을 위한 교육 과정을 만들어서 하자고 건의하고 있다. 이와 별도로 회사 차원에서 기술을 서비스할 때 사용자 경험(UX)을 많이 고려하고 있다. 클로바 케어콜을 스피커가 아닌 전화기로 사용할 수 있게 한 것이 대표적인 사례다. 어르신 분들은 스피커 사용 자체가 불편하실 수 있다. 익숙한 도구가 아니기도 하고 와이파이도 연결해야 한다. 여기엔 또 별도의 인터넷 비용 등이 든다. 기초생활수급자분들은 이 비용조차 아까우신 분들이다. 하지만 전화기는 편하시다. 사용하시는 것부터 비용 부담이 적다. 그래서 우리는 다른 회사들과 달리 케어콜 서비스를 전화기로 사용하실 수 있도록 상용화했다. 이처럼 우리는 AI 서비스에 있어서 UX 부분을 많이 고려하고 있다. 디지털 디바이드 문제는 국가 단위에서 많은 노력을 했으면 좋겠고, 국가에서 직접 콘텐츠를 만들기 어려우니 이 부분은 기업에서도 함께 하는 방향으로 갔으면 한다.”
- AI 발전을 저해하는 요소도 있다. 사설 인증기관이나 자격증 등이 그렇다.
“민간에서 그러는 것은 어쩔 수 없다. 장사를 해야 하는데 그걸 하지 말라고 할 순 없지 않은가. 이 자격증이나 인증은 이상하다고 생각하면 기업에서 반영하지 않으면 그만이다. 이보다 중요한 문제는 정부가 나서서 자격증을 만들고 하는 행위가 있어선 안 된다는 것이다. 인증도 애매하다. 이번에 한국정보통신기술협회(TTA)에서 하고 있는 AI 평가는 필요하다. 그런데 이 평가가 인증이 되고 규제가 되면 안 된다. 평가는 당연히 해야 한다. 그 기술이 어느 수준인지 알아야 하지 않은가. 자율주행차도 레벨 1, 2, 3 등으로 구분해야 하지 않은가. AI도 그 수준을 평가해 ‘이 기술은 이러한 용도로 써야 한다’는 방향이 나와야 한다. 그런데 ‘얘는 수준이 낮으니 좋지 않아, 쓰면 안 돼’로 가면 안 된다. 지금까지 이렇게 흘러간 전례들이 있어서 많은 분이 걱정하고 계시다. 좋은 취지에도 불구하고 오해가 쌓이고 있다. 평가는 정보 제공의 역할을 해야지, 이를 넘어 규제로 흘러가서는 절대 안 된다.”
- 그렇다면 앞으로 한국 AI 발전을 위해 정부나 사회적으로 필요한 것은 무엇이라고 보는가.
“먼저 글로벌 AI 경쟁에 대한 심각성을 공감할 필요가 있다. 이 부분에 대한 인지가 정말 필요하다. 정말 총만 안 들었지, 전쟁 난 상황이라는 심각성을 알아줬으면 한다. 네이버는 AI 경쟁에서 뒤처지지 않기 위해 정말 열심히 투자하고 있다. 흔히 조 단위 이상 투자했다고 얘기한다. 여기에 비판적인 얘기도 많은데, 구글을 보자. 구글은 1년에 50조 원 이상을 연구개발(R&D)에 투자한다. 이처럼 규모가 되지 않는 경쟁에서 한국 기업들은 어떻게든 잘 꾸려왔다. 네이버뿐만이 아니라 정말 많은 기업이 노력하고 있다. 정부에서 잘 지원해줘야 기업들도 버틸 수 있지 않겠나. 검색시장에서 한국이 20년간 잘 버텨왔지만 사실 지금은 유튜브를 많이 쓰고 있다. 이처럼 하나씩 외국에 종속되는 것이다. 플랫폼 독점과 같은 비난 섞인 눈으로 볼 게 아니라 글로벌 관점에서 봐줬으면 좋겠다. AI도 마찬가지고, 다른 플랫폼도 마찬가지다. 정부에서 지원이 있어야 30~40%라도 지켜낼 수 있는 거다. 정말 잘해야 50대 50이다. 지금 기업들은 AI 전쟁터에서 창끝 전투력이 되어 전선에서 싸우고 있다. 이러한 기업에 병참이라도 잘 해줬으면 한다. 밥 주고 총알 줘야 싸우지 않겠나. 최근 과학기술정보통신부가 구글과 국내 AI 발전을 위한 인재 양성 및 연구개발 협업에 관해 얘기했는데, 아쉽다. 특정 기업을 위해서가 아닌 전반적인 AI 경쟁력 강화를 위한 액션이 필요하다. 스타트업 입장이 다를 수 있고, 저희와 같은 기업 입장이 다를 수 있을 것이다. 이러한 이야기를 듣다 보면 합집합, 교집합과 같은 어느 정도 각이 나오지 않겠나. 이러한 부분에 의지를 갖고 추진할 필요가 있다.”
- 기업들이 정말 창끝 전투력이 되어 고군분투하고 있다. 그렇다면 정부 출연연구기관(출연연)에선 어떤 역할이 필요할까.
“출연연의 역할에 대해 고민을 해야 하지 않을까 싶다. 과거 박정희 정권이나 전두환 정권 때를 생각해보면 기업들의 기술력이 높지 않았다. 정부 주도로 기술 투자가 이뤄졌고, 거기서 정말 잘 만든 기술들이 민간 기업에 전수돼 기업이 성장하는 파이프라인이 있었다. 그런데 지금은 바뀌었다. 특히 AI는 기업들이 훨씬 잘한다. 그렇다면 출연연의 역할은 무엇일까. 기업이 하지 않는 것을 해야 한다. 미국에서도 출연연이 꽤 많지만 대부분 기업이나 민간 산업 부문은 다 내려놨다. 기업에서 하지 않는 것을 하고 있다. 우리나라 입장을 보면 기후, 환경 이러한 분야가 있다. 1차 산업과 관련된 부분도 있고 기초과학도 있다. 이 부분은 이윤을 창출해야 하는 기업에서 하기 어렵다. 이 부분을 해야 한다. 네이버는 네이버 생태계에 맞는 AI를 열심히 하는 것이고, 다른 AI 회사는 그 분야에 맞는 AI를 열심히 하는 것이다. 출연연도 그 역할을 찾아야 한다. 우리나라에 반도체 출연연은 없지 않은가. 삼성전자와 SK하이닉스가 잘하니까 굳이 출연연이 필요 없는 것이다. AI도 비슷하다. AI에서도 그 분야가 정말 다양한데 기업이 하지 않는 부분, 하지만 꼭 필요한 부분을 해줘야 한다.”
- 끝으로 강조하고 싶은 말이 있나.
“현재 AI 기술은 잘해야 70점이다. 100점이 아니다. 완벽하지 않다는 뜻이다. 이 부분을 정부나 사용자께서 수용해줬으면 좋겠다. 다행히 챗GPT 이후로 이러한 수용성이 생겼다. AI가 뱉어내는 여러 가지 콘텐츠들이 틀릴 수 있다는 생각이 많아졌다. AI 기술은 완전한 상태가 아니다. 그래서 사용자들이 잘 사용하는 것이 중요하고, 그 방법을 찾다 보면 개인 역량을 크게 높일 수 있는 도구다. 틀리더라도 이해하고 많이 사용해야 그 토대로 더 AI 기술이 똑똑해질 수 있다는 점을 알아줬으면 좋겠다.”
- 김동원 기자 theai@chosun.com