[The AI 창간특집 기획] 네오사피엔스 김태수 대표 "곧 사람과 AI가 함께 만든 콘텐츠 보게 될 것"
인공지능(AI) 음성 전문 기업 네오사피엔스의 김태수 대표가 'The AI'의 창간을 기념해 축하의 말과 함께 AI 산업의 미래에 대한 의견을 밝혔다.
김태수 대표는 "인공지능 전문 미디어 ‘The AI’의 창간은 AI 기업 리더로서 무척이나 반가운 소식입니다. AI 기술이 분야를 막론한 전 산업에 빠르게 도입되는 시대에, 관련 분야 종사자 및 학계, 그리고 일반 국민들에게도 AI 기술의 중요성과 주요 동향을 알릴 전문 언론사가 절실한 상황이었습니다. 이제 ‘The AI’가 그 중심에서 AI 기술의 발전을 견인할 수 있기를 바라며, 더 나아가 우리 사회 속 핵심 과제 중 하나인 AI 시대 대응 방안 마련에 좋은 길잡이가 되었으면 합니다”라고 축하의 인사를 전했다.
네오사피엔스는 퀄컴(Qualcomm)과 카이스트(KAIST) 출신의 AI 음성 분야 전문가들이 팀을 이뤄 설립한 기업이다. 소량의 음성 데이터로도 특정인의 목소리를 학습하고, 여기에 다양한 감정 표현이 가능한 음성 합성 기술과 특정인의 목소리로 외국어를 합성하는 기술 등을 전문으로 한다. 해당 기술을 기반으로 한 서비스 ‘타입캐스트(typecast)’는 대본 입력과 편집으로만 전문 목소리 연기자의 나레이션, 더빙, 감정 연기 음성을 만들어 낼 수 있는 AI 성우 서비스이다.
네오사피엔스는 지난 2월 컴퍼니케이파트너스, 우리기술투자 등으로부터 시리즈A 투자를 유치해 누적 투자액 62억 원을 기록했다. 'CES 2020'에서 AI 음성 합성 기술의 다양한 혁신을 소개해 주목을 받았고, 지난 6월 서울시 ‘CAC 글로벌 서밋 2020’에서 IT 및 언택트 분야 혁신기업에 선정되기도 했다.
또한, 7월에는 현재 서비스 중인 60여 종의 AI 성우 중 일부 음성에 고음질 다운로드 베타 서비스를 실시, 그 외 모든 AI 성우의 음질도 전면 개선했다. 고음질 다운로드 베타 서비스는 유료 회원 한정으로 제공되는데, 점차적인 개발 과정을 거쳐 향후 모든 AI 성우 음성에 적용될 예정이다.
‘타입캐스트’는 2019년 11월 정식 론칭 이래, 수많은 콘텐츠 크리에이터와 기업들의 더빙 툴로 활용되고 있으며 론칭 후 1년도 되지 않아 6만 여 명의 총 가입자 수를 기록했다. 현재는 유튜브 크리에이터, 언론사, 방송사, 출판사 등 다양한 협업을 통해 양질의 콘텐츠를 만들어 내고 있다.
다음은 네오사피엔스의 김태수 대표에게 ‘타입캐스트’와 AI 산업의 미래에 대해 들어본 인터뷰 전문이다.
Q. 안녕하세요. 간단한 자기소개 부탁 드립니다.
A: AI성우 서비스 ‘타입캐스트(typecast)’를 개발한 네오사피엔스 김태수 대표입니다. 카이스트(KAIST)에서 기계학습(머신러닝) 연구로 박사학위를 받은 후 LG전자, 퀄컴에서 10년간 연구원으로 근무하다 약 3년 전인 2017년 11월 네오사피엔스를 설립하게 됐습니다.
회사 설립 전 업계 선후배와 교수님들의 조언을 받고, AI로 혁신할 수 있는 사업은 어떤 것이 좋을지 오랜 기간 고민하다가 창업을 결심했습니다.
Q. 네오사피엔스는 어떤 기업인지 소개 부탁 드립니다.
A: 우리는 AI 를 통해 미디어 엔터테인먼트 산업을 혁신하는 회사입니다. 네오사피엔스의 '타입캐스트'는 차별화된 AI 음성 합성 기술로, 개성 있고 감정이 풍부한 목소리를 만들어 냅니다. 수십 명의 개성 있는 AI 성우가 펼치는 목소리 연기가 이용자들에게 전에 없던 새로운 경험을 제공하고 있습니다.
요즘은 누구나 쉽게 콘텐츠 제작자가 될 수 있는 시대인데, 우리의 독보적인 음성 합성 기술과 이를 기반으로 완성되는 AI 성우들의 목소리 연기가 이후 미디어 산업의 큰 혁신을 가져올 것입니다. 지금도 우리의 AI 성우 목소리를 이용해 다큐멘터리와 같은 방송 및 영상 더빙, 뉴스 제작, 오디오 북, 교육자료 등 다양한 콘텐츠가 제작되고 있습니다.
Q. 네오사피엔스의 핵심 기술과 사업영역은 어떻게 됩니까?
네오사피엔스의 핵심 기술은 독보적인 음성∙언어분야의 AI 원천 기술입니다. 소량의 녹음량으로 특정인의 목소리를 학습 후 다양한 감정 표현이 가능한 음성 합성 기술과 특정인의 목소리로 외국어를 합성하는 기술이라고 할 수 있습니다. 이 기술을 기반으로 한 인공지능 성우 서비스 ‘타입캐스트’를 핵심 사업으로 운영 중입니다.
더불어, 주요 출판 기업과 협업해 고음질 음성 엔진으로 오디오 북을 제작했으며, 음성 복원부터 커스텀 음성 제작도 가능합니다. 또한 AI 음성이 필요한 기업에게 API 및 SDK 서비스를 제공하기도 합니다.
Q. AI에 관심을 가지게 된 계기와 AI 분야의 사업을 해야겠다고 결심하게 된 이유는 무엇이었나요?
A: 일단 제가 해 오던 기존의 커리어와 이어질 수 있는 사업이었고, 한 길을 걸어온 터라 특별히 다른 선택의 여지가 없었습니다. 사실 항상 접하던 기술이라 세상에서 떠들썩 하게 AI를 언급하는 것을 대수롭게 생각하지 않았었는데 기술의 발전 속도가 예전과 다르게 급속히 발전하는 것을 직접 느끼다 보니 이것이 세상을 크게 바꿀 수 있고 미래에는 누구나 접해야 되는 기술이 될 것이라는 것이 너무나 확실해 보였습니다. 그래서 이 큰 변화를 먼저 만들어 내고 더욱 가치 있는 변화로 만들고 싶다는 생각이 컸습니다.
Q. 사업을 운영하면서 가장 어려웠던 순간은 언제였나요?
A: 새로운 것을 하는 것은 하나부터 열까지 어렵지 않은 일이 없습니다. 질문이 '사업을 운영하면서'라고 되어있는데 사실 스타트업은 운영할 사업이 없는 상태에서 그것을 만들어가는 일입니다.
제가 좋아하는 책중에 페이팔을 창업한 피터틸이 쓴 '제로투원'이라는 책에서는 스타트업은 0에서 1을 만들어내는 것이라고 설명합니다. 사업을 '운영'한다는 것은 1에서 10, 100, 1000을 만들어내는 일인것 같은데, 거기까지는 아직 경험이 없어서 모르겠습니다. 스타트업은 아직 0에서 1을 만들어내지 못한 회사이고 이 1을 만들어내는 것이 가장 힘든일이라고 생각합니다.
정해진 어떤 패턴이 있거나 누군가를 따라서 가는 일이면 열심히 하기만 하면 되겠지만 스타트업을 창업해서 기존에 없던 제품을 만들고 그것을 사람들이 쓰게 만드는 일은 열심히만 한다고 되는것이 아니기 때문입니다.
Q. 다양한 AI 분야 중 가장 주목하고 있는 분야 및 기술을 하나 고른다면?
A: 미디어 엔터테인먼트 분야에 제일 주목하고 있습니다. 말씀주신대로 다양한 AI분야가 있지만 기존에는 주로 인식∙판단을 주로 했고 이 분야들은 이미 어느정도 산업에 접목되기 시작했고 성공한 회사들도 나오고 있습니다.
하지만 생성∙표현 분야는 이제 막 기술들이 쏟아져 나오고 있습니다. 그래서 여기에 앞으로 기회가 클것이라고 생각하는데, 이러한 생성∙표현 분야가 쓰일 수 있는 분야 중 가능성이 큰 곳이 미디어 엔터테인먼트라고 생각합니다.
Q. 앞으로 AI가 세상을 어떤 방향으로 바꿀 것이라 생각하십니까?
A: 기술이 발전하는 흐름을 보면 기술은 항상 대중을 향해 많은 사람들을 이롭게 하는 방향으로 나아가고 있습니다. 새로운 기술이 나오면 처음에는 아주 일부만이 매우 비싼 비용으로 사용할 수 있지만 시간이 지나면 모든 사람이 일상처럼 사용할 수 있는 기술이 됩니다. 자동차, 컴퓨터, 스마트폰 등이 그래왔듯이 말이죠.
마찬가지로 AI도 지금은 일부의 사람들만 사용하는 기술일 수 있지만 앞으로는 모든 사람이 일상에서 있는지도 모르게 사용하게 될것이라고 생각합니다. 그리고 이것을 통해 사람들에게 편리함과 기존에는 못하던 일들을 가능하게 만들어주는 역할을 할 것이라고 생각합니다.
예를 들면, 기존에는 글을 쓰던 블로거가 유튜브 영상을 만들기 위해서는 자신이 녹음, 녹화, 편집을 위해서 자신이 그런 능력을 가지고 있어야 하거나 전문가의 도움을 받아야 했지만 앞으로는 타입캐스트와 같은 서비스로 전문 연기자를 섭외하지 않고도 녹음 음성을 내려받는다던지, 여러가지 AI가 접목된 편집 툴을 이용하여 편집을 쉽게 한다던지 해서 글만 쓰는 작가들도 멋진 영상을 만들어 낼수 있을것입니다.
더 나아가 내가 글을 작가처럼 잘 못쓰지만 아이디어만 있는 어떤 분들도 최근에 나오는 자연어 생성 엔진 등을 활용한 서비스가 나오면 전문 작가와 같은 글을 멋지게 생성해주는 것도 가능할 것입니다.
Q. AI가 인력을 대체하여 일자리가 줄어들 것이라는 우려가 표출 되기도 합니다. 이에 대해 어떻게 생각하십니까?
A: 기술의 발전이 사람의 할일을 빼앗아 일자리가 줄어들 것이라는 우려는 항상 있어왔습니다. 하지만 매번 이러한 우려가 있을때마다 그전에는 생각하지 못했던 새로운 일자리가 생겨나면서 더 나은 방향으로 발전을 해왔습니다.
마찬가지로 AI가 우리의 일자리를 빼앗아 갈것이라는 우려가 있는 것도 사실이지만 AI를 활용하면 우리의 능력이 그만큼 향상되고 생산성이 증대되고 그에 따른 새로운 기회가 생겨난다고 생각합니다.
저희 서비스인 '타입캐스트'에 대해 설명할 때도 'AI 성우' 목소리를 제공한다는 이유로 간혹 그런 질문을 받기도 합니다. 저희는 현재 프로 성우들이 직접 녹음한 데이터를 베이스로 딥 러닝 기술을 통해 AI 성우 음성으로 제작하는 과정을 거치고 있습니다.
성우들은 자신의 목소리를 기반으로, 또 다른 AI 성우 캐릭터를 생성할 수 있으니 오히려 지속적인 수익 창출에 도움이 될 수 있는데요. 또는 저희가 새롭게 기획하는 AI 성우 목소리를 위해 실제 연기자를 고용할 수도 있는 것이니, 어떻게 접근하고 활용하느냐에 따라 이렇게 각 분야 간 바람직한 협업 구조를 만들어 낼 수도 있다고 생각합니다.
Q. 정부의 ‘디지털 뉴딜’ 정책과 관련하여 AI 기업의 입장에서 바라는 점이 있다면?
A: 디지털 뉴딜 사업에 대해 자세한 내용을 인지하고 있지는 않지만, 기업들이 자유롭게 그들의 상상력으로 새로운 도전을 하는데 있어서 방해되는 요소들을 최대한 없애주는 것이 제일 중요하지 않을까 생각합니다.
Q. 코로나19가 기업의 운영에 미친 영향이 있다면 어떤 것입니까?
A: 코로나19가 우리 삶의 방식에 많은 영향을 주고 있습니다. 사람들을 직접 만나기 어렵고 집에서 많은 시간을 보내야 하는 경우가 많이 발생했습니다. 이러한 상황에서 사람들과의 소통하는 방식 집에서 생활하는 방식에 있어서 기존에는 있어도 굳이 시도하지 않던 방식을 접할 수 있는 기회가 많아지고 있습니다.
예를 들어 원격회의 시스템이 있어도 직접 만나던 문화가 이제는 왠만하면 직접 만나지 않아도 회의를 하게 됩니다. 그리고 이러한 경험을 통해서 새로운 생활 방식이 상당히 편하다는 것을 사람들이 느끼고 있다고 생각합니다.
그렇다보니 지금 겪어본 많은 편리한 기술, 제품, 서비스 들을 코로나19가 끝나더라도 사람들이 계속 사용하면서 이러한 생활 방식을 일부 유지할 가능성이 높다고 생각합니다.
저희의 '타입캐스트'도 그중에 하나가 될수 있습니다. 코로나19 확산이 본격적으로 극심해진 지난 3월부터 온라인 수업을 준비하던 많은 교사들이 영상∙음성 수업자료를 만드는 것에 어려움을 느껴 저희 서비스를 무상 지원했습니다. 현재 1500여 학교의 교사들이 편리하게 사용하고 계시고 있고, 그 만족도가 매우 높아하고 계십니다.
Q. 네오사피엔스의 미래비전은 무엇인가요?
A: 앞서 기업 소개에 설명 드린 것처럼, 저희는 AI를 통해 미디어 엔터테인먼트 산업을 혁신하고 있습니다. 이를 통해 전세계 사람들의 삶속에서 당연하게 항상 접하는 그런 기술과 제품을 제공한 회사가 되고자 합니다.
좀 더 구체적으로는 조만간 머지않은 미래에 우리가 일상적으로 접하는 미디어 엔터테인먼트의 많은 분야에서 실제 사람이 출연하지 않고 AI가 만들어내거나 사람과 AI가 협업으로 만들어내는 콘텐츠들을 자연스럽게 받아들일 수 있는 세상이 될 것 이라고 생각합니다.