포커스

[인터뷰]“매번 같은 AI 추천 콘텐츠, 이젠 실시간 달라진다”

기사입력 2023.04.06 12:59
이영수 하이퍼커넥트 머신러닝 소프트웨어 엔지니어
변동성 심한 ‘라이브 스트리밍’ AI로 실시간 추천하는 기반 기술 개발
  • ‘인공지능(AI) 일상화’가 시작됐다. 공상영화 속 환상에 머물던 AI 기술은 어느덧 하루의 시작부터 끝까지 사람과 함께하는 일상 도구로 자리매김했다. 일례로 AI는 수면 질 분석부터 출근길 경로 추천, 업무 일정 알람, 콘텐츠 추천 등 다양한 분야에 사용되고 있다. 의료나 교육, 제조 등 다양한 산업 분야에 자리매김한 지도 오래다.

    AI가 일상에 가장 밀접하게 자리한 분야는 ‘추천’이다. 소셜네트워크서비스(SNS)와 온라인동영상서비스(OTT) 등의 콘텐츠부터 검색엔진 광고, 쇼핑몰 상품, 빠른 교통 경로 등 사용자 맞춤형 추천 시스템이 AI 기반으로 이뤄지고 있다.

    AI 추천 기술은 사용자의 과거 데이터를 분석해 미래 행동을 예측하는 데 중점을 둔다. 사용자가 자주 찾은 상품이나 콘텐츠들을 유형, 장르 등 다양한 카테고리별로 분석해 좋아할 것 같은 제품을 추천하는 방식이다. 이러한 추천 시스템을 제대로 구동하려면 사용자의 과거 데이터가 필요하다. 넷플릭스를 처음 가입할 때 좋아하는 장르의 콘텐츠를 몇 가지 선택해야 하는 과정이 필요한 것도 이 때문이다.

    하지만 이 같은 추천 방식은 변화의 필요성을 맞이하게 됐다. 사용자 맞춤형 콘텐츠를 추천하기 위해선 과거 데이터가 많이 필요하다. 하지만 지금과 같은 ‘플랫폼 왕국’ 시대에서는 사용자가 하나의 채널에 종속되지 않고 다양한 플랫폼을 이용해 그 데이터를 쌓아가기가 쉽지 않다. 실시간 스트리밍 증가도 기존 AI 추천 시스템의 변화를 촉구하는 존재다. 실시간 스트리밍의 경우 방송의 시작과 종료 시간이 정해져 있다. 기존 OTT의 영화, 예능 프로그램처럼 계속 플랫폼에서 계속 방영되는 것과 다르다. 기존에는 AI 추천 시스템이 같은 영화와 프로그램, 쇼핑 상품을 매일 똑같이 추천해도 됐다면, 실시간 스트리밍의 경우 콘텐츠별로 방송 시간을 고려해 현재 방영되는 콘텐츠만 추천해야 한다. 그만큼 추천 시스템의 변동성이 심해진 것이다.

    이 문제를 줄이기 위해 최근 AI 기업들은 고도화된 추천 방식을 연구하고 있다. 대표 기업이 소셜 라이브 스트리밍 서비스 ‘하쿠나 라이브’를 운영하고 있는 ‘하이퍼커넥트’다. 지난해 1월 한덕수 국무총리가 방문해 제2차 국가데이터정책위원회를 개최해 ‘AI 일상화 및 산업 고도화 계획’과 ‘데이터산업진흥 기본계획’ 등을 논의했던 그 기업이다. 현재 하이퍼커넥트는 스트리밍 서비스에 최적화된 실시간 AI 추천 시스템을 개발·상용화했다. 해당 연구를 주도한 핵심 개발자인 이영수 하이퍼커넥트 머신러닝 소프트웨어 엔지니어를 만나 자세한 이야기를 들어봤다.

  • 하이퍼커넥트는 스트리밍 서비스  ‘하쿠나 라이브’의 AI 추천 시스템을 실시간으로 고도화했다. /하이퍼커넥트
    ▲ 하이퍼커넥트는 스트리밍 서비스 ‘하쿠나 라이브’의 AI 추천 시스템을 실시간으로 고도화했다. /하이퍼커넥트

    - 실시간 스트리밍이 기존 AI 추천시스템보다 더 고도화된 기술이 필요한 이유는 무엇인가.

    “기존 SNS나 OTT, 쇼핑몰 등에서 사용되는 추천 시스템을 자세히 보면 매번 비슷한 콘텐츠나 상품을 추천한다. 예를 들어 사용자가 샴푸가 필요해 쇼핑몰에서 이 상품을 검색한 경우 다음 날이나 그 다음 달에 접속해도 비슷한 유형의 제품이 추천된다. 콘텐츠도 마찬가지다. 새로운 콘텐츠가 나오면 달라질 수 있겠지만, 어제 추천됐던 드라마가 내일 또 추천되는 경우가 많다. 하지만 실시간 스트리밍은 어제 뜬 콘텐츠가 내일 추천돼선 안 된다. 왜냐하면 방송을 안 할 수 있기 때문이다. 시간대마다 방영되는 방송이 다르고 사용자가 찾는 방송도 다르다. 따라서 라이브 스트리밍은 ‘실시간성’을 고려한 추천 시스템이 필요하다.”

    - 라이브 스트리밍은 방영하는 콘텐츠가 다양해 추천이 더 어려울 것 같다.

    “우리 서비스인 ‘하쿠나 라이브’만 보더라도 다양한 유형의 방송이 있다. 일상을 얘기하는 방송도 있고, 게임을 소개하는 방송, 노래를 부르는 방송 등 유형이 다양하다. 방송하는 사람의 연령도 각기 다르다. 우리는 이러한 다양한 장르의 콘텐츠를 사용자 맞춤형으로 추천하기 위해 기존 사용자의 행동 패턴을 분석해 이와 비슷한 사용자에게 추천하는 방식을 취하고 있다. 예를 들어 A 사용자가 B라는 호스트의 방송을 즐겨본다고 가정해보자. 이 상황에서 C라는 사용자가 새롭게 서비스에 가입했다. 그런데 C가 A와 특성과 취향이 비슷하다. 그러면 B가 방송을 할 때 C에게 이 방송을 추천한다. A라는 데이터가 없어도 이와 비슷한 콘텐츠를 추천하는 것이다. 넷플릭스처럼 그 사람의 취향을 조사하지 않아도 패턴을 분석해 유사한 방송을 추천할 수 있게 하고 있다.”

    - 사실 AI가 원하는 제품과 콘텐츠를 제대로 추천하지 못한다는 불평도 많다.

    “실시간성이 배제돼있고 클릭률을 유도하는 추천 시스템이 많은 탓이다. 매번 똑같은 콘텐츠와 제품이 추천되면 사용자는 만족감을 느끼지 못한다. 클릭률 유도 추천도 문제다. 일례로 인터넷 사이트에서 뜨는 속옷 광고의 경우 클릭률은 높지만 실제로 구매까지 연결되진 않는다. 사용자가 필요로 하는 제품이 아니기 때문이다. 우리는 이 문제를 줄이기 위해 정말 사용자들이 좋아하고 시청할만한 콘텐츠를 추천할 수 있는 기술 연구에 많은 집중을 하고 있다. 사용자의 데이터를 분석해 어떤 방송을 추천했을 때 좋아할지 등을 내부적으로 시뮬레이션하고, 여기서 나온 예측값과 평가 값 등을 또 다른 데이터로 정량화하고 있다. 이를 토대로 사용자가 방송을 오래 시청하고, 팔로우도 하는 콘텐츠를 추천하고자 한다. 이러한 노력으로 기존 추천 시스템에서 나오는 불평들은 많이 해소됐다고 본다.”

    - 결국 사용자가 원하는 콘텐츠를 실시간으로 추천해야 하는 것이 중요할 것 같다.

    “맞다. 이를 구현하기 위해선 가장 중요한 것이 양질의 데이터를 많이 써야 한다는 것이다. 요즘 인기인 ‘챗GPT’도 데이터를 많이 사용했기 때문에 서비스가 고도화됐다고 하는데 추천 시스템도 마찬가지다. 그런데 문제는 양질의 데이터를 잘 쓰는 것이 생각보다 어렵다는 점이다. 머신러닝 프로젝트를 보면 학습하는 부분이 따로 있고 서비스하는 부분이 따로 있다. 학습은 과거 데이터를 토대로 모델을 학습시켜 고도화하는 작업이고, 서비스는 실제로 사용자가 유입됐을 때 학습한 모델을 바탕으로 결과를 내는 작업이다. 이 두 작업에는 모두 데이터가 필요하다. 특히 라이브 스트리밍의 경우 사용자의 실시간 데이터를 학습하고 이를 토대로 서비스해야 하는데 이를 동시에 구현하기는 어렵다.”

    - 그렇다면 라이브 스트리밍의 실시간 추천 시스템은 어떻게 구현했나.

    “하이퍼커넥트는 스트리밍 서비스의 추천 시스템을 고도화하기 위해 ‘피처 스토어(Feature Store)’라는 기술을 자체 개발했다. 실시간으로 생성되는 양질의 데이터를 사용하기 쉽게 해주는 기술이다. 스트리밍에서는 사용자가 어떤 방송을 봤는지, 어느 시간에 접속하는지, 또 그 시간에 접속 중인 호스트는 누구인지 등에 관한 데이터가 실시간으로 생성된다. 사용자에게 최적화된 추천을 하려면 이러한 데이터를 학습 과정과 서비스 과정에 모두 녹여내야 한다. 피처 스토어는 이러한 데이터를 학습과 서비스 사이에서 관리해주고 서로 일치하게 해주는 역할을 한다. 이를 토대로 이전보다 가치있는 데이터를 학습과 서비스에 사용할 수 있게 되면서 추천 모델들의 예측 정확도가 크게 향상됐다. 이 덕분에 실시간으로 사용자 취향에 맞는 콘텐츠를 추천할 수 있게 됐다.”

  • 이영수 엔지니어는 실시간 추천 서비스를 위해  ‘피처 스토어’ 기술을 자체 개발했다고 밝혔다. /김동원 기자
    ▲ 이영수 엔지니어는 실시간 추천 서비스를 위해 ‘피처 스토어’ 기술을 자체 개발했다고 밝혔다. /김동원 기자

    - 데이터 측면 외에 개발 부분에서도 도움을 줄 수 있는 기술인 것 같다.

    “추천 시스템을 여러 개 운영하는 경우 개발자가 중복으로 해야 하는 작업을 줄여주는 효과가 있다. 일례로 하쿠나 라이브는 현재 방송 중인 스트리밍을 추천하기도 하지만, 방송 중이지 않는 스트리밍 중 인기 있는 콘텐츠를 사용자가 구독 신청했을 때 알람을 주는 추천 시스템도 운영 중이다. 이 두 추천 시스템은 다른 영역이기 때문에 데이터를 일치시키는 작업이 각자 들어가게 된다. 그만큼 작업 시간이 많이 들어가고 작업자 실수로 인한 오류가 발생할 가능성도 있다. 피처 스토어는 이처럼 따로 운영되는 작업을 일치시키는 플랫폼 역할을 한다. 그 덕분에 새로운 추천 프로젝트를 하더라도 여기에 데이터 등을 녹여내는 속도가 상당히 빨라졌다.”

    - 피처 스토어는 다양한 분야에 사용할 수 있을 것 같은데 이를 통한 사업 계획이 있나.

    “하쿠나 라이브에 들어간 피처 스토어는 우리가 자체 개발한 서비스다. 오픈소스로 피처 스토어라는 기술이 있긴 하지만, 그 기능이 우리가 요구하는 것만큼 만족스럽지 않아 자체적으로 만들었다. 물론 이 기술은 다른 쇼핑이나 콘텐츠 추천 시스템에도 사용할 수 있다. 이를 오픈소스로 공개할지, 아니면 새로운 사업 모델로 만들지에 대해선 아직 회사 차원에서 고려하고 있지 않다.”

    - 실시간으로 추천할 수 있는 시스템을 고도화했다. 준비하고 있는 또 다른 기술이 있다면.

    “지금까지 추천 시스템은 시청자 입장만을 고려해 개발돼 왔다. 시청자가 원하는 영상을 더 쉽게 찾을 수 있는 기술 등이 고도화됐다. 그런데 스트리밍은 시청자뿐 아니라 호스트의 만족도도 높여야 한다고 본다. 일반적인 OTT나 쇼핑몰의 경우 상품들에 자아가 있지 않다. 누구에게 노출돼도 상품이 기분이 나쁘거나 좋거나 하진 않는다. 하지만 스트리밍은 다르다. 호스트가 있기 때문에 자신의 방송이 추천될 때 어떤 사람에게 추천되고 싶은지 등을 고민할 수 있다. 특히 호스트는 시청자와 실시간으로 소통하며 방송하기 때문에 케미가 잘 맞아야 한다. 이를 고려해 호스트와 시청자 모두를 만족할 수 있는 AI 추천 기술을 연구하고 있다. 이 부분이 사실 우리 AI 조직이 가장 많이 고민하는 부분이다.”

    - 사용자 만족도를 높이기 위해 기술 개발 외에 노력하는 부분이 또 있나.

    “공정성 부분이다. 추천 시스템에서 문제되는 부분은 크게 두 가지다. 하나는 사용자가 원하지 않는 것을 추천하는 것이고, 또 다른 하나는 계속 똑같은 것만 추천하는 것이다. 특히 후자가 더 큰 문제로 떠오르고 있는데, 계속 똑같은 추천을 하게 되면 사용자의 사고를 넓히지 못하는 부정적 효과가 발생하기 때문이다. 계속 똑같은 유형의 콘텐츠만 추천하면 사용자가 그 유형에 잠식되는 문제 등이다. 우리는 이 문제를 미연에 방지하기 위해 글로벌 기준에 맞춘 공정성 부분 연구를 진행하고 있다. 아무래도 하이퍼커넥트 서비스가 국내보다 해외에 집중돼 있고, 글로벌 사용자가 많은 만큼 한국뿐 아니라 세계가 요구하는 AI 윤리에 부합할 수 있는 서비스를 제공하고자 노력하고 있다.”

    - 현재 개발자로 근무하고 있다. 개발자로서 국내 AI 산업이 어떤 방향으로 가야 한다고 보는가.

    “AI 기술을 기반으로 비즈니스 성장이 이뤄진 사례가 많아져야 한다고 생각한다. 미국의 경우 구글이나 아마존, 넷플릭스, 메타 등의 회사들은 모두 AI 기술을 바탕으로 많은 성장을 이뤘다. 하지만 국내의 경우 물론 잘하고 있는 회사도 있지만, 아직까진 많은 회사가 AI 기술을 미래를 위한 투자 대상으로만 생각하고 있다. 비즈니스를 성장시킬 수 있는 기술로는 인지하진 못하는 곳이 많다. AI가 투자 대상을 넘어 회사의 이익을 가져올 수 있는 기술로 인지되면 앞으로 회사들이 더 많이 성장할 수 있다고 본다. AI가 중요하니까 열심히 투자하자는 생각만으론 기업이 변화하지 못한다. AI 기술로 혜택을 입은 회사들이 많아져야 그 경험을 토대로 진정한 비즈니스 체질 변화가 이뤄질 것이라고 본다.”

    - 현재 근무 중인 하이퍼커넥트는 어떤가.

    “하이퍼커넥트는 사실 AI 기술을 도입한 지 7년이 넘었다. 회사가 시작하자마자 AI 기술을 도입했고 지금도 많은 투자를 하고 있다. 국내에서 하이퍼커넥트만큼 AI 팀에 열심히 투자하는 회사는 많지 않다고 생각한다. AI에 많이 투자하는 이유는 AI가 실질적으로 하이퍼커넥트의 서비스들을 이끌어왔기 때문이다. 이처럼 다른 회사들도 AI를 통해서 실제로 서비스를 개선하고 고객들에게 만족감을 주는 경험을 많이 했으면 좋겠다.”

최신뉴스