[인터뷰] 이석중 라온피플 대표 “비전 분야에도 생성 AI 시대 온다”
전문성 필요한 비전 분야에 생성 기술 접목
“달리2·스테이블디퓨전 등은 비즈니스 활용 어려워, 전문화된 모델 필요”
‘생성 인공지능(AI)’ 시대다. 불과 얼마 전까지만 해도 판독·분석 업무에 주로 사용됐던 AI는 이제 새로운 텍스트와 이미지, 영상 등을 생성하며 다양한 분야에 활용되고 있다. 사람과 자연스럽게 대화하며 필요로 하는 정보를 제공하거나, 관련 이미지를 빠르게 제작하며 사용자의 영감을 더하는 중이다.
이 같은 AI 기술은 비즈니스 분야에도 다양하게 응용되고 있다. 사용자가 입력한 텍스트를 이해해 관련된 텍스트를 생성하는 ‘챗GPT’는 기존 스타트업들의 기술과 연계돼 새로운 챗봇 서비스로 재탄생되고 있다. 챗GPT의 기반 모델인 GPT-3.5와 GPT-4 등의 거대언어모델(LLM)도 요약, 번역, 설명 등 다양한 서비스와 연계되는 중이다.
새로운 이미지를 만들어내는 이미지 생성 모델도 마찬가지다. 영국 AI 스타트업 ‘스테빌리티AI’는 이미지 생성 AI ‘스테이블 디퓨전’을 오픈소스로 공개했다. 그러자 이 모델을 활용해 창업한 스타트업들이 급증했고, 이미지 생성 AI 활용 서비스도 많아졌다. 가상인간을 비롯해 엽서, 카드, 캐릭터 제작 등에 활용된다.
그런데 이러한 생성 AI 기술은 아직 ‘비전’ 분야 비즈니스 영역에서는 큰 활약이 없다고 평가된다. 비전 AI는 카메라나 센서 등으로 촬영된 영상을 판독·분석하는 AI 기술이다. CT, MRI 등의 의료 영상을 분석해 이상 여부를 판독하거나, 공장에서 생산된 제품의 불량 여부를 판독하는 등 다양한 분야에서 사용된다. 아직 이 영역에서는 언어 분야의 챗GPT와 같이 생성 기술을 기반으로 한 유명 AI 모델이 나오지 않은 상태다.
그렇다면 비전 분야에서도 생성 AI 모델이 활용될 수 있을까? 이 궁금증을 해결하기 위해 제조, 교통, 농업, 의료 등 다양한 분야에서 비전 AI 서비스를 제공하고 있는 ‘라온피플’의 이석중 대표를 만났다. 이 대표는 반도체 설계부터 AI까지 비전 분야를 꾸준히 연구해 온 전문가다. ‘알파고’가 소개되기 전인 2015년부터 비전 AI 서비스를 시작해 관련 서비스를 선보였다. 지금은 비전 AI 서비스부터 플랫폼까지 다양한 서비스를 개발·공급 중이다.
Q. 비전 AI는 사람의 ‘눈’ 역할을 한다고 안다.
“유사하다. 사람이 눈으로 보는 모든 행위를 보조할 수 있는 AI라고 보면 된다. 카메라나 센서 등으로 촬영하는 영상을 분석해 결과물을 낸다. 산업용으로 보면 공장, 의료 분야에서 사람이 눈으로 보지 못한 것까지 찾아내고 빠르게 판독할 수 있다. 일례로 비전 AI는 반도체 생산 과정에서 불량 여부를 찾아내는 역할을 한다. 전공정 작업에서 식각(에칭) 작업을 할 때 웨이퍼 24장을 분석하면 전체적인 패턴이 나오는데, AI는 그 패턴을 분석해 불량 여부와 그 원인을 빠르게 찾아낼 수 있다. 그만큼 반도체 생산에서 중요한 수율을 높일 수 있다. 이런 작업을 반도체 장비사 등과 진행하기도 했다.”
Q. 비전 AI는 사람이 보는 분야는 모두 다 할 수 있기 때문에 사업 영역이 클 것 같다.
“그렇다고 볼 수 있지만, 사실 다른 분야에 진출하기는 쉽지 않다. 왜냐하면 그 분야에 대한 도메인 지식이 필요하기 때문이다. 일례로 교통 분야에 사용될 AI를 만든다고 하면 신호가 어떤 체계로 움직이는지 등에 대한 교통 전문가의 지식이 필요하다. 의료 분야에서도 그 분야 전문 지식이 있어야 필요한 서비스를 개발할 수 있다. AI 개발에 데이터가 필요하다고 많이 얘기되는데 데이터는 당연한 얘기고, 여기에 전문적인 지식도 필요한 셈이다. 따라서 비전 분야 기술이 있다고 해서 타 영역 진출이 쉬운 편은 아니다.”
Q. 라온피플은 제조 분야를 시작해 의료, 교통, 농업 등의 사업을 하고 있지 않은가.
“라온피플을 설립하기 전에는 반도체 설계 쪽에서 근무했다. 그 회사에서는 부사장 겸 연구소장으로 근무했다. 2004년 회사를 상장시키고 2009년 퇴사해 이듬해 설립한 회사가 라온피플이다. 반도체 설계 쪽에 비전 분야가 중요할 것이라고 생각했기 때문에 처음부터 제조 분야 사업에 주력했다. 하지만 제조 분야는 고객사의 데이터가 중요하고, 고객사는 이를 토대로 한 기술이 타 회사와 공유되는 것을 좋아하지 않아 사업 영역을 의료, 농업, 교통 등으로 넓혔다. 치아교정에 사용되는 AI, 스마트 교통 시스템을 구축할 수 있는 AI 등을 개발·공급했다. 이를 위해 각 분야 전문가를 영입하고 투자도 많이 했다. 이러한 노력이 있었기에 다방면 사업을 할 수 있었다.”
Q. 비전 AI에 중요한 요소가 있다면.
“4가지 컴포넌트가 필요하다. 좋은 ‘알고리즘’은 당연히 필요하다. 그리고 대상을 잘 촬영할 수 있는 ‘광학계’가 중요하다. 특히 제조 분야에서는 1마이크로 단위로 촬영해야 하므로 광학계 품질이 서비스 품질을 좌우할 수 있다. 미세공정 단위로 가게 되면 ‘초점 거리’ 역시 중요해진다. 초점을 맞춰서 볼 수 있는 범위가 좁아지기 때문에 초점 거리가 뒷받침되지 않으면 대상을 여러 번 촬영해야 하는 변수가 생긴다. ‘조명’ 역시 중요하다. 대상에 따라 특정 조명을 쏘았을 때 잘 보이는 것이 있어서다. 이러한 분야가 모두 갖춰져야 완전한 비전 AI 서비스를 구현할 수 있다.”
Q. 최근 생성 AI가 인기다. 비전 AI에도 접목할 수 있을까.
“비전 AI 분야에서 가장 큰 걸림돌이 되는 것은 역시 데이터다. 좋은 데이터는 많다. 하지만 불량 데이터를 구하긴 쉽지 않다. 제조 분야만 봐도 그 제품을 오랜 기간 생산하지 않은 한 불량 데이터가 잘 축적된 경우는 거의 없다. 되어 있더라도 레이블링이 되어 있는 경우는 드물다. 이런 경우 생성 AI를 사용하면 좋다. 쉽게 말해 불량 데이터를 생성 AI로 만들어 학습시키는 것이다. 그렇게 되면 AI 품질을 짧은 시간에 크게 높일 수 있다.”
Q. ‘스테이블 디퓨전’이나 ‘달리2’ 등 이미지 생성 AI 모델로 불량 데이터를 만들 수 있나.
“범용적인 모델로 불량 데이터를 만들긴 쉽지 않다. 재밌는 예시로 어떤 사진이나 그림을 사람이 그렸는지, AI로 만들었는지를 알기 위해선 손이나 다리를 보면 된다. AI는 그림 전체를 그럴싸하게 만드는 재주가 있지만, 손에 대한 맥락을 정확히 이해하지 못하기 때문이다. 따라서 손가락을 6개로 그리거나 관절이 틀어져 있는 현상이 발생한다. 이처럼 이미지 생성 AI는 아무리 발전해도 산업 현장에 사용할 수 있는 불량 상태를 만들기는 쉽지 않다. 그 불량 기술을 잘 설명하면 되지만, 그것을 사람이 기술하긴 말 자체가 어렵다. 챗GPT를 범용적으로 사용할 수 있지만 특정 비즈니스 영역에선 데이터 등의 문제로 사용하기 어려운 것처럼, 이미지 생성 모델 역시 마찬가지라고 보면 된다.”
Q. 이미지 생성 AI 모델을 사용할 방법이 없을까.
“우리도 이 방법을 다방면 고민했다. 그 결과 양품 이미지가 있으면 여기에 불량이 생길 자리만 사람이 표시해 주면, 불량 유형을 학습한 AI가 이곳에다가 불량을 만들어내는 기술을 개발했다. 사람과 함께 불량 여부를 만들어내는 생성 AI 기술을 개발한 것이다. 사람이 약간 지시해주면, 필요한 불량 데이터를 빠르게 만들어낸다. 그리고 이 데이터는 실제로 비전 AI 학습에 큰 역할을 한다. 지금 범용성 생성 AI 기술이 아무리 발전하더라도 4~5년 내에는 이러한 용도로 사용할 수 있을 정도로 기술이 개발될 가능성은 작다고 판단해 자체적으로 필요한 기술을 개발했다. 이처럼 전문화된 영역에 생성 AI 기술을 응용한다면, 앞으로 마법 같은 일들이 많이 펼쳐질 것으로 본다.”
Q. 그렇다면 비전 AI 분야에도 ‘챗GPT’와 같은 모델이 등장할 수 있을까.
“챗GPT와 같은 모델은 구글이 개발한 신경망 ‘트랜스포머’를 기반으로 만들어지는데, 여기서의 기본 개념은 ‘어텐션’이다. 어텐션은 문장이 있으면 그 문장 안의 모든 단어를 동등하게 중요하다고 보지 않고, 특정 단어들만 중요하게 보는 것을 뜻한다. 이 특정 단어들이 맥락을 형성해 주요 내용을 이해하는 것이다. 구글은 비전 분야에서도 이를 사용할 수 있는 ‘비전 트랜스포머’를 개발했다. 남자친구가 여자친구가 앉아 있는 카페를 볼 때 여자친구를 중요하게 보고 나머지 카페 장면은 배경으로 보듯이, 특정 데이터만 중요하게 처리하는 기술이다. 이 신경망은 ‘합성곱 신경망(CNN)’에 이어 많은 연구가 되고 있다. CNN은 사람의 뇌를 흉내 낸 기술이라고 한다면, 비전 트랜스포머는 사람이 실제로 뇌와 눈을 사용하는 방법을 따라 했다고 보면 된다. 최근 대용량 모델에 빅데이터가 들어가다 보니 엄청난 결과가 나오고 있는 만큼, 비전 분야에서도 좋은 모델들이 나올 것으로 본다.”
Q. 최근 거대 모델들이 출현하고 있고, 트랜스포머 신경망 등이 적용되면서 긴장도 될 것 같다.
“당연하다. 하지만 계속 언급했듯 특정 분야에서 AI를 사용하기 위해선 도메인 지식이 정말 중요하다. 그 지식이 없는 한 단기간 내에 우리가 하는 사업 영역을 범용 모델이 대체할 수 없다고 본다. 우리는 이러한 전문 분야에서 경쟁력을 키울 예정이다. 또 오랜 기간 비전 기술을 공급해 온 만큼 고객사 요구에 따른 서비스도 제공하고 있다. 고객사가 AI를 쉽게 활용할 수 있는 전 주기 AI 개발 플랫폼을 개발하고 있고, 고객사 요구로 현장 안전보건 관리 AI 기술도 개발했다. 건설 현장 등에서 작업자가 안전모나 조끼 등의 안전장치를 잘 착용했는지 감시하는 AI 기술 등이다. 이를 토대로 우리는 제조 품질부터 안전까지 아우르는 비전 AI 기술을 탑재했다.”
Q. 그렇다면 AI는 기존 룰베이스 기술과 비교해 어떤 장점이 있다고 보는가.
“융통성이다. 제조 분야를 예로 들면 한 제품에서 불량이 나는 위치는 다양하다. 그런데 룰베이스의 경우 그 위치를 잘 식별하지 못한다. 사용자가 불량 위치 등을 하나하나 다 입력해야 불량 여부를 찾아낼 수 있다. 하지만 AI는 다르다. 학습한 결과를 토대로 불량 위치가 어디든 다 찾아낼 수 있다. 이러한 융통성이 작업 속도나 비용을 줄이는 중요한 역할을 한다. 의료 분야에서도 마찬가지다. 디지털 기술 발전으로 많은 부분이 전산화됐다고 하더라도 여전히 의료 분야에서는 사람의 손이 많이 가는 작업이 많다. AI는 이러한 작업을 자동화함으로써 불필요한 사람의 업무를 줄일 수 있다.”
Q. 앞으로의 계획이 궁금하다.
“우리는 사실 기술특례 상장사가 아니다. 실적 상장 기업이다. 그만큼 유예기간 등이 없어 실적에 대한 압박감이 컸다. 하지만 지난해 높은 매출을 기록하고 흑자 전환도 달성했다. 그동안 투자했던 많은 사업이 이제 결실 맺고 있다고 본다. 우리는 전문적인 도메인 지식이 필요한 제조, 의료, 농업, 교통 등의 분야에서 비전 AI 기술을 개발·공급하고 있다. 여기에 최근 생성 AI 기술 등을 응용한 기술 연구도 진행 중이다. 아직 우리가 하는 사업 중에 돈을 벌고 있는 조직보다 못 벌고 있는 조직이 많다. 이 말의 뜻은 이제 더 다양한, 아직 공개되지 않은 분야에서 성과가 날 가능성이 크다는 것이다. 생성 AI가 AI 분야에 부린 마법처럼, 우리도 비전 AI 영역에서 보여줄 마법이 많다.”