GPT-2 규모 초거대 위성 모델 구축, 초거대 언어 모델과 융합
-
대형언어모델(LLM) 이후 인공지능(AI) 발전을 이끌 기술에 관한 관심이 높다. LLM은 챗GPT와 같은 생성형 AI를 만들게 한 기반 기술이다. 많은 언어 데이터를 집약한 LLM이 파운데이션으로 자리하고 이를 응용한 다양한 생성형 AI 서비스가 등장하며 AI는 전성기를 맞이했다.비즈니스 용도로 주로 사용하거나 연구실에만 있던 AI를 일반인도 사용할 수 있도록 활용 폭을 대폭 높인 존재가 LLM이다.
그렇다면 LLM 이후 또 어떤 모델이 AI 산업의 대들보 역할을 할까. 여기엔 다양한 후보가 언급되고 있지만 많이 언급되는 모델이 ‘비전’이다. 언어와 비전은 딥러닝 초기부터 AI 분야의 큰 축이었다. 언어엔 순환신경망(RNN)이 있었다면 비전엔 합성곱 신경망(CNN)이 있다는 말이 있을 정도다. 최근 트랜스포머 신경망 등장과 초거대 AI 등장으로 언어 모델은 큰 발전을 이뤘다. 반면, 비전은 멀티모달로 간혹 언급될 뿐 언어 모델처럼 스포트라이트를 받진 못했다. 그만큼 이젠 비전 분야가 LLM 다음 AI 혁신을 이룰 수 있을 것이란 전망이 많다. 그리고 현재 이 분야에 앞장선 국내 기업이 있다. 항공, 위성 영상 등을 토대로 한 대형 비전 모델을 구축하고 있다. AI 영상분석업체 에스아이에이(SIA)다.
SIA는 인공위성과 항공에서 촬영한 영상을 AI로 탐지·분석하는 기술을 개발·공급하는 기업이다. 위성에서 촬영한 영상 데이터를 AI로 분석해 유의미한 결과를 낸다. 북한의 도발이나 위협 여부를 파악하는 것뿐 아니라 기상 정보를 분석해 태풍·폭우 등의 재난 사전 탐지, 각 국가의 재배 작물을 분석한 작황 예측, 세계 도시의 발전 여부를 분석하는 토지 분석 등을 한다. 위성 영상이 워낙 크고 분석이 어렵기 때문에 이를 보조할 수 있는 AI 기술 등을 만들었다.
이 기업은 위성영상 분석 사업의 가능성을 보고 2021년부터 대형 모델 구축에 나섰다. 이른바 ‘초거대 위성 모델’이다. 전태균 SIA 대표는 “생성형 AI 모델이 주목받기 시작할 때 여러 베타 서비스 사업에 참여하면서 많은 글로벌 기업들이 언어 모델 다음으로 비전 모델을 보고 있었다”며 “비전도 여러 영역이 있는데 위성 영상은 진입장벽이 워낙 높은 만큼 빅테크 기업들도 쉽사리 할 수 있지 못할 것이란 생각에 내부적으로 위성 영상을 전문으로 하는 파운데이션 모델을 준비했다”고 밝혔다. 이어 “아직 이름을 정확히 짓진 않았지만, 내부적으로 초거대 위성 모델로 부르고 있다”고 했다.
◇ 초거대 위성 모델 구축 자격 갖추다
SIA 서울 사무실에서 만난 전 대표는 초거대 위성 모델은 위성 분석 사업에 필요한 요소라고 설명했다. 위성 영상을 분석했을 때 얻을 수 있는 가치가 그만큼 커서다. 전 대표는 “우리가 주위에서 쉽게 볼 수 있는 일반 영상은 이미 전 세계를 커버할 만큼 클라우드나 네트워크에 데이터가 많이 쌓여 있다”면서 “하지만 위성 영상은 같은 사진이라는 측면에선 같지만 다른 차원의 영상이므로 초거대 모델을 운영할 만큼 데이터가 구축되지 않았다”고 말했다. 이어 “우리는 부족한 데이터 문제 등을 기술적으로 해결했고, 지난해 아카이브에 모델 설계도를 공개했다”고 밝혔다.
SIA가 다른 위성 분석 기업과 달리 대형 모델을 구축할 수 있었던 것은 위성 영상의 가치를 더할 수 있는 기술을 자체 개발했기 때문이다. 저해상도 위성 영상의 해상도를 높일 수 있는 ‘슈퍼X’란 기술이다.
-
위성 영상은 품질을 기준을 고해상도 위성과 저해상도 위성으로 나뉜다. 고해상도 위성은 높은 화질로 지구를 촬영해 분석과 변화 탐지가 용이한 데이터를 만들어낸다. 하지만 이 위성은 많은 반경을 촬영하지 못하는 한계가 있다. 망원경 렌즈와 비슷하다. 한 지점을 상세하게 촬영할 수 있지만 보이는 반경은 적다. 반면, 저해상도 위성은 많은 범위를 촬영할 수 있지만 해상도가 낮아 이 데이터를 가치 있게 분석하기가 힘들다. 쉽게 말해 고해상도 위성으로 촬영한 영상은 AI 분석 등에 유의미하게 활용할 수 있지만 반경이 적어 활용도가 낮고, 반대로 저해상도 위성은 활용도가 높지만 해상도가 낮아 분석이 힘들다.
SIA는 이 문제를 풀기 위한 초해상화 기술인 슈퍼X를 개발했다. 저해상도 위성이 촬영한 영상 데이터 품질을 높여주는 기술이다. 화질 영상을 고화질 처리해 재생하는 AI 기반 실시간 업스케일 기술인 ‘슈퍼 레졸루션’과 비슷한 원리다. SIA는 이 기술을 기반으로 지난해 5월 미국 민간위성 기업 ‘플래닛 랩스(이하 플래닛)’와 전략적 공급 파트너십 맺었다. 플래닛은 해상도가 낮지만 지구를 광범위하게 촬영하는 위성 기업이다. 위성으로 전 세계를 24시간 안에 다 촬영하고 있다. 플래닛은 해당 데이터를 더 가치 있게 사용할 수 있게 하기 위해 SIA의 초해상화 기술 ‘슈퍼 X’를 사용하는 데 합의했다.
저해상도 데이터를 가치 있게 만들어내면서 SIA는 다른 위성 영상 분석 기업과 달리 더 많은 데이터를 확보할 수 있게 됐다. 이 때문에 초거대 위성 모델을 구축할 수 있게 된 것이다.
◇ 위성 영상 파운데이션 모델로 서비스 반경 넓혀
현재 SIA가 구축한 초거대 위성 모델의 크기는 GPT-2와 유사한 규모다. 위성 영상으로 이 정도 크기의 모델을 구축한 기업은 아직 없다. 생성형 AI 발전의 기반이 된 언어 파운데이션 모델처럼, 향후 비전 AI 발전을 이끌 위성 파운데이션 모델을 한국이 1호로 선보이게 되는 셈이다.
SIA는 현재 초거대 위성 모델을 활용한 다양한 연구개발(R&D)을 하고 있다. 이를 토대로 다양한 성과도 나오고 있다. 대표 사례가 지난해 12월 제28차 유엔기후변화협약 당사국총회(COP28)에서 열린 AI·머신러닝(ML) 솔루션 챌린지 ‘AI For Good-AI/ML solutions for Climate Change’에서 우승한 기후 예측 솔루션이다. 고가의 기상 레이더망이나 장비가 없어도 위성 영상을 분석해 해당 지역의 기후 데이터를 생성형 AI로 만들어 기상 예측을 할 수 있게 돕는다.
-
전 대표는 “기후 데이터는 보유하고 있는 장비에 유무에 따라 전 세계적으로 데이터 불균형이 발생한다”면서 “우리는 위성영상 분석 기술과 생성형 AI를 활용해 데이터 불균형 문제를 풀어 해당 대회에서 우승했다”고 말했다.
이 대회는 AI와 머신러닝 기술을 활용해 기후 변화 문제를 방지하는 방법을 찾기 위해 마련됐다. 유네스코 전기통신연합(UN ITU)를 비롯해 국제원자력기구(IAEA), UN 식량농업기구(FAO), UN 교육과학문화기구(UNESCO)가 주최했다. SIA는 이 기술로 글로벌 스타트업들과 겨뤄 우승을 거머쥐었다.
SIA는 여러 성과에도 초거대 위성 모델 출시는 아직 검토 중이라고 밝혔다. 전 대표는 “현재 초거대 위성 모델을 적용한 플랫폼 출시 타임라인은 내부적으로 검토하고 있다”며 “GPT도 챗GPT라는 서비스가 나오기 전 여러 R&D 단계를 거쳤고, 우리도 지금 이 단계를 검토하고 있다”고 말했다.
◇초거대 위성 모델, 초거대 언어 모델과 융합한다
SIA는 초거대 위성 모델을 초거대 언어 모델과도 융합하고 있다. 위성 데이터와 언어 데이터를 결합해 지구 전방위적 서비스를 생성형 AI 기반으로 제공하겠단 계획이다. 일례로 사용자가 현재 어떤 지역의 상태에 관해 물어보면 AI가 그 지역의 모습을 위성 데이터를 기반으로 보여주고, 캘리포니아 지역의 5년간 강수량이 어떤지를 물어보면 전체 강수량 데이터를 갖고 특별히 비가 많이 왔거나 침수가 생겼거나 화재가 있었던 사례 등을 전체 강수 데이터와 위성 영상을 기반으로 보여주는 방식이다. 여기에 사용자의 이해를 돕기 위해 뉴스 현장 사진, 유튜브 등도 함께 제공하는 것을 목표로 하고 있다.
-
SIA는 이 모델이 시장에서 충분히 경쟁력이 있을 것으로 보고 있다. 차후 모델은 음성과 영상 등을 자유자재로 활용하는 멀티모달이 나올 것으로 전망되므로 이 모델들과 융합하면 위성 데이터도 충분히 사용자가 활용하기 쉬운 서비스로 출시할 수 있다는 게 회사 측의 설명이다.
전 대표는 “GPT-5부터는 멀티모달이 많이 발전한 상태로 나올 것으로 예상되고 구글과 마이크로소프트(MS)가 서로 경쟁해 모델을 고도화할 것으로 본다”며 “우리는 이러한 모델 등장에 대한 수혜를 충분히 얻으면서 비즈니스 도메인에서 위성 데이터와 AI를 잘 융합해 사용하기 편한 서비스를 선보이겠다”고 말했다.
- 김동원 기자 theai@chosun.com