크고 성능 뛰어난 모델, 100% 활용 안 해, 효율성이 핵심
“모델 커스타미이징은 선택 아닌 필수” 인도 금융 사례 대표적
AWS, 베드록과 세이지메이커에 새로운 기능으로 최적화 지원
-
인공지능(AI) 업계가 더 크고 강력한 모델을 선보이려는 ‘규모의 전쟁’을 벌이고 있다. 이 전쟁은 막대한 비용과 전력을 소비하는 문제를 양산하다. 더 효율적인 방법으로 높은 성능을 내는 AI 전략이 필요한 이유다.
아마존웹서비스(AWS)는 3일(현지시각) 열린 AWS 리인벤트 2025에서 해법 중 하나를 내놨다. 작은 모델을 큰 모델만큼 똑똑하게 만드는 것이다. 모델 커스터마이징 기술로 효율성을 극대화하겠다는 전략이다.
실제로 오픈AI, 구글, 메타, 앤트로픽 등 빅테크 기업들은 AI 모델 크기 경쟁을 이어가고 있다. 더 많은 파라미터, 더 큰 컴퓨팅 파워, 더 방대한 데이터로 무장한 모델들이 계속 등장한다. 스와미 시바수브라마니안(Swami Sivasubramanian) AWS 에이전틱 AI 담당 부사장은 이날 기조연설에서 “오늘날의 기성 모델들은 광범위한 지능을 갖췄지만 항상 가장 효율적이지는 않다”며 “효율성은 비용만의 문제가 아니라 지연시간, 확장성, 민첩성의 문제”라고 지적했다.
◇ “에이전트 작업 대부분은 일상적 업무”
시바수브라마니안 부사장은 AI 에이전트 활용에 꼭 큰 모델이 필요한 것은 아니라고 주장했다. 그 이유는 AI 에이전트의 실제 작업 패턴에 있다. 그는 “대부분 에이전트는 작업 시간의 상당 부분을 일상적인 업무에 사용한다”며 “코드 작성, 검색 결과 분석, 콘텐츠 생성, 미리 정의된 프로세스 실행 같은 작업들”이라고 설명했다.
문제는 기업들이 이런 일상적 작업에도 가장 크고 성능이 뛰어난 모델을 사용한다는 점이다. 시바수브라마니안 부사장은 “이는 불필요한 비용 증가와 느린 응답 속도, 리소스 낭비로 이어진다”고 지적했다.
그가 제시한 해법은 ‘모델 커스터마이징’이다. “에이전트가 가장 자주 수행하는 작업을 담당하도록 특화된 소규모 모델을 사용하면 더 빠르고 정확한 응답을 더 낮은 비용으로 제공할 수 있다”고 밝혔다.
AWS가 이번에 발표한 아마존 베드록의 RFT(Reinforcement Fine Tuning·강화 파인튜닝)와 아마존 세이지메이커 AI의 서버리스 모델 맞춤화 기능이 바로 이 전략을 실현하는 도구다. 강화학습 같은 고급 기법으로 작은 모델을 훈련시켜 큰 모델에 버금가는 성능을 내도록 만든다.
시바수브라마니안 부사장은 “모델 커스터마이징을 통해 대규모로 배포하기 효율적인 모델을 만들면서도 적절한 성능을 달성할 수 있다”고 강조했다.
◇ 작은 모델의 반격… 73% 정확도 향상
실제 효과는 숫자로 증명됐다. 베드록 RFT는 기본 모델 대비 평균 66%의 정확도 향상을 제공한다. 세일즈포스는 특정 비즈니스 요구사항에서 최대 73%의 정확도 향상을 확인했다.
필 무이(Phil Mui) 세일즈포스 에이전트포스 소프트웨어 엔지니어링 수석 부사장은 “AWS의 베드록 RFT로 수행한 벤치마킹은 유망한 결과를 보여줬다”며 “세일즈포스의 특정 비즈니스 요구사항에서 기본 모델 대비 최대 73%의 정확도 향상을 입증했다”고 밝혔다.
인도의 핀테크 기업 인디아 스택은 적은 모델로도 복잡한 인도 금융 시장을 이해하는 대형언어모델(LLM)을 구축했다. 미스트랄 7B를 기반 모델로 시작해 지속적 사전 훈련, 파인튜닝, 지식 증류를 결합했다. 그 결과 작은 모델로도 충분히 활용가능한 AI를 만들 수 있다는 것을 입증했다. 더 빠른 응답 속도, 낮은 운영 비용, 적은 전력 소비라는 부가 이점까지 얻었다.
시바수브라마니안 부사장은 “단일 GPU 인프라에서 실행되는 7B 파라미터 모델이 최첨단 대형 모델들을 88%의 경우 능가했다”며 “운영 비용의 극히 일부만으로 더 나은 성능을 제공했다”고 말했다.
◇ AI 에이전트 시대, 모델 맞춤화 더 중요
AWS가 추구하는 AI 전략은 고객 이점에 맞춰져 있다. 높은 비용과 전력을 소모해 큰 모델을 사용하면서도 극히 일부 기능만 이용하기보다, 특성에 맞는 최적 크기로 모델을 맞춤 제작해 효율화를 높이는 방향을 추구한다. 이 방법이 각 작업의 특화한 AI 에이전트를 만들고 활용하는 데도 적합하기 때문이다. 시바수브라마니안 부사장은 “이제 모델 맞춤화의 질문은 ‘해야 하는가’가 아니라 ‘얼마나 빠르게 시작할 수 있는가’로 바뀌어야 한다”고 말했다.
아마존 베드록의 RFT는 개발자가 기반 모델을 선택하고 데이터셋을 업로드하면 자동화된 워크플로우가 전체 파인튜닝 과정을 처리한다. 박사급 전문 지식이나 6~12개월의 개발 기간 없이도 며칠 만에 맞춤형 모델을 만들 수 있다.
세이지메이커 AI의 서버리스 모델 맞춤화는 에이전트를 활용헤 모델 맞춤형을 지원한다. 이번에 새롭게 선보인 ‘에이전틱 방식’ 기능을 활용하면, 사용자가 자연어로 요구사항을 설명만 해도 AI 에이전트가 데이터 생성부터 훈련, 평가까지 전체 과정을 안내한다.
소미야딥 박시(Soumyadeep Bakshi) 콜리니어 AI 공동창립자는 “과거에는 학습, 평가, 배포를 위해 여러 시스템을 연결해야 했다”며 “세이지메이커 AI를 통해 실험 주기를 수주에서 수일로 단축했다”고 말했다.
시바수브라마니안 부사장은 “베드록과 세이지메이커 AI를 통해 모든 규모의 조직이 대규모로 효율적인 AI 에이전트를 구축할 수 있는 환경을 제공하겠다”고 강조했다.
- 미국=라스베이거스 김동원 기자 theai@chosun.com