LG AI연구원 ‘엑사원 4.0’, 글로벌 AI 성능 평가 11위 달성
클로드 4 오퍼스와 동점으로 종합 11위… 韓 모델 중 1등
美 스탠퍼드대 AI 보고서 연이어 등재되며 기술력 입증
LG AI연구원이 최근 공개한 ‘엑사원(EXAONE) 4.0’이 글로벌 AI 성능 분석 전문 기관 ‘아티피셜 어낼리시스(Artificial Analysis)’의 인텔리전스 지수 평가에서 종합 11위를 기록했다. 한국 AI 모델만 보면 1위에 해당하는 기록이다.
아티피셜 어낼리시스는 추론과 지식 역량(MMLU-Pro, Humanity’s Last Exam), 전문가 수준의 과학 문제 해결 능력(GPQA Diamond), 코딩 능력(LiveCodeBench, SciCode), 수학 문제 해결 능력(AIME 2024, MATH-500) 등 7개 고난도 성능 평가 지표를 종합해 인텔리전스 지수를 산정하는 글로벌 AI 성능 분석 전문 기관이다.
◇ 글로벌 프런티어 AI 모델과 경쟁력 입증
엑사원 4.0은 아티피셜 어낼리시스가 실시한 7개 고난도 성능 평가 지표에서 총 64점을 기록했다. 미국 앤트로픽의 최상위 모델인 클로드 4 오퍼스(Claude 4 Opus)와 동일한 점수다. 특히 코딩 분야에서는 7위, 수학 분야에서는 10위를 기록하며 각 영역에서 ‘톱 10’을 달성했다.
오픈 웨이트(공개) 모델 기준으로는 알리바바 Qwen3, 딥시크 Deepseek R1, Z.ai의 GLM-4.5에 이어 4위에 등극했다. 모델 크기가 수 배에서 수십 배에 달하는 글로벌 프런티어 AI 모델들과 경쟁할 수 있는 성능을 입증했다. LG AI연구원은 AI 모델 개발 기업 기준으로는 8위에 올랐다.
LG AI연구원은 지난 15일 엑사원 4.0을 글로벌 오픈소스 AI 플랫폼인 허깅페이스(Hugging Face)에 공개했다. 32B(매개변수 320억 개) 모델은 공개 2주 만에 50만 다운로드를 돌파하며 국산 AI 모델 중 최단기간 기록을 달성했으며, 현재 55만을 넘어섰다.
◇ 미국 연구기관도 인정한 한국 AI 기술 수준
올해 LG AI연구원이 공개한 국내 최초 추론 AI 모델 ‘엑사원 딥’(3월)과 하이브리드 AI 모델 ‘엑사원 4.0’(7월)은 미국 비영리 AI 연구기관 에포크 AI(Epoch AI)의 ‘주목할 만한 AI 모델’ 리스트에 연이어 선정됐다. 이 리스트는 매년 미국 스탠퍼드대 AI 보고서에서 국가별·기업별 AI 경쟁력 비교 자료로 활용된다.
앞서 지난해 12월 공개된 ‘엑사원 3.5’도 국내 AI 모델 중 유일하게 스탠퍼드대 AI 보고서에 포함된 바 있다. LG AI연구원의 엑사원 시리즈가 지속적으로 글로벌 무대에서 인정받고 있음을 보여주는 사례다.
이홍락 LG AI연구원 공동 연구원장은 “이번 결과는 LG의 엑사원이 세계 최고 수준의 프런티어 AI 모델들과 경쟁할 수 있는 역량과 잠재력을 갖추고 있다는 것을 증명한 것”이라며 “글로벌 AI 3대 강국 달성을 위해 세계 최고 수준의 AI 모델 개발을 위한 도전을 이어갈 것”이라고 밝혔다.
구광모 LG 대표는 올해 신년사에서 “고객의 시간 가치를 높이고, 무한한 잠재력을 발휘할 수 있게 하는 AI와 스마트솔루션”을 통해 미래 고객에게 새로운 가치를 제공하겠다고 강조한 바 있다. LG AI연구원의 이번 성과는 글로벌 AI 패권 경쟁이 치열해지는 가운데 한국의 AI 기술력이 세계적 수준에 도달했음을 보여주는 중요한 이정표로 평가된다.