[AWC 2026 in Seoul] 업스테이지 “절차형 에이전트로 의료 행정 바꾼다”
전문 인력이 주당 최대 28시간 쏟는 문서 업무, AI로 파고들어
절차형 에이전트 4원칙, 재현성·설명 가능성·관리자 승인·자동 개선
프런티어급 모델·주권형 인프라·검증된 임상 현장 삼박자 갖춰
김민성 업스테이지 클라우드 GTM 총괄이 24일 서울에서 열린 ‘AI World Congress 2026 in Seoul(AWC 2026)’에서 ‘대답하는 AI에서, 일하는 AI로’를 주제로 연단에 올랐다. 그는 알파고 이후 10년간 AI가 판단에서 대답을 거쳐 실행 단계로 진입했다고 진단했다. 이에 업스테이지가 의료 현장에서 절차형 에이전트로 행정 병목을 어떻게 허물고 있는지를 실제 수치와 데모 영상을 공개했다.
김민성 총괄은 “AI가 똑똑해질수록 답은 넘쳐난다. 부족한 것은 그 답을 실제 업무로 끝까지 처리할 일손”이라며, 전문 인력이 매주 최대 28시간을 행정·문서 업무에 쓰고, 의사는 하루 평균 1.77시간을 진료 외 시간에 전자기록 작업으로 보낸다는 통계를 제시했다. 의사 62%가 행정·차트 업무를 번아웃의 핵심 원인으로 꼽는다는 수치도 함께 제시됐다.
업스테이지가 의료 현장에서 주목한 병목은 진단이 아니라 기록 정리였다. 타 병원에서 수백 장 단위로 유입되는 진료 소견서와 의뢰서를 짧은 외래 시간 안에 검토하는 것은 구조적으로 불가능에 가깝다. 이뿐 아니라 병원마다 양식이 달라 비교·구조화가 어려우며, 자유 서술 기록의 누락·오기 위험도 상존한다는 것이다. 김 총괄은 “이런 비정형 문서를 이해하고 EMR에 정형화하는 데 들어가는 시간은 의사가 환자를 진료하는 본질과는 먼 행정 업무이지만, 안 할 수도 없는 일”이라고 설명했다. 업스테이지는 의사의 의사결정을 보조하는 AI 에이전트보다 이 행정 업무를 처리하는 에이전트를 먼저 구현하는 쪽으로 방향을 잡았다. 그는 “병원 운영 차원에서도 행정 업무 자동화로 진료 품질을 높이는 방향이 ROI를 체감하기 쉽다”고 말했다.
현재 업스테이지는 국내 상급종합병원 4곳에서 실증 사업 및 실사용 수준으로 AI 활용을 끌어올려 운영 중이다. 주목할 만한 수치는 외부 의료기록 검토 시간의 변화다. 타 병원 진료 소견서 한 건을 검토하는 데 평균 20분이 걸리던 것이 업스테이지 솔루션 도입 후 5분으로 단축됐다. 이 수치는 강연장에서 직접 데모 영상으로 시연됐다. 화면에는 절차형 에이전트의 처리 흐름이 실시간으로 펼쳐졌고, 각 답변이 원본 소견서의 어느 위치에서 도출됐는지 파란색 박스로 표시돼 시각적으로 확인하는 구조가 공개됐다. 김 총괄은 “우리는 환각 없이 답변했는지 설명돼야 하는 과정을 중요하게 여긴다”고 말했다.
그는 업스테이지가 의료 현장에 절차형 에이전트를 선보인 이유를 설명했다. 현재 널리 쓰이는 범용 AI 모델은 기본적으로 사고 과정이 블랙박스와 같다. 같은 복잡한 명령어를 넣어도 동일한 결과물이 나오지 않는 건 모델이 다음 토큰을 예측하는 방식 자체가 불확실성을 내포하기 때문이다. 업스테이지가 선택한 해법은 자율형 에이전트가 아닌 절차형 에이전트였다. 김 총괄은 “A라는 인풋이 들어오면 에이전트가 보유한 n개의 절차를 기준으로 처리해서 결과를 낸다는 것을 기본 전제로 삼는다”고 설명했다. 업스테이지는 이 개별 절차를 ‘노드’라고 불렀다.
절차형 에이전트의 핵심 가치는 네 가지다. 재현성은 스키마 기반의 절차를 일정하게 구성함으로써 대량 처리에도 동일한 품질의 답변을 보장한다. 설명 가능성은 생성된 리포트의 모든 답변이 원본 문서의 출처 페이지와 좌표로 추적된다. 관리자 승인은 절차마다 승인 단계를 둠으로써 모델에 권한을 완전히 넘기지 않는 구조를 유지한다. 자동 개선은 사용자의 수정안이 누적돼 에이전트가 지속적으로 개선되는 휴먼 인 더 루프(HITR) 구조다. 김 총괄은 “절차형 에이전트는 결국 자율형 에이전트로 가겠지만, 신뢰의 기반은 절차에서 나온다”고 말했다. 규제·고위험 영역인 의료, 금융, 공공에서는 절차형이 먼저 요구되고, 신뢰가 쌓일수록 자율성이 확장되는 구조라는 것이다.
김 총괄은 강연 후반부에서 한국형 AI의 가능성을 조명했다. 그는 한국이 ‘AI로 일하기 좋은 나라’의 세 가지 조건을 갖췄다고 밝혔다. 먼저 프런티어급 모델이다. 업스테이지의 솔라 프리뷰 모델은 AAII v4.0 기준으로 44.4점을 기록하며, 클로드 오퍼스 4.8(61.4점), GPT-5.5(60.2점) 등 글로벌 최상위 모델과의 격차를 빠르게 좁혔다. 다음은 신뢰, 즉 주권형 인프라다. 국내 지역과 온프레미스 환경을 통해 민감한 의료 데이터를 외부로 반출하지 않고 처리한다는 점이다. 끝으로, 검증된 현장이다. 상급종합병원·금융·공공에서의 실제 도입 경험이 글로벌 확장의 레퍼런스가 된다는 논리였다.
김 총괄은 대한민국 의료 데이터 환경 자체가 이미 높은 준비도를 갖추고 있다는 점도 강조했다. “한국 의료 현장만큼 데이터가 잘 정리돼 있고 파이프라인이 구성된 곳이 없다”고 말했다. 기존에는 프런티어급 소버린 모델이 없었고 병원 내 인프라 관리도 어려웠지만, 이제 그 두 가지 제약이 동시에 해소되고 있다고 덧붙였다. 실제로 논의 중인 상급종합병원 중 일부는 클라우드 환경을 통해 솔루션을 도입하는 시나리오를 구체적으로 검토 중이라고도 밝혔다.