16개 검사로 3대 합병증 예측…서울대병원, 수술 위험 예측 AI 개발
서울대병원이 수술 전 16개 기본 검사 항목만으로 급성신손상, 호흡부전, 입원 중 사망 등 세 가지 주요 합병증을 동시에 예측하는 인공지능(AI) 모델을 개발했다. 평균 예측 정확도(AUROC)는 0.82~0.91로 기존 단일 예측 모델보다 우수한 성능을 보였다.
서울대병원 마취통증의학과 윤현규·융합의학과 이현훈 교수 연구팀은 수술 환자 8만여 명의 임상 데이터를 기반으로, 세 가지 합병증을 동시에 예측하는 다중 작업 머신러닝 모델(MT-GBM)을 개발했다고 10일 밝혔다.
수술 환자의 약 40%는 급성신손상이나 호흡부전 등 합병증을 경험하며, 이는 입원 기간과 의료비 부담을 늘리고 회복 속도를 떨어뜨린다.
이번 연구는 수술 전 단계에서 여러 위험 요인을 동시에 고려할 수 있는 모델을 제시했다는 점에서 의미가 크다. 기존의 AI 예측 모델은 한 가지 합병증만 다루는 경우가 많아 실제 임상 적용에는 한계가 있었다.
모델은 서울대병원 데이터를 학습하고, 노원을지대의료원·고대구로병원 데이터를 통해 외부 검증을 수행했다. 연구팀은 수술 전 전자의무기록(EHR)에 포함된 16개 항목만을 변수로 활용했다.
기존 연구들은 보통 수십~수천 개의 변수를 사용하지만, 이번 모델은 ▲연령 ▲성별 ▲체질량지수(BMI) ▲마취 시간 ▲수술 유형 ▲미국마취과학회 신체 상태 분류(ASA class) ▲혈액검사 수치(헤모글로빈, 크레아티닌, 알부민, 백혈구 등) 등 최소한의 변수만을 적용해 실용성을 높였다.
서울대병원·노원을지대의료원·고대구로병원 등 세 기관에서 검증한 결과, 평균 예측 정확도(AUROC)는 급성신손상 0.82, 호흡부전 0.91, 입원 중 사망 0.89로 나타났다. AUROC는 0에서 1 사이의 값으로, 0.9 이상이면 ‘매우 우수’, 0.8~0.9는 ‘우수’로 평가된다.
모든 코호트에서 예측 성능이 일관되게 유지돼, 다양한 의료 환경에서도 적용 가능성이 확인됐다.
연구팀은 AI의 판단 근거를 확인하기 위해 ‘샤플리 가산 설명법(SHAP)’을 적용했다.
그 결과, 긴 마취 시간과 낮은 혈중 알부민 농도가 세 가지 합병증 모두에서 공통으로 큰 영향을 미치는 변수로 나타났다. 마취 시간이 길수록 수술이 복잡하고, 알부민 수치가 낮을수록 영양 상태와 회복 능력이 떨어질 수 있다는 점이 반영된 결과다.
윤현규 교수(마취통증의학과, 제1저자)는 “수술 전 진료 단계에서 바로 활용할 수 있는 최소 정보 기반의 예측 모델을 개발했다”며 “복잡한 딥러닝 모델보다 예측 과정이 투명하게 해석돼 신뢰도를 높일 수 있다”고 말했다.
이현훈 교수(융합의학과, 교신저자)는 “여러 병원에서 일관된 성능을 보였다는 점에서, 인공지능이 실제 의료 현장에서 도움이 될 수 있음을 보여주는 중요한 사례”라며 “향후 전자의무기록 시스템과 연동해 수술 전 환자 맞춤형 위험 예측 도구로 발전시킬 계획”이라고 밝혔다.
이번 연구 결과는 국제 학술지 ‘npj Digital Medicine(IF 15.1)’에 게재됐다.
다만 이번 연구는 후향적 데이터 분석을 기반으로 한 것으로, 실제 임상 적용을 위해서는 전향적 검증이 추가로 필요하다.
서울대병원은 향후 전향적 임상 연구를 통해 실제 진료 현장 적용 가능성을 검증할 예정이다.