잘 찾는 AI만으론 부족…유럽 연구가 짚은 폐암 검진 AI의 새로운 경쟁력
의료 인공지능(AI) 시장의 경쟁 기준이 변화하고 있다. 과거에는 폐 결절을 얼마나 정확하게 찾아내는지가 핵심이었다면, 최근에는 국가 단위 검진 프로그램 안에서 실제로 활용될 수 있는 운영 역량과 워크플로 지원 능력이 새로운 경쟁 요소로 부상하고 있다는 분석이 나왔다.
최근 유럽 영상의학 분야 국제학술지 European Radiology에는 유럽 시장에서 사용 중인 CE 인증 폐암 검진 AI 제품 16종을 대상으로 기능 범위와 임상 근거 수준을 비교 분석한 논문이 게재됐다.
이번 연구는 기존 AI 연구와 접근 방식이 달랐다. 개별 제품의 진단 정확도나 민감도, 특이도를 비교하기보다 실제 폐암 검진 프로그램 운영에 필요한 기능을 얼마나 지원하는지에 초점을 맞췄다.
연구진은 폐암 검진 AI의 주요 기능을 ▲결절 탐지(nodule detection) ▲결절 분류(classification) ▲정량 측정(measurement) ▲성장 평가(growth assessment) ▲악성도 예측(risk estimation) ▲구조화 관리(structured management) 등 6개 영역으로 구분해 평가했다.
분석 결과 16개 제품 가운데 14개가 결절 탐지와 정량 측정 기능을 지원했으며, 12개는 이전 검사와 비교한 성장 평가 기능을 제공했다. 악성도 예측 기능을 지원하는 제품은 9개였다. 반면 기관지 내 병변(endobronchial lesion)이나 낭성 병변(cystic lesion)을 지원하는 제품은 없었다.
분석 대상에는 지멘스 헬시니어스, 딥헬스, 메비스 메디컬 솔루션스 등 글로벌 기업과 코어라인소프트, 뷰노, 제이엘케이 등 국내 기업의 제품도 포함됐다.
연구진은 대부분의 상용 AI가 폐암 검진의 핵심 업무를 지원할 수 있는 수준에 도달했지만, 실제 검진 프로그램에서 요구되는 모든 기능을 충족하는 제품은 없다고 평가했다. 특히 유럽 폐암 검진 권고안(EUPS) 기준에서는 높은 기능 범위를 보인 제품이 많았지만, 기관지 내 병변이나 낭성 병변까지 포함하는 일부 가이드라인 기준에서는 기능 공백이 확인됐다.
이는 의료 AI 시장이 새로운 단계에 진입하고 있음을 보여주는 신호로 해석된다. 초기 의료 AI 시장에서는 알고리즘의 정확도 자체가 경쟁력이었다면, 실제 국가 검진 사업이 확대되는 단계에서는 추적 관리, 구조화 보고서 작성, 판독 표준화, 품질 관리(QA) 등 운영 요소가 중요해지고 있기 때문이다.
이러한 변화는 스마트폰 시장의 진화 과정과도 닮았다. 초기 스마트폰 시장이 카메라 성능이나 프로세서 성능 경쟁에 집중했다면, 기술이 상향 평준화된 이후에는 운영체제(OS), 앱 생태계, 사용자 경험 등이 차별화 요소로 떠올랐다. 폐암 검진 AI 역시 단순 결절 탐지 성능을 넘어 실제 검진 시스템 안에서 얼마나 효율적으로 작동하는지가 중요한 경쟁력으로 부상하고 있다는 분석이다.
실제 영국의 폐암 검진 프로그램은 AI를 이중 판독(second reader) 또는 동시 판독(concurrent reader) 방식으로 활용하고 있으며, 독일은 2024년 폐암 검진 규정에서 컴퓨터 보조 검출과 정량 측정을 요구하고 있다. 연구진은 이러한 변화가 AI를 단순 보조 도구가 아닌 검진 인프라의 일부로 편입시키고 있다고 설명했다.
다만 연구는 현재 상용 폐암 검진 AI 시장의 한계도 함께 지적했다.
연구진이 검토한 60편의 관련 논문 가운데 70%는 진단 정확도를 평가한 연구였으며, 전향적 연구는 7%에 불과했다. 환자 예후 개선 효과를 평가한 연구나 사회·경제적 영향을 분석한 연구는 확인되지 않았다.
또한 이번 분석은 제조사 설문과 공개 자료를 바탕으로 제품 기능을 정리한 것으로, 개별 기능의 임상적 효과를 직접 검증한 연구는 아니다. 연구진 역시 기능 범위(task coverage)는 제품이 지원하는 기능의 범위를 보여주는 지표일 뿐, 임상 효과나 실제 성능을 의미하지 않는다고 설명했다.
연구진은 논문에서 현재 상용 AI 제품들이 폐암 검진에 필요한 상당수 기능을 지원하고 있지만 기능 공백과 제한적인 전향적 근거가 남아 있다고 평가했다. 또한 실제 국가 검진 환경에서 임상 효과와 운영 영향을 평가하는 후속 연구가 필요하다고 밝혔다.
이번 연구는 특정 제품의 우수성을 평가하기보다 폐암 검진 AI 시장이 정확도 경쟁을 넘어 운영과 통합의 단계로 이동하고 있음을 보여주는 현황 보고서에 가깝다. 다만 연구진은 실제 환자 예후 개선 효과를 평가한 연구는 확인되지 않았으며, 국가 폐암 검진 환경에서의 전향적 검증이 필요하다고 지적했다.