-
최근 의료 분야에서 인공지능(AI) 활용이 활발하지만, 진단 정확성을 위해서는 전문 AI 의료 솔루션을 사용하는 것이 필요할 것으로 보인다. 의료 인공지능 전문기업 딥노이드(대표 최우식)가 자사의 전문 의료 AI 솔루션과 범용 AI인 ChatGPT의 흉부 X-ray 판독 성능을 비교한 연구 결과, 진단 정확성에서 큰 차이를 보였기 때문이다.
딥노이드는 의료 AI 관련 전문가인 인하대병원 영상의학과 이로운 교수팀과 공동으로 진행한 ‘딥노이드의 M4CXR과 OpenAI의 ChatGPT 간 흉부 X-ray 해석 성능 비교에 관한 연구’가 SCI급 국제 공인 학술지 ‘Journal of Clinical Medicine’에 게재됐다고 27일 밝혔다.
-
딥노이드가 개발한 M4CXR은 흉부 X-ray 영상을 분석해 판독문 초안을 생성하는 거대 언어 모델(LLM)로 설계된 클라우드 기반의 의료 AI 솔루션이다.
이로운 교수는 M4CXR과 Chat GPT의 판독 결과를 ▲정확도 ▲위양성 ▲위치 오류 ▲개수 오류 ▲환각 등 다섯 개 지표로 평가했다. 평가 결과, M4CXR은 모든 평가 항목에서 ChatGPT보다 일관되게 우수한 성능을 보였다. 특히 위치 정확성(76~77.5%)에서 ChatGPT(36~36.5%)를 크게 앞섰다. 진단 정확성 측면에서도 M4CXR(60~62%)은 ChatGPT(42~45%)보다 월등히 우수한 성능을 보였다.
딥노이드는 이번 모델에 그동안 쌓아온 노하우를 반영해 흉부(Chest)에 특화한 도메인과 데이터 구성을 적용했으며, ChatGPT와는 기능적인 차이가 있다고 설명했다. 회사에 따르면, M4CXR는 다양한 각도의 x-ray 영상을 고려해 판독을 진행하고, 기존 영상과 비교해서 추적관찰 가능한 판독문을 생성하는 등 흉부 x-ray 판독에 최적화한 기능을 갖췄다.
회사는 이번 연구가 전문 의료 영역에서 범용 AI보다 전문 AI 솔루션을 활용하는 것이 적합하다는 것을 확인한 것이라며, 향후 M4CXR가 실제 의료 현장에서 사용될 경우 진단 워크플로를 최적화하고 의료 전문가의 역량을 보완할 것으로 기대한다고 전했다.
이로운 교수는 "이번 연구를 통해 의료 영역에서 M4CXR의 진단 보조 도구로의 잠재력을 확인할 수 있었다”며, “특히 위치 정확도와 진단 정확성에서 보여준 우수한 성능은 실제 임상 현장에서 큰 가치를 발휘할 것"이라고 평가했다. 이어 “향후 실제 전문의와의 판독 비교 연구를 통해 M4CXR의 임상적 유효성을 더욱 강화하고, 이를 바탕으로 진단의 정확도와 효율성을 한층 높여나갈 계획"이라고 밝혔다.
딥노이드 최우식 대표이사는 "2025년 상반기 상용화를 목표로 영상 판독 시장 진출을 준비하고 있다"며, "전 세계 영상판독 시장이 2030년까지 연평균 23.7% 성장해 약 56조원 규모로 성장할 것으로 전망되는 만큼, M4CXR을 통해 시장을 선도해 나갈 것"이라고 말했다.
- 김정아 기자 jungya@chosun.com