닫기

디지털헬스

“아이 숨소리로 호흡기 질환 진단” 분당서울대병원, 트랜스포머 기반 AI 모델 개발

기사입력 2025.04.10 09:45
  • 아이의 ‘쌕쌕’거리는 숨소리로 천식 등 호흡기 질환의 진단을 돕는 인공지능(AI) 모델이 개발됐다.

    분당서울대병원 소아청소년과 김경훈 교수팀은 소아 환자의 천명음(wheezing)을 분류할 수 있는 트랜스포머(Transformer) 기반 인공지능(AI) 모델을 개발하고, 기존 방식보다 우수한 성능을 입증했다고 10일 밝혔다. 

    천명음은 기도가 좁아지거나 막혀 발생하는 고음의 ‘쌕쌕’거리는 호흡음이다. 주로 소아 천식이나 만성 폐쇄성 폐질환 등의 호흡기 질환에서 나타나 호흡기 질환 조기 진단에 중요한 지표이지만, 현재는 주로 청진기를 통한 의료진의 청취에 의존하고 있어 숙련도에 따라 진단 정확도에 편차가 발생하는 문제가 지적돼 왔다.

    지금까지는 이를 보완하기 위해 소리를 이미지처럼 분석하는 AI 기술인 합성곱신경망(CNN) 모델을 활용한 연구가 주로 진행되었다. 하지만 CNN은 소리를 특정한 짧은 시간 단위로만 분리·분석하는 구조로 호흡 전체의 흐름이나 앞뒤 연결 관계를 파악하는 데에는 한계가 있었다.

    김경훈 교수팀은 이러한 구조적 한계를 개선하기 위해 트랜스포머 기반의 ‘호흡음 분석 변환 모델(Audio Spectrogram Transformer, AST)’을 개발했다. 트랜스포머란 구글이 자연어처리를 위해 발표한 언어모델로, 음성인식, 이미지 처리, 나아가 복합적이고 추상적인 패턴 등의 처리에도 적용이 가능하고 ‘ChatGPT’ 등 다양한 분야에서 사용되고 있다.

  • AST 모델이 천명음(W)에는 강하게 반응하지만, 정상호흡(B)과 소음(N)에는 미미하게 반응하고 있다. /이미지 제공=분당서울대병원
    ▲ AST 모델이 천명음(W)에는 강하게 반응하지만, 정상호흡(B)과 소음(N)에는 미미하게 반응하고 있다. /이미지 제공=분당서울대병원

    AST 모델은 호흡음을 멜 스펙트로그램(Mel Spectrogram) 형태로 변환한 후, 이를 16×16 크기의 조각 단위로 나누어 각 조각 간의 관계를 학습하도록 설계되었다. 이 방식은 전체적인 문맥 정보를 고려할 수 있어, 부분 정보에만 의존하는 기존 CNN 방식보다 정밀한 분류가 가능하다.

    연구팀은 천명음 194건과 기타 호흡음(531건) 총 725건의 데이터를 수집해, 80%는 학습용, 20%는 성능 비교용으로 활용했다. 천명음 여부는 두 명의 소아 폐 전문의가 독립적으로 판정한 결과를 기준으로 했다.

  • 자료 출처=분당서울대병원
    ▲ 자료 출처=분당서울대병원

    분류 성능을 평가한 결과, AST 모델은 정확도 91.1%, 정밀도 88.2%, F1-Score 82.1%를 기록하며 CNN 모델(정확도 83.6%, F1-Score 65.7%)보다 우수한 성능을 보였다. 특히 AST는 정상 호흡음이나 소음에는 낮은 반응을 보이며 천명음에만 선택적으로 반응하는 특징도 나타났다.

    연구팀은 “AST 모델은 호흡음의 전체 문맥을 학습할 수 있도록 설계돼, 소리의 전후 관계를 반영한 정밀한 분류가 가능하다”고 설명했다.

    또한 AST 모델은 전처리 과정에서 데이터 손실이 적고, 경량화 설계를 통해 모바일 기기에서도 구동이 가능하다. 이는 임상 현장에서 빠른 진단뿐 아니라, 의료 접근성이 낮은 지역에서도 활용될 가능성을 높이는 요소로 평가된다.

    김경훈 교수는 “소아는 성인보다 폐포의 표면적이 작아 호흡기 질환에 취약한 만큼, 천명음을 정확히 구분하는 것은 조기 진단에 매우 중요한 요소”라며 “이번 연구를 통해 AI 기반 AST 모델의 임상 적용 가능성을 확인했다”고 밝혔다.

    이어 “향후 스마트기기 기반의 실시간 진단 도구 개발과 함께, 의료 인프라가 부족한 지역에서도 정확한 진단을 지원할 수 있도록 후속 연구를 이어갈 계획”이라고 덧붙였다.

    한편, 이번 연구는 네이처(Nature) 출판 그룹의 온라인 학술지 ‘Scientific Reports’에 최근 게재됐다.

위로