노을, AI로 생성한 고품질 백혈구 이미지 데이터셋 공개
노을 주식회사(대표 임찬양, 이하 ‘노을’)가 자사의 고체 염색 기술, 디지털 이미징 시스템 통해 구축한 고품질 이미지 데이터 셋 26,000여 개를 공개했다.
노을은 자사의 혈액 분석 솔루션 miLab™ BCM으로 생성한 백혈구 이미지 분류 데이터 셋에 대한 AI 논문이 Nature 자매지 사이언티픽 데이터(Scientific Data)에 게재됐다고 21일 밝혔다.
공개된 ‘백혈구의 분류를 위한 대규모 멀티포커스 데이터셋’은 서울아산병원에서 확보한 혈액 표본 72개를 마이랩으로 촬영하여 총 25,773개 이미지 스택을 제공한다. 이미지 라벨은 18종류의 정상/비정상 혈액 세포를 포함하고 있으며, 각 라벨은 판독 전문가 두 명이 검수했다. 각 이미지는 50배율 현미경으로 400nm 간격, 10개의 z-스택을 통해 촬영되었다. 더불어 마이랩에 탑재된 딥러닝 모델을 활용해 라벨 정확성에 대한 검증을 수행했다.
노을은 해당 데이터셋이 현재 사용 가능한 여러 오픈 데이터셋과 비교했을 때 최초로 초점별 영상(focus stack)을 포함했으며, 다양한 18개 세포 타입과 방대한 양의 데이터를 제공한 것이 특징이라고 설명했다. 이어 자사만의 고체 염색(NGSI) 기술과 완전히 자동화된 이미지 취득을 통해 구축하여 공개한 최초의 대규모 고품질 백혈구 이미지 데이터셋으로 질적인 우월함으로도 기존 연구의 한계를 뛰어넘었다는 평가를 받고 있다고 전했다.
노을 임찬양 대표는 “miLab™ BCM은 세계 최초의 완전 자동화 AI 기반 혈액검사 솔루션으로 혈액검사를 시행하는 모든 의료기관뿐만 아니라 채혈실에서 전문가 없이 사용할 수 있도록 소형화, 경량화한 대체 불가능한 제품”이라며 “당사의 독보적인 기반 기술을 활용하여 만든 miLab™ BCM을 활용하여, 혈액암 등 다양한 암종의 조기 진단 영역까지 확장할 수 있는 AI 이미징 바이오마커 연구 개발에 힘쓸 것”이라고 말했다.
연구를 공동으로 진행한 성균관대학교 삼성융합의과학원 정규환 교수는 “본 연구에서 miLab™ BCM을 이용해 대규모의 고품질 백혈구 이미지 데이터셋을 생성하고 검증할 수 있다는 점이 입증되었다. 이는 기존의 자동화 분석 시스템이 가지는 한계를 극복한 것으로 기술적인 우월성과 혁신성이 확인된 것”이라며, “특히, 각 이미지가 10개의 다중 초점 영상으로 구성되어 기존 데이터셋과 차별화된 가치를 제공할 것으로 기대하며, 데이터셋은 약지도 학습(Weakly-supervised learning) 등 다양하고 새로운 의료 AI 모델 개발에 활용될 수 있어 백혈구 감별검사 자동화 연구에 새로운 지평을 열 것”이라고 기대했다.
한편, 노을은 이번 논문을 통해 전체 데이터셋을 오픈소스로 완전히 공개한다. 회사는 의료 AI 연구자를 위한 질 높은 데이터셋 제공을 통해 디지털 헬스케어 분야의 연구와 개발을 촉진할 것으로 기대했다.