테크

포티투마루, 인공지능 OCR-NLP 솔루션 ‘텍스탠딩’ 출시

기사입력 2022.02.28 17:15
AI 딥러닝 키밸류 추출로 기존 기술 수작업 의존도 보완, 효율성 개선
  • 인공지능 앤서링(Answering) AI 스타트업 포티투마루가 인공지능 광학문자인식-자연어처리(OCR-NLP) 솔루션 ‘텍스탠딩’을 출시했다고 28일 밝혔다.

    텍스탠딩(Textanding)은 문서(Text)의 이해(Understnading)라는 의미로, 인공지능 딥러닝 기술을 이용해 기존의 기술을 한 단계 발전시킨 솔루션이다.

  • 제공=포티투마루
    ▲ 제공=포티투마루

    광학문자인식(OCR) 솔루션은 문서내 글자를 인식할 수 있지만 구조화된 정보를 얻을 수 없어 체계적인 정보 구축을 위해서는 추가적인 처리 방법이 요구된다. 이때 사용되는 것이 인지된 기호를 우리가 평소 사용하는 언어로 바꿔주는 자연어처리(NLP) 기술이다.

    그러나 기존의 기술은 문서내 줄 바뀜이나, 배경의 음영, 점, 문서 오염, 수기 작성 문자 등을 잘못 이해하는 경우가 많아 추출 후 정제 과정에서의 수작업 의존도가 매우 높았다. 신규 비정형 문서나 위치 값이 변동될 때도 매번 추가 개발이 필요했다.

    이러한 단점을 보완하기 위해 포티투마루는 인공지능 기술을 이용해 다양한 서식을 자동으로 인식하고 수정 및 교정, 분류할 수 있으며, 딥러닝 기술로 핵심 데이터 추출률과 문서 양식을 지속적으로 확대할 수 있는 AI OCR-NLP 솔루션 ‘텍스탠딩’을 내놓았다.

    포티투마루의 텍스탠딩은 문서에서 필요한 항목명과 값을 자동으로 추출한 후 구조화하여 데이터베이스(DB)에 저장한다. 저장된 DB는 업무에 활용 가능한 형태로 사용자에게 제공된다. 이때 정보는 사용자가 확인할 수 있는 UI를 통해 신뢰도 및 오류를 지속적으로 관리할 수 있다. 신규 문서의 경우 별도의 프로그래밍 없이 사용자가 손쉽게 학습데이터를 구축하고 활용할 수 있다.

    포티투마루 김동환 대표는 “텍스탠딩은 한 번 학습한 문서의 핵심 항목은 100% 인식이 가능하기 때문에 신규 추가 양식의 학습에만 집중하면 된다”라며, “비정형 자료의 데이터 추출시 평균 93% 이상의 정확도로 자동 구조화가 가능하고, 학습 기반의 딥러닝 기술로 인식률과 정확도, 대상 문서 범위 역시 지속적으로 확대될 예정”이라고 말했다.

최신뉴스