테크

음성 인식 자막, 자동점역변환 등…교육 분야 인공지능(AI) 융합 사업 봇물

기사입력 2021.07.09 17:03
  • 최근 다양한 분야에서 인공지능(AI) 기술 융합이 활발하게 이루어지는 가운데, 교육 분야에서도 AI 기술을 통한 서비스 고도화가 속속 진행되고 있다.

    AI 기반 원격화상 수업 실시간 자막지원 서비스

    인공지능 테크기업 코난테크놀로지는 지난달 10일 교육부 국립특수교육원의 ‘2021년 AI기술기반 음성인식 자막지원 프로그램 개발 사업’의 수행기업으로 최종 선정됐다.

  • 이미지 제공=코난테크놀로지
    ▲ 이미지 제공=코난테크놀로지

    이번 사업은 비대면·온라인 교육이 보편화한 요즘 균등한 교육 기회를 제공하기 위한 ‘장애학생 맞춤형 원격교육 지원 사업’의 세부 사업으로, 청각장애학생을 위해 원격화상 수업 시 음성인식을 통한 실시간 자막지원 서비스를 제공하기 위해 추진됐다.

    주요 수행 내용은 신규 도입 예정인 장애학생 원격교육 플랫폼과 연계된 AI 음성인식 자막지원 프로그램을 개발하는 것이다. 이 과정에서 음성인식(AI Voice Recognition) 및 딥러닝기반(Deep Neural Networks)의 음향모델이 적용되는 동시에 클라우드 기반 플랫폼인 화상강의 시스템과 학습관리 시스템(LMS)간의 원활한 연계를 위해 국제표준(de-facto standard) 수준의 연동 인터페이스도 제공할 예정이다.

    코난테크놀로지는 AI 음성인식 기반의 온라인 자막자동생성 솔루션(D:Listener)을 통해 청각장애인, 외국인, 학습부진 학생 등 취약계층을 대상으로 평등한 교육기회를 제공하고 있으며, 초·중·고·대학교 등 학교 내 인공지능 기반의 지능형 콘텐츠관리 플랫폼과 스마트캠퍼스 구축용 챗봇 서비스로 지난해 10월 디지털 뉴딜 우수사례에 선정된 바 있다.

    점자책 대신하는 자동 점역변환 AI 기술

    주식회사 닷은 한국시각장애인연합회, 한국점자도서관, 도서출판점자, 주식회사 펍플, 부산가톨릭대학교와 컨소시엄(이하 닷 컨소시엄)을 구성해 시각장애인에게 다양한 콘텐츠를 제공하기 위한 서비스를 공동 개발한다.

  • 시각장애인을 위한 스마트 독서지원서비스 플랫폼 /이미지 제공=주식회사 닷
    ▲ 시각장애인을 위한 스마트 독서지원서비스 플랫폼 /이미지 제공=주식회사 닷

    이번 서비스 개발은 장애인·노인 등 사회적 약자가 겪는 생활 속 어려움을 지능정보기술로 해결하기 위해 과학기술정보통신부가 지원하고, 한국지능정보사회진흥원(NIA)이 전담하는 ‘2021년 사회현안해결 지능정보화사업’의 하나다. 닷 컨소시엄은 이번 사업을 통해 시각장애인 책이나 대학 전공 서적을 점자책으로 받아 읽기 위해 신청·제작·배급해서 받기까지 평균 3개월 이상의 시간이 걸리는 문제점을 해결하는 핵심 과제를  'AI 디지털 자동 변환 기술 및 온라인 플랫폼'으로 구현한다.

    새롭게 구축 될 본 온라인 플랫폼은 전공서적을 변환하는 서비스를 시작으로, 교육, 직업, 예술, 엔터테인먼트 등 시각장애인을 위한 다채로운 콘텐츠 변환을 계획하고 있다. 플랫폼의 핵심 기술은 주식회사 닷에서 개발한 ‘세계 최초 촉각 패드(닷 패드)’로 STEM 교육 및 다양한 대학 전공 과목 학습에 필요한 다양한 그래픽을 변환/출력해 실제 촉각으로 만질 수 있도록 보여줄 수 있다.

    NIA 담당자는 "자동점역변환 AI기술을 이용하여 시각장애학생들이 필요한 학습 교재를 적시에 대체자료로 제공 받아 학습의 권리 보장에 폭넓게 기여했으면 좋겠다"라고 밝혔다. 시각장애인 대학생협회 배현진 회장은 "꿈으로만 생각해왔던 것들이 이렇게 빠르게 현실이 될지 몰랐다며, 많은 시각장애인 학생들이 이 촉각디스플레이를 통한 독서지원서비스가 가져 올 변화를 고대하고 있다"고 말했다.

    AI 기반 풀이 검색 및 학습 추천

    지난 2017년 AI 기반 풀이 검색 기능을 도입한 이후 큰 인기를 얻은 에듀테크 기업 매스프레소는 최근 560억 규모의 시리즈 C 투자를 유치했다.

  • 이미지 제공=매스프레소
    ▲ 이미지 제공=매스프레소

    가장 효과적인 교육을 모두에게 제공한다는 미션으로 한국어와 수식을 동시에 인식하는 AI 기반의 광학문자판독(OCR) 기술을 자체 개발한 매스프레소는 코로나19 이후 교육의 디지털화가 가속화하며, 오프라인으로만 가능했던 맞춤형 교육이 앞으로 온라인에서 더 효율적으로 구현될 것이라고 전망했다.

    실제로 콴다는 높아진 비대면 교육 서비스 니즈와 스마트폰 보급 확산세에 맞물려 전년 대비 5배 이상의 MAU 성장세를 보였다. 매스프레소는 통합적 교육 플랫폼의 수요를 확인하고 올해 상반기에는 동영상 해설 패키지를 제공하는 콴다 프리미엄 구독 기능을 출시, 하반기에는 실시간 비대면 교육 솔루션 ‘콴다 클래스’와 콴다 커뮤니티 등 신기능을 확장할 계획이다. 베트남에서는 오프라인 학생-학원 관리 플랫폼인 콴다 스터디 센터를 운영 중이며, 학원 프랜차이즈 사업과 학습 콘텐츠 제작 및 유통에 힘쓰고 있다.

    매스프레소는 이번 투자를 통해 전략국가의 트래픽 확보, 신사업 확장, 그리고 학습 추천 알고리즘 기술 고도화를 위한 핵심 인재 영입에 나설 계획이다.

    저품질 문서도 문제없는 AI 이미지 텍스트 인식기술

    한편, 스마트워크 전문기업 ㈜이파피루스는 인공지능 기술을 결합해 사람처럼 문맥을 파악하고, 글자를 인식하는 이미지 내 텍스트 인식기술(Optical Character Recognition, 이하 OCR) 제품을 출시했다.

  • 구겨진 문서에서 진행한 OCR 테스트 결과. (위)타사 제품, (아래)이파피루스 TextSense /이미지 제공=㈜이파피루스
    ▲ 구겨진 문서에서 진행한 OCR 테스트 결과. (위)타사 제품, (아래)이파피루스 TextSense /이미지 제공=㈜이파피루스

    ‘텍스트센스’의 가장 큰 특징은 텍스트를 문장 단위로 인식한다는 점이다. 대부분의 AI OCR 제품이 단어 단위로 데이터를 학습한 AI를 사용하는 것과 달리, ‘텍스트센스’에는 문장 단위로 데이터를 학습한 AI가 적용되어 있다. 이로 인해 문서 이미지에 포함된 텍스트를 단어나 개별 글자 단위가 아닌 행 단위로 인식하고, 문장 데이터를 학습하는 과정에서 자연스럽게 익힌 문맥 파악 능력을 바탕으로 흐릿한 글자도 맥락상 자연스러운 글자로 읽어낸다.

    실제로 다양한 상태의 문서 이미지로 진행한 이파피루스 자체 테스트 결과, ‘텍스트센스’는 평균 95.7%의 우수한 정확도를 보였다. 특히 타 제품의 경우 얼룩지거나 해상도가 낮은 문서, 인쇄 불량으로 노이즈가 많거나 잉크가 흐릿하게 찍힌 문서에서는 텍스트 인식률과 정확도가 현저히 떨어지는 반면, ‘텍스트센스’는 저품질 문서에서도 스캔본이나 사진, 팩스와 같은 깨끗한 문서 이미지와 비슷한 수준으로 텍스트를 정확하게 인식하는 안정성이 장점이다.

    ‘텍스트센스’는 영어를 기반으로 한 외산 제품 대비 한글 인식률이 우수하며, 멀티스레드 방식을 적용해 대량의 문서 작업도 분산해서 빠르고 안정적으로 처리할 수 있다. 정형화된 문서뿐만 아니라 다양한 레이아웃의 서식을 인식하고 정보를 추출할 수 있어 종이 문서의 전자문서화는 물론 로보틱 프로세스 자동화(RPA), 문서 자동 분류와 데이터 검증 등 폭 넓게 활용할 수 있다.

최신뉴스