인더스트리

[AI 기업탐방] 렉스퍼, AI로 대학 교수도 만족한 영어 문제 제작

기사입력 2023.02.10 16:59
영어 문제 자동생성 AI ‘ATM’ 개발… 비상교육 영어시험평가·문제지 제작 참여
세계 최고 권위 AI 학회에서 연구 성과 인정, 글로벌 은행과 기술 수출 논의
  • 인공지능(AI)이 일상에 적용되기 시작하면서 그 관심도 뜨거워지고 있습니다. 하지만 아쉬운 부분도 있습니다. 세간에 관심받는 AI 기술이 글로벌 빅테크 기업이나 대기업 위주라는 점입니다. 국내에는 알려지지 않았지만 훌륭한 기술력을 갖춘 숨은 고수들이 정말 많은데도요. 그래서 ‘AI 기업탐방’ 시리즈를 준비했습니다. 기술력과 경쟁력으로 중무장한 국내 AI 기업을 소개합니다. 독자 여러분들의 많은 관심 바랍니다. - 편집자 주
  • AI 스타트업 ‘렉스퍼’는 자체적으로 영어 문제 생성 AI 모델을 만들어 상용화했다. /렉스퍼
    ▲ AI 스타트업 ‘렉스퍼’는 자체적으로 영어 문제 생성 AI 모델을 만들어 상용화했다. /렉스퍼

    인공지능(AI) 기술이 발전하면서 교육에도 새로운 혁신이 요구되고 있다. 대표적인 사례가 AI로 시험과 과제를 대체하는 학생들이 증가했다는 것이다. 최근 국내 수도권의 한 국제학교에서는 대화형 AI ‘챗GPT’를 이용해 영문 에세이를 작성한 학생들이 적발돼 전원 0점 처리됐다. 한국문학번역원이 지난해 12월 개최한 ‘2022 한국문학번역상’에선 신인상 수상자가 AI 기능이 탑재된 번역기를 사용했다는 점이 알려지면서 논란이 일었다. 그러면 시험에 사용되는 AI는 학생들만의 전유물일까, 교사나 시험출제자가 AI로 문제를 만들 순 없을까? 

    이미 문제를 내는 AI 모델을 만들어 상용화한 AI 스타트업이 있다. AI 스타트업 ‘렉스퍼(LXPER)’다. 지난해, 영어 문제 자동생성 및 난이도 측정 AI 기술로 초중등 영어능력평가 시험을 만들고 관련 문제집도 냈다. 연구 내용은 세계 최고 권위의 자연어처리(NLP) 학회에 소개되고, 기술은 해외 수출까지 논의 중이다. 신동광 광주교대 교수는 이 기술들을 바탕으로 만든 서비스를 실제 예비교사에게 사용하게 하고 연구 결과를 논문으로 출판했다. 서울시 강남구에 소재한 렉스퍼 사무실에 방문, 관련 기술을 알아보았다.

    ◇영어 문제 자동생성 AI 개발, 실제 평가시험에 사용

    렉스퍼가 제작한 영어 문제 자동생성 AI 모델 이름은 ‘ATM(AI Test Maker)’이다. 학교 시험이나 수능에 나오는 문제를 5초 남짓으로 만들어낸다. 객관식, 주관식 시험에 나오는 문제 유형 중 실제 수능과 학교 내신의 핵심 유형들을 만들 수 있다. 일례로 지문에서 빈칸이 들어갈 위치를 찾아 여기에 들어갈 만한 단어나 구절 등의 객관식 보기를 만들어낸다. 실제로 지난해 수능 영어영역에 나온 33번 문제의 경우 같은 지문을 ATM에 입력했을 때 수능 문제와 똑같은 자리에 빈칸을 만들어냈다.

  • 2023학년 수능 33번 빈칸추론 지문을 AI로 문제 낸 결과 실제 시험과 같은 위치에 빈칸을 표기했다. /렉스퍼
    ▲ 2023학년 수능 33번 빈칸추론 지문을 AI로 문제 낸 결과 실제 시험과 같은 위치에 빈칸을 표기했다. /렉스퍼

    렉스퍼의 기술은 현재 시중에 나와 있는 문제 생성 AI 모델들과 차별된다. 기존 모델의 경우 대부분 주관식이다. 글쓰기를 하면 이를 첨삭해 알려주는 수준이다. 지문 안에 괄호를 넣거나 5지 선다형 문제를 만들어내는 것은 못 한다. 하지만 렉스퍼는 실제 수능에 나오는 모든 유형의 문제를 AI로 만들 수 있게 기술을 구축했다.

    렉스퍼는 지난해 ATM을 기반으로 비상교육과 영어능력평가 시험 ‘VPEAT’을 제작했다. 수준별로 5개 레벨을 만들어 현재 초·중등 학생들의 영어 실력 수준을 파악하고 미래 성적 예측을 도와주는 시험이다. 1년에 4번 시행한다. 지난해 7월 처음 시행돼 현재 두 차례의 시험이 진행됐다. 시험 문제는 기술과 전문가의 협업으로 제작된다. ATM을 활용해 AI로 수준별 영어 문제를 만들고, 이를 자체 난이도 판별 엔진을 통해 난이도를 재검증한다. 이어 이석재 연세대 영문학과 교수 등 출제 전문가들이 해당 문항을 보완하고 다듬어 문제를 완성한다. AI가 문제를 만들고 출제위원은 검토하는 식이기 때문에 문제를 만드는 데 들어가는 시간이 크게 단축된다. 

    이형종 렉스퍼 대표는 “수준별로 문제를 만드는 것은 손이 많이 가는 일”이라면서 “AI가 각 수준에 적합한 문제를 만들어내기 때문에 출제 정확도가 높고 작업도 효율적으로 이뤄진다”고 말했다. 이어 “아무것도 없는 상황에서 5개월도 채 안되는 시간에 새로운 영어능력평가와 모의평가 문항집까지 만들고 두 차례 시험에 약 2만 명 학생이 참가했는데 시험 문제에 대해 항의가 들어온 적이 한 번도 없다”며 “이는 품질 높은 AI 기술과 전문가의 협업이 이상적임을 방증한 사례”라고 덧붙였다.

  • 렉스퍼는 비상교육과 영어능력평가 시험 ‘VPEAT’을 제작했다. /VPEAT 문서 캡처
    ▲ 렉스퍼는 비상교육과 영어능력평가 시험 ‘VPEAT’을 제작했다. /VPEAT 문서 캡처

    현재 렉스퍼는 VPEAT 시험 대비 기본서를 제작하고 있다. 이 문제집의 문제 역시 대부분AI기술을 활용하여 만들고 있다. 이 대표는 “기존 고등 대상의 AI문제 생성 엔진과 현재 VPEAT용 초중등 엔진은 다르기 때문에 새로운 유형의 문제를 만들 때, 시행착오를 또 겪으며 성장했다”며 “AI를 위한 지속적인 투자로 전문가 의존도는 작년대비 30% 수준으로 줄었다”고 말했다.

    ◇국제 최고권위 AI 학회 메인 컨퍼런스에서 발표, 연구 성과 입증

    렉스퍼가 영어 문제 자동생성 AI 모델을 만들 수 있었던 것은 데이터 영향이 크다. 이 대표는 영어 강사 출신이다. 20년 이상 강사로 근무하며 시험에 나오는 단어에서 영어 지문까지 그 수준을 일일이 분석했다. 이를 토대로 EBS를 포함하여 여러 출판사에서 어휘, 듣기, 독해 등 모든 영역에서 대표 저자로 활동했다. 이 자료가 모두 데이터인 것이다. 그는 “영어 강사들이 ‘이거 시험에 잘 나와’라며 강조하는 부분이 있지만 정작 얼마나 중요한지 수치 등을 활용해서 객관적으로 설명하지 못하는 경우가 많았다”며 “왜 이 단어나 문법이 ‘얼마나’ 중요한지를 분석하기 위해 자료를 모아 분석했는데 이 경험이 지금의 영어 문제 생성 AI 모델과 난이도 엔진을 만드는 기반이 됐다”고 설명했다.

    이 대표는 그동안 모은 방대한 데이터를 빠르게 분석하고, 이를 토대로 수준별 문제를 만들기 위해 AI 모델을 개발했다. 구글이 2018년과 2019년 각각 출시한 ‘버트’와 ‘T5’를 자연어처리(NLP) 모델을 만들었다. 버트와 T5는 구글이 공개한 언어모델이다. 구글이 최근 공개한 대화형 AI 모델 ‘바드’의 기반 모델인 람다와 같은 초거대 AI는 아니지만, AI 개발에 가장 보편적으로 사용되는 모델로 꼽힌다. 개발 과정은 쉽지 않았다. 단순히 정답을 맞추는 AI 모델이 아니라 문제를 내야 할 부분을 찾고 정답과 유사한 오답을 생성하고 난이도까지 고려해야하기 때문이다. 이 대표는 “버트로 시작해서 최근 GPT-3를 넘어 챗GPT까지 끊임없이 우리 엔진을 테스트하고 강화하고 있으며 그 다음 역시 대비하고 있다”며 “영어교육에 의미있는 일이라 생각했고 지금도 그렇게 믿고 있다”고 말했다.

    연구 성과는 세계적으로 인정받았다. 지난해 NLP 분야 세계 최고 권위 학회인 ‘EMNLP(자연어처리방법론 학회)’에 텍스트 가독성 평가를 주제로 한 논문을 제출, 메인 컨퍼런스 발표에 채택됐다. 올해에도 ‘유럽전산언어학학회(EACL)’에서 파인딩스 트랙(Findings track)으로 연구 내용을 발표한다. 99.8%의 높은 정확도로 범용적인 영문 난이도 평가 학습 솔루션에 관한 내용을 담은 논문이다. 올해 EACL은 5월 2일부터 6일까지 크로아티아에서 개최된다.

    렉스퍼가 발표한 논문은 실제 교육 분야에서 다양한 연구 목적으로 활용되고 있다. 신동광 광주교대 교수는 지난해 8월 렉스퍼의 ATM에 관한 논문을 작성했다. ‘GPT-3’ 기반 자동 지문 생성(ATG) 서비스와 ATM을 예비교사들이 각각 사용하게 하고 비교해 분석한 연구 내용이다. GPT-3는 1750억 개 파라미터(매개변수)를 보유한 거대 언어모델이다. 최근 인기인 챗GPT의 기반 모델인 GPT-3.5의 이전 모델이기도 하다. 오픈AI는 GPT-3에 보상과 처벌을 통해 AI가 올바른 결괏값을 내게 하는 강화학습을 적용, GPT-3.5를 만들었다. 이 대표는 “투자 금액부터 상당한 격차가 나는 빅테크 기업과 견준 자체로 영광이었다”며 “광주교대 연구 사례로 영어 교육에 있어 렉스퍼가 정말 좋은 활동을 하고 있구나라는 것을 다시금 느꼈다”고 했다.

    ◇초거대 AI 활용 연구 중… B2C 서비스 개발과 해외시장 진출 시동 

    렉스퍼는 현재 ATM을 T5, 버트를 넘어 GPT-3로 구현하는 연구도 진행하고 있다. AI 모델이 점점 커지는 추세고 그 기능이 빠르게 개선되고 있으므로 흐름에 따라야 한다는 전략에서다. 이 대표는 “90년대 기관총으로 최신 레이저 총을 이길 순 없다”며 “GPT-3와 같은 초거대 AI 모델을 사용하는 방안도 함께 연구하고 있다”고 말했다.

    그는 기존 버트, T5와 GPT-3를 사용했을 때 거대 모델이 놀라운 결과를 보여주긴 하지만, 통제가 어렵다고 밝혔다. 빈칸을 만들라고 지시하면 그 빈칸 뒷 내용까지 아예 변경해버리는 오류가 생긴다고 설명했다. “GPT-3와 챗GPT의 가장 큰 공통적인 문제는 어떠한 내용을 사실이 아닌 내용을 마치 사실처럼 그럴듯하게 만들어내고 그것이 바로 생성 AI가 마켓팅 문구제작에 가장 많이 쓰이는 이유”라며 “시험 문제에서 특히 사실관계가 중요한 내용에서 이러한 오류를 범하면 안 되기 때문에 적어도 문제 유형에 따라 생성 시 발생할 수 있는 오류를 최소화하기 위해 우리 엔진에 초거대 AI모델을 적용하는 분야에서는 특히 신경쓰고 있다”고 말했다.

  • 렉스퍼는 커넥트에듀와 AI 교육 콘텐츠 출시를 준비 중이다. (왼쪽부터) 이형종 렉스퍼 대표, Rob Waring 노틀담 세이신 여대 교수, 신동광 광주교대 교수, 황경호 커넥트에듀 대표. /렉스퍼
    ▲ 렉스퍼는 커넥트에듀와 AI 교육 콘텐츠 출시를 준비 중이다. (왼쪽부터) 이형종 렉스퍼 대표, Rob Waring 노틀담 세이신 여대 교수, 신동광 광주교대 교수, 황경호 커넥트에듀 대표. /렉스퍼

    렉스퍼는 추후 ATM을 일반 사용자도 사용할 수 있도록 플랫폼이나 애플리케이션으로 제작해 출시한다는 계획이다. 이 대표에 따르면 초등학교 영어 교육에서는 금기시되는 문법 용어들이 중학교 때부터 갑자기 강조된다. 실제 중학교 시험에서는 30% 이상이 어법으로 채워지는 경우가 발생하기도 한다. 학생들은 뜻하지 않게 벽을 만나게 되면서 영어에 흥미를 잃는 경우가 많다. 중학교 선생님들은 당장 학교에서 요구하는 최소 문법 수준을 갖추지 못한 학생들에 대한 지도에 난감을 표하고 있다. 이 문제를 해결하기 위해 현재 학생들의 실력을 올바르게 파악하고, 부족한 부분을 집중적으로 알려주는 영문법 서비스를 만들겠다는 구상이다. 이를 위해 베타서비스로 출시된 ATM을 학생들도 사용할 수 있는 플랫폼을 선보일 계획이다. 현재 교육 콘텐츠 기업 ‘커넥트에듀’와 초개인화 영어교육 서비스 개발을 위해 상호협력 중이다. ELT분야 세계 석학인 Rob Waring 교수와도 신뢰성 있는 글로벌 콘텐츠 확보를 위해 논의 중이다.

    해외 시장 진출도 준비하고 있다. 글로벌 A은행과 동남아시아 국가 교재 참여를 위한 방안을 논의 중이다. 이 대표는 “글로벌 A은행의 관계자로부터 동남아시아 중 한 국가의 공교육 분야에 ATM의 문제생성 기술과 난이도 판별을 해당 국가의 영어교육과정에 맞춰 제공할 수 있는지 제안을 받았다”며 “우리가 할 수 있는 역할 등을 다각적으로 고민하고 있다”고 밝혔다. 이어 “궁극적으로는 사용자가 현재 자신의 영어 능력 수준을 알고 싶을 때, 그리고 가장 빠르게 영어 실력을 올리고 싶을 때, 떠오는게 ‘렉스퍼’가 되는 것이 목표”라고 강조했다.

최신뉴스