10만 건 학습 데이터와 생성형 AI 모델 구축, 공공 활용 증대
규제·평가 영역으로 확장되는 초거대 AI 적용 가능성 확인해
-
와이즈넛이 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 지원하는 초거대 AI 확산 생태계 조성 사업 가운데 ‘방송통신기자재 등 적합성 평가 데이터’ 구축 과제를 마무리했다고 밝혔다.
해당 사업은 지난해 12월 열린 성과보고회에서 우수 사례로 선정되며, 데이터 구축의 완성도뿐 아니라 실제 활용 가능성과 확장성 측면에서도 의미를 인정받았다. 이번 과제는 2017년부터 추진돼 온 인공지능 학습용 데이터 구축 사업의 연장선이다. 와이즈넛은 2021년과 2022년 관련 사업을 수행하며 공공 영역에서의 AI 학습 데이터 구축 경험을 축적해 왔고, 이를 바탕으로 이번에는 방송통신기자재 적합성 평가라는 비교적 전문적이고 규제 중심적인 영역으로 범위를 넓혔다.
특히 이번 사업에서는 기존 적합성 평가 데이터를 단순히 정리하는 데 그치지 않고, 대규모 언어모델(LLM) 기반의 생성형 AI 모델 구축까지 함께 진행했다. 이는 데이터 구축과 AI 활용을 분리하지 않고, 실제 업무에서 활용 가능한 형태로 연결하려는 시도로 풀이된다. 사업의 궁극적인 목표 역시 현행 적합성평가 데이터를 기반으로 보다 안전하고 효율적인 방송통신기자재 생태계를 조성하는 데 맞춰졌다.
와이즈넛은 주관기관으로서 적합성 평가와 관련된 방대한 비정형 데이터를 수집하고 정제하는 작업을 총괄했다. 이어 360개 분류 체계를 기준으로 10만 건 규모의 고품질 학습 데이터를 구축했으며, 평가 유형과 판단 근거를 반영한 질의응답 데이터를 통해 생성형 AI 모델 학습까지 수행했다. 이 과정에서 자체 데이터 전처리 기술을 적용해 데이터 정확도를 높이고, 생성형 AI 결과에 대한 신뢰도를 확보하는 데 집중했다.
최종적으로 구축된 적합성 평가 생성형 AI 모델과 질의응답 데이터는 상반기 내 AI 허브를 통해 공개될 예정이다. 향후 공공기관은 물론 민간 기업도 해당 데이터를 활용해 방송통신기자재 적합성 평가에 대한 이해도를 높이고, 업무 효율성을 개선할 수 있을 것으로 기대된다. 강용성 와이즈넛 대표는 “AI의 활용 가치는 결국 데이터 품질에서 출발한다”며 “공공과 민간이 함께 활용할 수 있는 초거대 AI 학습 데이터 생태계 조성에 기여하겠다”고 밝혔다.
한편 이번 사업은 와이즈넛을 중심으로 유클리드소프트와 한국전파진흥협회가 참여한 컨소시엄 형태로 추진됐다. 국립전파연구원이 보유하고 중앙전파관리소가 제공한 적합성 평가 완료 원천 데이터를 기반으로, 실제 현장에서 활용 가능한 데이터와 AI 모델을 마련했다는 점에서 향후 유사한 공공 AI 데이터 사업의 참고 사례가 될 것으로 보인다.
- 서재창 기자 chang@chosun.com