인더스트리

플리토, ‘인간 피드백형 강화학습’ 데이터 구축길 열다

기사입력 2023.12.27 10:30
크리우드소싱 플랫폼 기능 고도화, LLM 구축 용이
  • 플리토가 자사 통합 크라우드소싱 플랫폼의 기능 고도화를 완료했다고 밝혔다. /플리토
    ▲ 플리토가 자사 통합 크라우드소싱 플랫폼의 기능 고도화를 완료했다고 밝혔다. /플리토

    인공지능 언어 데이터 기업 플리토(대표 이정수)는 자사 통합 크라우드소싱 플랫폼의 기능 고도화를 완료했다고 27일 밝혔다. 이번 플랫폼 고도화 작업으로 생성형 AI를 포함한 거대언어모델(LLM)의 성능 향상을 위한 ‘인간 피드백형 강화학습(RLHF; Reinforcement Learning from Human Feedback)’용 데이터 구축이 더욱 용이해졌다는 것이 회사 측 설명이다.

    ‘인간 피드백형 강화학습(RLHF)’은 사람 작업자의 피드백을 보상 신호로 활용해 AI 모델의 언어 출력 생성 과정을 학습시키는 방식이다. 대형언어모델(LLM)의 자연스러운 대화 생성, 정확도 높은 정보 검색, 다국어 번역 등 고품질 언어 생성을 위한 성능 향상을 위해 전 세계적으로 수요가 크게 증가하고 있다.

    플리토는 자체 플랫폼에 총 10가지 유형의 강화학습 데이터 생산을 위한 기능 및 작업 환경 구축을 완료했다. △챗봇의 답변을 평가하고 정확한 답변으로 수정하는 작업 △주어진 이미지의 내용을 기술하는 작업 △주어진 글을 요약 등 요청에 맞게 편집하는 작업 △주어진 명령에 따라 답변을 도출하는 작업 △전문 분야별 파인튜닝을 위한 프롬프트-응답 데이터셋 구축 작업 △자동 코딩을 위한 코딩 생성 작업 △정보 검색 시 정확한 결과 도출을 위해 시스템이 취하는 과정의 생성 작업 △멀티모달 학습을 위한 텍스트, 이미지, 음성 등의 태깅 작업 등이 포함된다.

    블룸버그 산하 연구기관인 블룸버그 인텔리전스의 조사 결과에 따르면, 생성형 AI 시장은 향후 10년간 42%의 연평균 성장률로 급성장할 것으로 예상된다. 텍스트 요약, 콘텐츠 생성, 감정 분석, 다양한 산업 및 분야별 챗봇, 실시간 통번역 서비스 등 생성형 AI 기반 서비스의 수요 증가로 약 2,800억 달러(한화 약 360조)의 새로운 소프트웨어 수익이 창출될 것으로 전망하고 있다.

    플리토는 기존 다국어 번역 및 코퍼스(말뭉치) 구축 플랫폼의 기능 확장 및 고도화를 완료함으로써 국내외 수요가 급증하는 강화학습 데이터 구축을 선제적으로 제안하고, 오는 2024년을 사업기회 외연 확장 및 본격적인 글로벌 사업 확대의 원년이 될 것으로 기대하고 있다.

    이정수 플리토 대표는 “LLM의 편향성과 할루시네이션(환각 현상)은 줄이고 모델 출력 품질과 관련성을 높여 다양한 산업에서 실질적 가치를 제공하기 위해서는 강화학습이 필수적”이라며 “지난 10년 간의 통합 플랫폼 구축 및 운영 노하우를 바탕으로, LLM 성능 향상을 위한 고품질 강화학습 데이터 구축 분야에서도 국내를 넘어 글로벌 시장에서의 사업 경쟁력 확보를 위해 최선을 다하겠다”고 밝혔다.

최신뉴스