가상현실

비속어·악플 등 혐오 표현, ‘AI’로 다 잡아낸다

  • 메타리즘
기사입력 2022.11.03 10:04
IT 기업들의 인공지능(AI) 윤리 의식 중요성 강화 추세
  • (사진제공: 셔터스톡)
    ▲ (사진제공: 셔터스톡)

    IT 기업들의 인공지능(AI) 윤리 의식 중요성이 날이 갈수록 높아지고 있다. 

    이에 리턴제로, 네이버, 튜닙 등 고도화된 AI 기술을 활용해 비속어, 악플 등의 혐오 표현을 탐지·필터링해주는 기술을 개발하고 서비스에 도입하는 기업들이 늘고 있다.

    리턴제로의 비토는 ‘문자 변환 AI 교정’ 기능을 도입했다. 이 기능은 전화로 나눈 대화 내용에서 비속어를 별도로 인식해 이를 제외한 문자 변환 내용만을 보여준다.

    비토 앱 내 설정 탭에서 필터 기능을 비활성화하면 원본 통화 녹음의 텍스트 확인이 가능하다. 필터를 해제하지 않아도 비속어 필터가 적용된 말풍선 옆 아이콘을 터치하면 대화의 원본 문장을 바로 확인할 수 있다.

    네이버의 인공지능 기반의 악성 댓글 차단 프로그램인 'AI 클린봇'은 뉴스 댓글, 방송 톡, 네이버 TV 댓글 등에 욕설뿐만 아니라 과도한 성적 표현까지도 필터링해준다. 

    네이버 측은 기존에 학습된 데이터를 포함해 약 1억6000만건의 데이터를 4개월에 걸쳐 학습, 고도화에 활용해 꾸준히 정확도를 향상하고 있다”라고 밝혔다. 

    튜닙의 '윤리성 판별(Safety Check)' API(응용 프로그램 인터페이스)는 사용자가 입력한 텍스트의 문맥을 분석해 혐오 표현을 자동 탐지한다. 탐지된 내용을 모욕, 욕설, 폭력·위협, 범죄 조장 등 11가지 카테고리로 분류하여 분류된 혐오 표현의 심각성을 주의, 명백, 심각 등 3단계로 구분한다. 구분된 표현을 대체할 수 있는 단어를 제안한다.

    튜닙은 대화 문맥을 비롯해 인공지능 모델의 윤리성 문제를 총체적으로 점검하고 수치화할 수 있는 솔루션 개발에 무게를 둘 계획이다.

  • 메타리즘

최신뉴스