[체험기] AI 면접받아보니 “공정성 걱정 줄었다”
무하유, ‘AI 면접’의 편향성, 설명 가능성 문제 해결한 대화형 면접 서비스 개발
인공지능(AI) 면접이 공정하지 않다는 지적이 많다. 면접 결과를 제대로 설명하지 못하고 평가도 행동 분석에 치중돼 객관적인 평가가 어렵다는 이유에서다. 하지만 두 가지 AI 면접 프로그램을 체험한 결과 일부 기업의 서비스는 이 같은 문제를 상당부분 해결한 것으로 나타났다. 이에 AI 면접에서 일부를 보고 전체 서비스를 평가하는 ‘눈감고 코끼리 만지는 일’이 있어서는 안 된다는 주장이 공급사별로 나오고 있다.
지난 7월 시민단체가 채용 과정에서 AI 면접을 도입한 공공기관을 상대로 낸 ‘정부공개거부처분 취소소송’에서 일부 승소했다. 법원은 AI 면접 공급사가 공공기관에 제공한 설명자료와 업체가 수집한 개인정보를 확인할 수 있는 문서, 평가하려는 직무 적합성 관련 문서 등을 공개해야 한다고 판결했다.
이 문제는 AI가 평가한 면접이 공정하지 않다는 의문에서 시작됐다. 한 공공기업의 경우 AI 면접과 자기소개서 평가를 AI 프로그램에 의존했다. 이 업체는 AI 면접에 주어지는 질문 사항에 관한 검토 없이 서비스 공급사에 위임한 채 채용 의사결정권자에게는 아무런 자료도 제공하지 않은 것으로 나타났다.
이처럼 AI 면접의 공정성 의혹은 끊이지 않는다. AI 면접이 어떤 기준으로 지원자를 평가하는지, 면접 결과를 제대로 설명할 수 있는지 명확한 자료가 제시되지 않아서다. 일부 서비스의 경우 면접에서 높게 평가되는 대화 내용보다 행동 패턴, 적성검사, 게임 등에만 의존해 면접자를 평가한다는 지적도 제기됐다. 정필모 더불어민주당 의원실의 박철관 보좌관은 지난해 6월 ‘인공지능법 제정안’ 입법공청회에서 “AI 면접으로 떨어진 지원자가 왜 그 결과를 얻었는지 누구도 설명해주지 못하는 상황이 발생하고 있다”고 지적하기도 했다.
그렇다면 모든 AI 면접 프로그램이 같은 문제를 안고 있을까. 반대로 기업들은 이미 기술이 충분하다고 주장한다. 일부 기업의 기술이 부족할 수는 있으나, 이를 보고 전체 서비스를 평가하는 일이 있어서는 안 된다는 주장이 나오고 있다.
◇같은 ‘AI 면접’이지만 기업별로 평가 기준과 내용 달라
이 문제를 분석하기 위해 기존 시장에서 많이 사용되고 있는 AI 면접 프로그램과 또 다른 면접 공급사인 ‘무하유’의 프로그램을 비교 체험해봤다. 비교 프로그램으로 무하유를 선택한 이유는 이곳에서는 자기소개서와 대화 내용을 분석한 대화형 면접 서비스를 제공하고 있어서다.
두 가지 면접 프로그램을 사용한 결과 기존 서비스는 말하는 것보다 보여지는 것이 중요했다. 대화 분석보단 성향 평가, 게임 평가 등을 통한 적성검사에 가까웠다. 평가 결과는 답변보단 행동 분석에 치중됐다. 점수가 나왔지만 왜 그 결과가 나왔는지에 관한 상세한 설명은 없었다.
이 면접은 ‘자기소개 → 기본 질문 → 성향 파악 → 상황 대처 → 보상 선호 → 전략 게임 → 심층 대화’ 순으로 이뤄진다. 시험 종료까지 1시간 30분에서 2시간 정도의 시간이 필요하다. 면접에선 면접자가 말하는 시간이 적었다. 오히려 적성 평가와 같은 성향 파악과 전략 게임에서 많은 시간이 소요됐다. 면접은 프로그램의 일방적인 진행으로 이뤄졌다.
면접 관계자는 “면접을 잘 보기 위해서는 카메라에 비춰지는 모습이 중요하다”면서 “전략 게임의 경우 게임을 못하는 것과 별개로 게임 문제를 틀렸을 때 지원자가 얼마나 집중력이 흔들리는지 다음 문제에 얼마나 더 집중하는지 등을 평가한다”고 말했다.
이와 반대로 무하유 서비스는 자기소개서 기반 대화 내용에 평가 무게를 뒀다. 면접자의 답변을 토대로 새로운 질문을 만들어내고 해당 내용을 평가했다. 지원자가 답변한 내용은 그대로 글로 옮기고 내용을 요약해 인사담당자가 별도로 평가하기 좋게 보고서로 보여줬다. 답변을 망설이거나 자주 하는 단어 등도 찾아내 그 결과를 보여줬다. 면접자의 눈동자 움직임과 시선 처리를 분석해 부정 의심 행위도 찾아냈다. 평가에 소요된 시간은 30분 남짓이었다.
송복령 무하유 프로는 “우리 AI 면접 서비스 ‘몬스터’는 면접을 진행하는 고객사가 원하는 공통질문을 만들어낼 수 있고 면접자가 제출한 자기소개서를 기반으로 별도 문제도 실시간으로 만들어낼 수 있다”며 “고객사가 시험에 필요한 질문과 횟수를 정하면 이에 맞춰 시험이 진행된다”고 설명했다. 또 “평가 결과는 AI가 내리지 않고 인사담당자가 최종 평가하는 데 도움이 되는 자료만 제공하고 있다”면서 “공공기관의 경우 지원자의 편견을 유발할 수 있는 인적 사항, 출신 대학, 성별, 가족, 직업 등의 특정 정보를 공개하지 않게끔 되어 있는데 면접이나 자기소개서에 해당 내용을 적을 경우 블라인드 처리해 인사담당자에게 제공하고 있다”고 말했다.
◇실제 사람과 같은 면접 서비스 가능… 데이터 학습 과정에 편향 문제 줄여
무하유 등 일부 기업의 면접 서비스가 기존 서비스와 달리 대화형 평가가 가능한 이유는 학습 데이터와 탑재한 AI 기술에서 찾을 수 있다. 무하유는 AI 서류평가 서비스 프리즘을 토대로 구축한 50만 개 이상의 면접 질문을 AI 면접 서비스에 학습했다. 또 한국지능정보사회진흥원(NIA) 주관 학습 데이터 구축 사업에 선정돼 올해 말까지 약 2만 개의 채용 면접 데이터를 구축하며 서비스 정확도를 높이고 있다.
송 프로는 “AI 면접 프로그램을 만드는데 공개된 데이터는 비전(Vision) 요소에 초점이 맞춰진 학습 데이터밖에 없었다”며 “면접자가 얼마나 긴장했는지 거짓말을 할 때 어떤 표정을 짓는지 등을 평가할 수 있는 데이터밖에 없어 기술 공급사 입장에선 프로그램 제작에 어려움이 있었다”고 말했다. 이어 “하지만 우리는 NIA 사업에 선정되면서 면접 데이터를 구축할 수 있었고 이를 토대로 대화형 면접이 가능해졌다”고 말했다.
또 무하유는 채용 시장에 적합한 음성인식(STT, Speech to Text) 기술을 개발 면접 시스템에 적용했다. 서류평가 서비스에서 정확도를 높인 음성인식 기술을 AI 면접 서비스에 적용, 꼬리물기 질문이 가능케 했다.
여기에 특허를 취득한 ‘음성인식 후처리 장치 및 방법’에 대한 특허 기술로 편향성 문제도 없앴다. 이 특허는 실제 면접 답변 데이터와 직무별로 구축된 사전을 딥러닝으로 분석해 불필요한 인적 사항과 성별, 학벌 등을 블라인드하는 기술이다. 회사는 데이터 학습 과정에서 이 기술을 적용해 성별, 학벌, 나이 등으로 발생할 수 있는 편향 문제도 사전 제거했다.
송 프로는 “과거 아마존에서 AI 서류평가 서비스를 만들었는데 ‘여성’이 들어간 단어가 있으면 감점하는 편향 문제가 있어 서비스를 중단했었다”며 “우리는 이 문제를 없애기 위해 데이터 학습 과정에서 편향 문제를 불러일으킬 수 있는 단어를 블라인드 처리하고 있다”고 설명했다.
신동호 무하유 대표는 “기존 AI 면접은 시선 처리, 발성 등 감성적 평가를 위주로 하는 문제가 있었다”며 “우리는 이 문제를 해결하기 위해 사람 면접관이 면접자를 음성, 표정, 대화 내용 등을 모두 분석해 평가하는 것처럼 AI가 영상, 음성, 언어 3가지를 종합적으로 평가할 수 있게 기술을 구축해 실제 면접과 같은 서비스를 제공하고 있다”고 말했다. 이어 “최근 AI 면접에서 면접 결과를 설명할 수 있는지에 대한 문제가 제기되고 있는데 우리는 고객사에 사용자가 왜 이 점수를 받았는지, 대화 내용 중 문제는 무엇이 있었는지를 상세하게 체크한 내용을 제공하고 있다”며 “이보다 더 복잡한 내용을 제공하기 위한 연구도 진행하고 있다”고 밝혔다.