포커스

풍자적 ‘그록’ 챗GPT 이길 수 있을까

기사입력 2023.11.06 18:01
xAI, LLM 기반 챗봇 서비스 첫 공개
X 플랫폼 콘텐츠 실시간 연결
챗GPT3.5보다 성능 좋아
  • 일론 머스크 테슬라 CEO가 2일(현지시각) AI 안전 정상 회의에서 리시 수낙 영국 총리와 대담서 “AI가 모든 것을 해 어떤 일자리도 필요하지 않은 시점이 올 것”이라고 말했다.  /뉴스1
    ▲ 일론 머스크 테슬라 CEO가 2일(현지시각) AI 안전 정상 회의에서 리시 수낙 영국 총리와 대담서 “AI가 모든 것을 해 어떤 일자리도 필요하지 않은 시점이 올 것”이라고 말했다. /뉴스1

    일론 머스크가 설립한 ‘xAI’에서 대형언어모델(LLM) 기반 첫 챗봇 서비스 ‘그록(Grok)’이 출시되면서 오픈 AI의 챗GPT와 경쟁이 본격화됐다. 누가 더 좋은지 무엇이 다른지 사용자들 사이에서 화제다.

    그록의 사전적 의미는 무언가, 누군가를 완전히 이해한다는 의미로 풍자적인 답변과 X 플랫폼 기반 실시간 정보력을 갖춘 게 큰 차별점이다. 2개월간 소수를 대상으로 초기 베타 버전 테스트를 진행하고 있다. 일론 머스크는 X(옛 트위터) 계정에서 지난 4일 출시를 알리며 그록은 ‘유머’를 갖춘 AI’라고 강조했다. 머스크는 “그록은 X플랫폼을 통해 접속할 수 있어 다른 모델에 비해 엄청난 이점이 있다”며 “풍자(sarcasm)를 좋아한다”고 설명했다.

    이러한 머스크의 새 챗봇은 강점은 X 플랫폼 중심의 빠른 정보력이다. 많은 사용자가 새로운 정보를 실시간 대화를 중심으로 나누는 X를 이용한 것이다. 그래서 일반적으로 모든 질문에 대답이 가능하다. 챗GPT도 최근 10월 최신 정보를 업데이트할 수 있는 브라우징 기능을 정식 출시했다. 마이크로소프트(MS)의 AI 투자로 빙(Bing) 검색 엔진을 통합하면서 실시간 인터넷을 탐색할 수 있게 됐다.

    이전에는 2021년 9월까지의 학습데이터만을 기반으로 해 최신 정보를 얻을 수 없다는 게 큰 결함으로 꼽혔다. 하지만 브라우징 기능은 지난 6월 원치 않는 방식의 콘텐츠가 표시되는 오류가 발견돼 중단됐다. 이후 9월 말 고급 버전인 GPT-4 유료 구독 서비스 이용자를 대상으로 베타 버전을 테스트하다가 10월 정식 배포했다.

  • 일론 머스크가 X에 LLM 기반 AI 챗봇 '그록'의 풍자적 기능에 대해 소개했다. /일론머스크 X 계정
    ▲ 일론 머스크가 X에 LLM 기반 AI 챗봇 '그록'의 풍자적 기능에 대해 소개했다. /일론머스크 X 계정

    그록은 펀 모드(Fun mode), 레귤러 모드(Regular mode) 두 가지 모드를 제공한다. 펀 모드에서는 ‘비꼬는 듯한 유머’ 즉 ‘풍자적’ 대답이 가능하다. 그록은 코카인 제조방법을 4단계로 나눠 설명하면서 “제조할 때 폭파하거나 체포되지 않기를 바람”이라며 “농담이야”라고 대답한 사례가 펀 모드의 대표 사례로 꼽힌다. 이어 실제 코카인을 만들려고 하지 말라면서 불법적이고 위험하다고 당부했다.

    머스크가 X에 공유한 또 다른 예시로 FTX 설립자 샘 뱅크먼이 금융사기로 최장 징역 115년을 선고받을 위기라는 정보를 입력하자 그록은 유죄 평결에 대해 “배심원단이 그의 다양한 사기에 대해 알아내는 데 8시간밖에 걸리지 않았다”면서 “우수한 벤처캐피털도 수년 동안 하지 못한 일”이라고 지적했다. 위와 같이 코카인 제조법이나 샘 뱅크먼에 대한 질문을 챗GPT에 해보면 질문이 부적절하거나 최신 정보가 없는 뉴스는 접근할 수 없다고 답변한다.

    xAI는 그록의 출시를 알리면서 챗GPT3.5보다 성능이 좋다고 발표했다. xAI는 “그록이 330억 개의 매개 변수를 가진 그록-0을 훈련했다”며 “추론과 코딩 기능이 향상된 강력한 최첨단 언어 모델 그록-1을 달성했다”고 설명했다. MMLU(Multi-task Language Understanding, 대규모 다중작업 언어 이해)와 HumanEval(파이썬 코드 생성 작업)에서도 챗GPT-3.5보다 좋은 성적을 거뒀다.

    그록과 챗GPT의 차별점에 대한 관심이 높다. X 사용자들 사이에서는 그록의 성능과 특징을 정리한 게시물이나 리스트를 빠르게 공유하고 있다. 그록은 여러 개의 대화를 동시 실행할 수 있고, 대화를 진행 중 전환할 수 있어 멀티태스킹이 가능하다. 화면 새로고침 정도의 응답 속도를 지녔으며, X 콘텐츠에 맞춰 라이브 검색엔진이 작동하고 있다. 2만 5,000자까지 텍스트를 입력할 수 있고, 그록 버전은 테슬라 컴퓨팅 파워를 사용하여 작동된다. API, 이미지 인식, 오디오 인식도 계획하고 있다.

  • 그록이 챗 GPT3.5보다 MMLU, HumanEval 부문 성능이 더 뛰어난 걸로 나타났다. /xAI 홈페이지
    ▲ 그록이 챗 GPT3.5보다 MMLU, HumanEval 부문 성능이 더 뛰어난 걸로 나타났다. /xAI 홈페이지

    머스크는 2일(현지 시각) AI 안전 정상 회의에서 리시 수낙 영국 총리를 만나 “AI는 역사상 가장 파괴적인 힘”이라고 말하며 “AI가 모든 것을 해 어떤 일자리도 필요하지 않은 시점이 올 것”이라고 말했다. 이어 “풍요로운 시대가 오는 데 사람들을 편안하게 할지 아닐지는 모르는 일”이라며 “인류가 직면한 미래 과제는 ‘어떻게 삶의 의미를 찾을 것인가’”라고 말했다.

    모든 면에서 기존의 GPT의 단점을 개선했다고 홍보하고 있지만 X의 실시간 데이터를 학습했기 때문에 데이터의 편향성이나 신뢰성 같은 문제가 우려되고 있다. 트위터, X뿐만 아니라 페이스북, 유튜브와 같은 플랫폼을 통한 가짜뉴스가 세계적인 문제로 떠오르기도 했다. 가짜뉴스의 경우 자체 검열을 하고 있지만 완벽하다고 할 수 없어 현재에도 많은 논의가 진행 중이다. 이에 이러한 악성 루머나 가짜 정보들에 대한 데이터를 그록이 어떻게 차단할지가 주목된다.

    현재 그록은 오직 X계정으로만 가입할 수 있고, X의 유료구독 서비스인 ‘X프리미엄+’의 서비스 중 하나로 제공될 예정이다. 현재 그록 홈페이지를 통해 베타버전 사용자로 등록할 수 있다.

최신뉴스