인더스트리

구글, 경량화 오픈소스 모델 ‘젬마’ 공개

기사입력 2024.02.22 08:01
제미나이 아들 격… 동급 대비 최고 성능 자신
  • 구글이 제미나이 아들 격인 젬마를 오픈소스로 공개했다. /구글
    ▲ 구글이 제미나이 아들 격인 젬마를 오픈소스로 공개했다. /구글

    구글이 21일(현지시간) 자사 인공지능(AI) ‘제미나이’의 아들 격인 ‘젬마’를 오픈소스로 공개했다. 제미나이에 탑재한 기술과 연구 내용이 담긴 경량 모델이다. 구글의 AI 연구조직인 딥마인드와 함께 개발했다. 이번 모델은 메타의 오픈소스 AI ‘라마2’의 대항마가 될 전망이다.

    구글은 이날 블로그를 통해 20억(2B) 파라미터와 70억(7B) 파라미터 크기의 젬마를 오픈소스로 공개한다고 밝혔다. 모두 상업용으로 이용할 수 있게 했다. 구글은 블로그에서 “우리는 트랜스포머, 텐서플로우, 버트, 5T, 알파코드 등 개방형 커뮤니티 혁신에 오랫동안 기여해왔다”며 “개발자와 연구원이 책임감 있게 AI를 구축할 수 있도록 지원하는 차세대 오픈소스 모델을 소개하게 돼 기쁘다”고 썼다.

    구글에 따르면 젬마는 제미나이 모델을 만드는 데 사용된 연구와 기술로 제작된 경량화 모델이다. 젬마 이름은 ‘보석’을 의미하는 라틴어에서 따왔다. 개발자들은 노트북이나 데스크톱 컴퓨터에서 이 모델을 직접 실행할 수 있다. 

    구글은 이 모델이 성능과 안전성에서 모두 뛰어나다고 평가했다. 성능 면에선 크기가 유사한 오픈소스 모델 중 최고 성능을 달성할 수 있다고 자부했다. 

  • 구글은 젬마 7B모델이 메타의 라마2 7B 모델과 추론, 코드 등 분야에서 앞선다고 밝혔다. /구글
    ▲ 구글은 젬마 7B모델이 메타의 라마2 7B 모델과 추론, 코드 등 분야에서 앞선다고 밝혔다. /구글

    실제로 구글이 공개한 자료에선 젬마 7B 모델이 메타의 라마2 7B 모델과 비교해 추론, 코드 등의 분야에서 모두 앞섰다. 구글은 “젬마는 현재 가장 크고 유능한 AI 모델인 제미아니와 기술, 인프라 구성 요소를 공유한다”며 “이를 통해 다른 오픈소스 모델과 비교해 동급 최고 성능을 달성할 수 있다”고 했다.

    안전성 분야도 자신했다. 젬마는 자동화된 기술을 사용해 학습 세트에서 특정 개인정보나 민감한 데이터를 필터링했다고 밝혔다. 또 인간 피드백을 기반으로 한 강화 학습(RLHF)도 적용했다고 설명했다. 구글은 “우리는 젬마의 위험성을 줄이기 위해 레드팀을 구성하고 적대적 테스트, 위험한 활동에 관한 모델 기능 평가 등을 수행했다”며 “젬마를 더욱 안전하고 신뢰할 수 있는 사전 학습 모델로 만들기 위한 노력의 일환”이라고 설명했다.

최신뉴스