포커스

연세대 학생들이 만드는 ‘초거대 AI 학생’의 정체

기사입력 2024.05.30 14:08
학생이 만드는 초거대 AI ‘아카라마’…연세대 멀티모달 AI 연구소
‘AI 연대생’ 만들어 학교 생활 도와…의대생·홍보대사로 확장
대학에서 하기 힘든 700억 파라미터 이상 초거대 학습 ‘눈길’
  • 700억 파라미터(70B) 이상의 초거대 AI 학생 ‘아카라마’를 만드는 연세대 멀티모달 AI 연구소 대표 학생들. (왼쪽부터) 한승주 서울대 전기정보공학부 학부, 김세진·이승빈·임승원·손예진·이재혁·전재현 연세대 AI융합대학원생, 유영재 연세대 교수, 오기영 AI융합대학원생. /구아현 기자
    ▲ 700억 파라미터(70B) 이상의 초거대 AI 학생 ‘아카라마’를 만드는 연세대 멀티모달 AI 연구소 대표 학생들. (왼쪽부터) 한승주 서울대 전기정보공학부 학부, 김세진·이승빈·임승원·손예진·이재혁·전재현 연세대 AI융합대학원생, 유영재 연세대 교수, 오기영 AI융합대학원생. /구아현 기자

    학생들이 직접 참여해 초거대 인공지능(AI)을 만드는 연구실이 있다. 700억 파라미터(70B) 이상의 초거대 AI 학생 ‘아카라마’를 만드는 연세대 멀티모달 AI 연구소다. 연세대 학생들이 만드는 대형언어모델(LLM) ‘아카라마’는 연세대 축제인 ‘아카라카’와 메타 오픈소스 모델 ‘라마3’ 명칭을 합쳐 만든 이름이다.

    일반적으로 대학에서 700억 파라미터 이상의 LLM 모델을 직접 만드는 곳은 드물다. 흔히 산학협력을 통해 기업 연구소와 협업을 해야 가능한 일이다. 연세대 멀티모달 AI 연구소는 현재 학생들이 주도적으로 LLM을 만들고 있다. 학생들로만 이뤄진 그룹이 직접 LLM 모델을 만지고 구축한다는 점에서 타 연구실과 차별된다.

  • 연세대 멀티모달 AI 연구소에서 개발하고 있는 700억 파라미터(70B) 이상의 초거대 AI 학생 ‘아카라마’. /연세대
    ▲ 연세대 멀티모달 AI 연구소에서 개발하고 있는 700억 파라미터(70B) 이상의 초거대 AI 학생 ‘아카라마’. /연세대

    이 연구소에서 만드는 대형 LLM 모델의 컨셉은 ‘AI 학생’이다. AI 학생 ‘아카라마’는 학내 데이터와 학생 말투를 학습해 마치 연세대 학생처럼 만들어진다. 모든 교내 정보를 알고 있고, 안내한다. 모르는 문제, 심지어 코딩까지 제안 해줄 수 있는 ‘똑똑한 연세대 AI 학생’으로 연세대 학생증도 있다.

    학생들과 함께 거대 AI 모델을 만들어 보자는 아이디어는 지난해 연세대로 온 신임 교수 머릿속에서 나왔다. 유영재 연세대 인공지능융합대학 조교수는 학생들이 LLM 구축 역량을 키울 수 있도록 이번 프로젝트를 기획했다. 그는 “대학에서 최초로 하는 초거대 AI를 ‘AI 학생’ 컨셉으로 만들어가고 있다”며 “학생들이 LLM 구축 역량을 갖출 수 있게 하는 것이 이 프로젝트의 궁극적인 목표”라고 말했다.

    업계에서도 거대 모델을 훈련 시킨 경험이 있는 인재를 높게 평가하고 있다. 연구실에서는 메타 오픈소스 라마3를 파인튜닝(미세조정)해 거대 모델을 만들고 있다. 미국에서는 LLM 프로젝트 경험이 있는 인재를 1급 AI 인재로 보고 연봉을 높게 올려주기도 한다. 유 교수는 “미국에서는 거대 모델 훈련 경험이 있으면 연봉 상승이 크다”며 “국내에서는 LLM를 다루는 경험을 쌓기가 쉽지 않다”고 말했다.

  • 유영재 연세대 교수가 멀티모달 AI 연구실에서 학생들을 지도하고 있다. /구아현 기자
    ▲ 유영재 연세대 교수가 멀티모달 AI 연구실에서 학생들을 지도하고 있다. /구아현 기자
  • 유영재 연세대 교수는 “미국에서는 거대 모델 훈련 경험이 있으면 연봉 상승이 크다”며 “국내에서는 LLM를 다루는 경험을 쌓기가 쉽지 않다”고 말하며 이번 연구가 학생들의 취업에 많은 도움이 될 것이라고 말했다. /구아현 기자
    ▲ 유영재 연세대 교수는 “미국에서는 거대 모델 훈련 경험이 있으면 연봉 상승이 크다”며 “국내에서는 LLM를 다루는 경험을 쌓기가 쉽지 않다”고 말하며 이번 연구가 학생들의 취업에 많은 도움이 될 것이라고 말했다. /구아현 기자

    ◇ “젊은 교수와 학생들이 뭉쳤다”

    유영재 교수는 지난해 3월 연세대에 임용된 젊은 교수다. 서울대 컴퓨터공학부 박사를 취득하고 미국 시애틀 앨런 인공지능 연구소(Allen Institute for AI, AI2) Mosaic 연구원으로 활동했다. 현재는 AI2 협력연구원으로도 활동하고 있다.

    프로젝트에 참여한 학생들도 LLM 구축에 굉장한 열의를 보이고 있다. 김세진 인공지능학과 통합과정생은 “큰 사이즈 모델을 만져볼 수 있는 기회가 학계에서는 많이 없다”며 “컴퓨팅 자원이 풍부한 일부 기업체에서만 할 수 있는 거대 모델 구축에 참여할 수 있어 기쁘고 감사하다”고 말했다.

    사실 대학 차원에서 부족한 컴퓨팅 자원으로 큰 모델을 학습시키기에는 어려움이 많다. 연세대의 경우 자체적인 데이터센터 운영으로 이를 가능하게 했지만, 일반적으로는 쉽지 않다. 프로젝트에 참여하고 있는 오기영 학생은 “학과 단위 컴퓨팅 자원을 모아 운영하는 데이터센터가 가장 큰 연세대의 장점”이라며 “큰 모델을 학습시킬 수 있었던 이유”라고 설명했다. 유 교수는 “연구에 학부생·인공지능융합대학 대학원생 20여 명이 참여하고 있다”며 “대표 학생 6명이 프로젝트를 책임지고 이끌고 있다”고 말했다.

  • 연세대 아카라마 모델 활용 예시. /연세대
    ▲ 연세대 아카라마 모델 활용 예시. /연세대

    ◇ ‘AI 연대생’에서 ‘AI 의대생’, ‘AI 심리학과생’, ‘연세대 홍보대사’로 확장

    아카라마의 확장성은 크다. AI 연대생에서 의대생, 심리학과생으로도 확장할 수 있다. 2단계 확장으로 세브란스 병원과 협업해 ‘AI 의대생’ 컨셉의 대형 모델을 구축할 예정이다. 유영재 교수는 “연구실은 이번 프로젝트를 단계적으로 확장하려고 계획하고 있다”며 “의대생 공부를 보조해 줄 수 있고 환자 대상 질의응답을 할 수 있도록 만들 예정”이라고 말했다.

    심리학과와도 협력하고 있다. ‘AI 심리학과생’을 만들어 학생 진로 상담과 심리 상담에 특화할 수 있는 서비스를 학생들에게 제공할 목표를 가지고 있다. 연세대를 홍보하는 홍보대사 AI로도 확장 시킬 예정이다. 그는 “언어를 다양하게 학습시켜 유학생들이 교내 정보나 교내 생활에 도움이 될 수 있도록 할 예정”이라며 “재학생들에게도 큰 도움이 될 것이라고 보고 있다”고 밝혔다.

  • 유영재 연세대 교수는 “논문보다 중요한 것은 학생들이 가진 개성을 잘 살려 성공할 수 있도록 만드는 것”이라며 자신의 교육관을 내비쳤다. /구아현 기자
    ▲ 유영재 연세대 교수는 “논문보다 중요한 것은 학생들이 가진 개성을 잘 살려 성공할 수 있도록 만드는 것”이라며 자신의 교육관을 내비쳤다. /구아현 기자

    연구실에서는 학과 내부뿐만 아니라 다양한 학과 간의 협력을 만들려고 하고 있다. 유 교수는 “다양한 학과에서 가지고 있는 데이터를 활용하면 학과마다 ‘AI 학생’을 만들 수 있다”며 “다학제간의 협력을 추구하고 있다”고 말했다.

    연구실에서는 최종 단계로 LLM 모델을 적용한 로봇이 움직이고 음성으로도 소통할 수 있도록 발전시킬 예정이다. 유 교수는 “세계 최초 AI 로봇 학생으로 나중에 로봇에 적용해 졸업시키고자 한다”며 “버추얼 휴먼, 로봇을 통해 가상과 현실에서 볼 수 있고 움직이며 소통할 수 있도록 발전시킬 것”이라고 말했다. 25학번 AI 학생은 LLM 기반이지만 30학번 AI 학생은 캠퍼스를 돌아다닐 수 있도록 만들 것이라는 얘기다.

    한편, 이날 유 교수는 꾸밈없는 교육관을 내비쳤다. 그는 “논문보다 중요한 것은 학생들이 가진 개성을 잘 살려 성공할 수 있도록 만드는 것”이라며 “졸업할 때 학생들이 사업가, 개발자, 학자 등 자신이 가지고 있는 능력을 제일 성공한 형태로 살리는 후회 없는 졸업자가 됐으면 좋겠다”고 희망했다.

최신뉴스