인더스트리

엔비디아, RTX GPU로 AI 생성 모델 ‘FLUX.2’ 개선

기사입력 2025.11.27 17:13
FP8 양자화 및 웨이트 스트리밍 기술로 VRAM 요구량 40% 감소
4메가픽셀 해상도·멀티 레퍼런스 기능 지원, 고해상도 이미지 구축
컴피UI 통합으로 별도 SW 없이 지포스 RTX GPU에서 활용할 수 있어
  • FLUX.2. /엔비디아
    ▲ FLUX.2. /엔비디아

    엔비디아가 블랙 포레스트 랩스, 컴피UI와 손잡고 차세대 이미지 생성 AI 모델인 ‘FLUX.2’를 RTX GPU 환경에 최적화했다고 27일 밝혔다. 이번 협업을 통해 320억 개 파라미터를 가진 고사양 모델이 일반 소비자 환경에서도 원활하게 구동될 수 있는 길이 열렸다. 

    FLUX.2는 독일 AI 스타트업 블랙 포레스트 랩스가 개발한 최신 비주얼 생성형 AI 모델이다. 최대 4메가픽셀 해상도를 지원하며 사진처럼 사실적인 디테일과 깔끔한 글꼴을 유지하면서 수십 개의 유사 이미지를 대량 생성한다. 멀티 레퍼런스 기능은 최대 6개의 참조 이미지를 선택해 스타일과 주제를 일관되게 유지하는 방식으로, 모델의 광범위한 미세 조정 없이도 안정적인 결과물을 도출한다. 

    다이렉트 포즈 컨트롤 기능도 추가됐다. 피사체나 캐릭터의 포즈를 명확하게 지정하며, 인포그래픽이나 UI 화면, 다국어 콘텐츠에서도 가독성 높은 텍스트를 제공한다. 이전 모델인 FLUX.1의 성공에 따라 기능을 확장했으며, 데모나 놀이뿐 아니라 실용적인 크리에이티브 워크플로우에서도 이용하도록 설계됐다.

    FLUX.2는 완전히 로드하기 위해 통상 90GB의 VRAM이 필요하고, lowVRAM 모드를 사용해도 64GB의 VRAM이 요구된다. 이는 일반 소비자용 그래픽 카드로는 효과적으로 실행할 수 없는 수준이다. 엔비디아와 블랙 포레스트 랩스는 이 문제를 해결하기 위해 FP8 양자화 기술을 도입했다. 이를 통해 VRAM 요구사항을 40% 줄이고 성능은 40% 향상시키는 성과를 달성했다. 

    엔비디아는 컴피UI와 협력해 웨이트 스트리밍 기술로 앱의 RAM 오프로드 기능도 개선했다. 사용자는 모델의 일부를 시스템 메모리로 오프로드해 GPU 사용 메모리를 확장할 수 있다. 시스템 메모리는 GPU 메모리보다 속도가 느리기에 성능이 다소 감소할 수 있지만, 고사양 모델에 대한 접근성을 크게 높였다는 평가다. 

    FLUX.2 모델군은 네 가지 버전으로 구성됐다. 최고급 모델인 ‘FLUX.2 프로’는 폐쇄형 상위 모델과 견줄 만한 화질을 유지하면서도 빠른 이미지 생성을 지원한다. ‘FLUX.2 플렉스’는 생성 스텝 수와 가이드 스케일을 세밀하게 조절할 수 있어 텍스트 렌더링 및 세부 묘사 성능이 필요한 창작 환경에 적합하다. 오픈 웨이트 모델인 ‘FLUX.2 디브’는 허깅페이스를 통해 공개돼 개발자 접근성을 높였고, 경량화 버전인 ‘FLUX.2 클라인’은 아파치 2.0 라이선스 하에 오픈소스로 공개될 예정이다. 

    해당 모델은 별도의 소프트웨어 패키지 없이 실행 가능하며, 컴피UI에서 바로 사용할 수 있다. 엔비디아는 FP8 체크포인트를 비롯해 지포스 RTX GPU에서 모델 성능을 최적화하기 위해 컴피UI와 지속적으로 협력해 온 것으로 알려졌다. 

최신뉴스