Flux.2란 무엇이며 Flux 2는 이제 CometAPI에서 사용 가능합니다.

CometAPI
AnnaNov 26, 2025
Flux.2란 무엇이며 Flux 2는 이제 CometAPI에서 사용 가능합니다.

FLUX.2는 Black Forest Labs에서 새롭게 발표한 이미지 생성 및 편집 모델 제품군으로, 프로덕션급 충실도, 다중 참조 편집(최대 10개 참조), 오픈웨이트 Dev부터 프로덕션 Pro까지 다양한 배포 가능한 변형, 제어 가능한 Flex 계층을 제공합니다.

FLUX.2란 무엇인가요?

FLUX.2는 Black Forest Labs의 프로덕션급 이미지 생성 및 편집 제품군으로, 다중 참조 컨디셔닝, 재작업된 잠재 공간(VAE), 그리고 고급 제어 프리미티브(16진수 색상 조정, JSON 프롬프트, 포즈 안내)를 결합하여 창의적이고 상업적인 워크플로우에 일관되고 충실도 높은 결과를 제공합니다. 단일 모델 제품군에서 텍스트→이미지 생성과 다중 참조 이미지 편집을 모두 지원하며, BFL은 연구 및 로컬 추론을 위한 호스팅 API 엔드포인트와 오픈 웨이트 아티팩트를 제공합니다. 이 제품은 연구자/개발자를 위한 오픈 웨이트,FLUX.2 ), 호스팅된 프로덕션 모델 등 **플럭스.2 프로**및 사용자 정의 가능한 호스팅 엔드포인트와 같은 플럭스.2 플렉스.

주요 기능

  • 다중 참조 편집: 최대 8~10개의 참조 이미지를 결합하여 정체성과 스타일의 일관성을 유지하면서 단일 결과물을 만들 수 있습니다. 이 기능은 특히 광고, 제품 모형 또는 여러 크리에이티브 버전 간의 캐릭터 일관성에 유용합니다.
  • 고해상도(최대 4MP): 최대 4메가픽셀(예: 종횡비에 따라 2048×2048 이상)을 출력합니다.
  • 포토리얼리즘 + 섬세한 디테일: 이전의 개방형 모델에 비해 손, 얼굴, 질감, 공간 추론 능력이 향상되었습니다.
  • 구조화된 프롬프트 및 JSON 프롬프트: FLUX.2는 UI 컨트롤(장면, 주제[], 스타일, 조명, 카메라)에 자연스럽게 매핑되는 구조화된/JSON 프롬프트를 지원하여 프로그래밍적이고 재현 가능한 생성을 가능하게 합니다.
  • 타이포그래피와 색상 충실도: 브랜드에 민감한 워크플로우에 적합한 매우 뛰어난 텍스트 렌더링과 정확한 색상(16진수) 조정 기능을 제공합니다.
  • 콘텐츠 출처 및 안전성: Pro API는 암호화된 서명이 있는 C2PA 메타데이터를 생성된 이미지에 적용하고 허용되지 않는 콘텐츠 범주에 대한 계층적 필터링을 실행합니다.

Pro vs Flex vs Dev: 어떤 모델을 선택해야 할까?

변형지연 시간 및 비용품질제어 및 기능다중 참조
FLUX.2낮은 지연 시간(일반적인 API 설정에서 <10초)에 최적화되었으며, 출처를 위한 콘텐츠 필터와 암호화된 서명이 있는 C2PA 메타데이터가 포함되어 있습니다.가장 높음(4MP, 최상의 충실도)전체 기능, 프로덕션 SLA최대 8개(API, 9MP 제한)
FLUX.2더 높은 지연 시간 pro 하지만 조정 가능한 추론 하이퍼매개변수(단계, 안내 척도 등)를 노출합니다.높음조정 가능한 충실도 대 다양성, 조정 가능한 추론 단계, 안내 척도 및 품질/속도 균형을 위한 기타 샘플링 제어.최대 10까지
FLUX.2하드웨어에 따라 다릅니다강한 (오픈 웨이트)전체 편집 + 다중 참조; 오픈 체크포인트권장 최대 6개
FLUX.2에지 / 리소스 부족중간(증류)빠르고 작은 VRAM 공간

언제 어떤 것을 선택해야 하나요?

  • 왼쪽 메뉴에서 DEV 로컬로 실행해야 하는 경우, 알고리즘 연구가 필요한 경우 또는 개방형 맞춤 설정이 필요한 경우(그리고 높은 하드웨어 요구 사항을 수용하는 경우)
  • 왼쪽 메뉴에서 내장된 안전 및 출처 기능을 갖춘 예측 가능하고 지연 시간이 짧은 프로덕션 이미지가 필요한 경우.
  • 왼쪽 메뉴에서 구부리 다 세대 하이퍼파라미터(튜닝 단계, 지침 규모 등)를 반복하고 해당 제어를 노출하는 관리형 엔드포인트가 필요한 경우입니다.

FLUX.2는 어떻게 작동하나요?

FLUX.2는 세 가지 주요 아키텍처 요소를 결합했습니다.

1. 정류형 변압기 백본

FLUX.2의 핵심은 다음을 사용합니다. 흐름 매칭 / 정류 흐름 학습된 잠재 공간에서 작동하는 트랜스포머 아키텍처(일부 프로덕션 파이프라인에서 확산을 대체하는 최신 기술)입니다. 이 백본은 여러 참조 간의 일관성을 향상시키는 고충실도 렌더링 및 공간 추론을 지원합니다. "흐름 매칭" 방식은 기존 확산 방식과 비교하여 샘플링 속도와 충실도 측면에서 서로 다른 균형을 제공합니다.

2. 새로운 변형 오토인코더(VAE)

특수 제작된 자동 인코더는 이미지를 FLUX.2의 생성 및 편집 작업에 최적화된 잠재 표현으로 압축합니다. BFL은 새로운 VAE가 압축률과 충실도를 향상시켜 이전 세대보다 학습 역학이 향상되고 복원 품질이 더 높다고 설명합니다. VAE는 4MP로의 깨끗한 업스케일링과 향상된 디테일에 핵심적인 역할을 합니다.

3. 장문맥 시각-언어 모델(VLM)

VLM(공개된 노트에서 Mistral급 시각 언어 인코더와 관련이 있다고 보고됨)은 언어 조건화 및 실제 세계 지식을 제공하여 프롬프트의 신뢰성을 높이고 모델이 복잡한 지시(포즈 안내, 문맥적 편집 등)를 더 잘 따르도록 합니다. VLM을 흐름 백본과 결합하면 FLUX.2는 더 넓은 맥락적 창에서 구성 및 의미론에 대해 추론할 수 있습니다.

이러한 조각들이 상호 작용하는 방식(런타임 흐름)

  1. 입력 인코딩: 참조 이미지는 VAE를 통해 잠재 토큰으로 인코딩되고, 텍스트 프롬프트는 VLM에 의해 인코딩됩니다.
  2. 크로스 모달 퓨전: 변환기 백본은 이미지 잠재 데이터와 텍스트 토큰을 수집하고 공간 관계, 식별 기능, 편집 지침을 모델링합니다.
  3. 흐름 기반 생성: 정류 흐름 샘플러는 융합된 표현에 따라 잠재 이미지를 생성하거나 편집합니다.
  4. 풀다: VAE는 잠재 데이터를 픽셀 공간으로 디코딩하고, 선택적으로 최종 색상 제약 조건과 워터마크/C2PA 메타데이터를 적용합니다.

이 아키텍처가 중요한 이유

이 조합은 세 가지 실질적인 이점을 제공합니다. (1) 다중 참조 일관성 왜냐하면 정체성과 스타일은 잠재적으로 명확하게 모델링되기 때문입니다. (2) 더 나은 텍스트와 타이포그래피 VLM과 이미지 잠재 공간 간의 더욱 긴밀한 통합으로 인해; (3) 확장 가능한 배포 옵션 — 동일한 기본 모델 패밀리를 로컬 사용을 위한 오픈 가중치(dev), 관리형 저지연 서비스(pro) 또는 개발자를 위한 조정 가능 서비스(flex)로 제공할 수 있습니다.

FLUX.2는 어떤가요?

벤치마크에서 수행

블랙 포레스트 랩스(Black Forest Labs)는 FLUX.2 가 직접 인간 선호도/승률 테스트와 ELO 대 비용 분석에서 여러 경쟁사(Open Weight) 제품보다 우수한 성능을 보임을 보여주는 비교 평가 및 차트를 발표했습니다. 발표된 공급업체/언론 보도 요약에서 보고된 주요 내용은 다음과 같습니다.

  • 텍스트→이미지 승률: FLUX.2 보고됨 ≈66.6 % 승률(Qwen-Image는 약 51.3%, Hunyuan Image 3.0은 48.1%)
  • 단일 참조 편집: ≈59.8 % 승률(Qwen-Image의 경우 약 49.3%, FLUX.1 Kontext의 경우 41.2%).
  • 다중 참조 편집: ≈63.6 % 승률(Qwen-Image의 경우 약 36.4%)
  • ELO 대 비용: FLUX.2 제품군(Pro, Flex, Dev)은 고품질, 비교적 저렴한 가격대로 클러스터링됩니다(공급업체의 가격 차트에 따르면 이미지당 약 26센트로 운영되는 동안 ELO ≈10301050).

다중 참조 생성

FLUX.2의 가장 큰 특징 중 하나는 여러 참조 이미지를 사용하여 여러 개의 일관된 출력을 생성할 수 있다는 것입니다.

예를 들어, 제품을 촬영할 때 다양한 각도, 다양한 조명 조건, 다양한 배경에서 촬영한 여러 장의 사진을 업로드하여 동일한 이미지의 여러 가지 변형을 한 번에 생성할 수 있습니다.

이 기능을 사용하면 전자상거래 웹사이트, 광고 배너, 소셜 미디어 이미지 세트 등을 위한 제품 카탈로그 사진을 빠르게 일괄 생성할 수 있습니다.

기존의 단일 이미지 생성과 달리, 이 다중 참조 메커니즘은 일관성과 무결성을 강조하는 실제 워크플로에 이상적입니다.

고해상도, 비즈니스 품질(최대 4MP)

FLUX.2는 최대 4메가픽셀(약 2000~3000픽셀)의 출력을 지원하여 광고, 인쇄, 간판, 포스터 등 실용적인 용도에 적합한 이미지 품질을 제공합니다.

텍스트, 로고, UI 모형, 인포그래픽 등을 완벽하게 처리하므로 예술적 창작뿐만 아니라 디자인 및 상업적 사용에도 적합합니다.

또한, 글꼴과 텍스트의 렌더링 품질도 개선되어 광고 배너와 제품 라벨을 만드는 데 적합해졌습니다.

로컬 GPU 실행 지원: 저렴한 비용, 낮은 진입 장벽

현재까지 많은 고성능 이미지 생성 모델은 대규모 컴퓨팅 리소스를 보유한 데이터 센터에서만 실행 가능합니다. 그러나 FLUX.2는 VRAM 사용량이 적은 표준 GPU(예: NVIDIA RTX)에서 실행되도록 최적화되었습니다.

더 이상 클라우드를 통해 모델에 액세스할 필요가 없습니다. 로컬에서 모델을 편집하고 생성할 수 있으므로 비용이 크게 절감되고 운영 유연성이 향상됩니다.

이는 회사뿐만 아니라 개인 창작자와 소규모 팀에게도 큰 이점입니다.

통합된 생성 및 편집 워크플로

FLUX.2는 텍스트-이미지 변환(텍스트 → 이미지 생성)뿐만 아니라 이미지-이미지 변환(기존 이미지 편집 및 스타일링)도 지원합니다.

이를 통해 "새 이미지를 처음부터 그리기", "기존 사진 편집 및 보정", "여러 이미지를 재사용하여 균일한 변형 만들기"와 같은 작업에 단일 모델을 일관되게 사용할 수 있습니다.

예를 들어, 제품 사진의 배경을 다른 분위기로 바꾸거나 소셜 미디어에 맞게 크기를 조절하는 것이 쉽습니다.

Flux.2 API에 접근하는 방법

CometAPI가 Flux.2 API를 통합하게 되어 기쁩니다. 이제 Replicate Format Model(Replicate 공식 가격보다 저렴)을 지원하며, FLUX.2 엔드포인트는 다음과 같습니다.

  • 블랙포레스트랩스/플럭스2프로
  • 블랙포레스트랩스/플럭스2데브
  • 블랙포레스트랩스/플럭스2플렉스

지금 구축 시작하기 예측 생성 – API 문서,

먼저 시도해 보시겠어요? 우리의 FLUX.2 및 를 테스트하세요. 운동장 CometAPI에 등록하고 로그인한 후, 지금 API로 빌드를 시작하세요: 예측 생성 – API 문서.

FLUX.2는 단순한 모델 변경이 아닙니다. 충실도, 편집 가능성, 다중 참조 일관성, 그리고 실용적인 배포 경로(관리형 API 및 개방형 체크포인트) 등 프로덕션 현실을 고려한 제품군 수준의 제품 전략입니다. 시각적 콘텐츠를 대규모로 제작하는 조직의 경우, FLUX.2는 팀이 기술 도입과 강력한 라이선스 관리 및 품질 관리를 병행할 경우 상당한 생산성 향상을 보장합니다.

FLUX.2의 주요 사용 사례 및 의도된 사용 사례

제품 비주얼/전자상거래 카탈로그 제작

전자상거래 기업과 브랜드는 다양한 조명, 배경, 색상 모드를 사용하여 여러 각도에서 수많은 제품 사진을 촬영해야 한다는 요구가 높습니다.

  • FLUX.2를 사용하면 실제로 콘텐츠를 촬영하지 않고도 여러 가지 시각적으로 일관된 효과를 빠르게 생성할 수 있습니다.
  • 이를 통해 사진 촬영 비용, 시간, 관리 비용을 줄이는 동시에 제품 카탈로그를 빠르게 확장할 수 있습니다.

광고 및 마케팅 자료 제작

디자인 자료에 대한 수요는 광범위하며, 여기에는 광고 배너, 소셜 미디어 게시물 이미지, 홍보 캠페인 비주얼, 홍보 포스터 등이 포함됩니다.

  • 원하는 스타일, 구성, 분위기의 이미지를 얻기 위해 텍스트 설명만 제공하면 되므로 디자이너와 광고주의 부담이 크게 줄어듭니다.
  • 또한, 여러 개의 참조 이미지를 사용하여 변형을 생성할 수 있으므로 창의적인 아이디어의 A/B 테스트나 여러 언어 및 지역에 호환되는 자료를 만드는 데에도 적합합니다.

사용자 인터페이스/사용자 경험 디자인, 프로토타이핑

FLUX.2는 로고, 글꼴, 레이아웃, 배경 편집도 지원하므로 사진 생성뿐만 아니라 디지털 제품의 시각적 디자인에에도 적합합니다.

  • 예비 디자인, 와이어프레임, 이벤트 웹사이트, 애플리케이션 화면 모형 등을 빠르게 만들 수 있습니다.
  • 이는 비용 효율적인 생산 솔루션으로, 특히 스타트업과 소규모 디자인 팀에 적합합니다.

예술/창작 작품 및 개인 사용

물론, 단순히 "아트워크", "일러스트레이션", "그래픽 디자인"으로만 사용될 수도 있습니다.

  • 텍스트 프롬프트와 참조 이미지를 사용하여 다양한 분위기와 스타일의 작품을 만들어 창의적인 지평을 넓혀보세요.
  • 이미지 편집 기능을 사용하면 기존 사진을 자유롭게 예술적 스타일로 재활용하거나 환상적인 풍경이나 캐릭터 디자인을 실험할 수도 있습니다.

기존 모델 및 경쟁 제품과 차별화된 FLUX.2를 선택해야 하는 이유는?

다른 AI 이미지 생성 모델과의 비교

현재 AI 이미지 생성 분야에는 기존 확산 모델부터 최신 경쟁 모델까지 다양한 모델(오픈소스 및 상용 모델)이 존재합니다. 그렇다면 FLUX.2가 왜 그토록 매력적인 것일까요? 그 이유는 다음과 같습니다.

  • 통합 생성 및 편집: 많은 모델이 "생성(텍스트에서 이미지로)" 또는 "편집(이미지에서 이미지로)"에 중점을 둡니다. FLUX.2는 두 기능을 동시에 지원하여 매우 일관된 워크플로를 구현합니다.
  • 다양한 참조 입력: 여러 참조 이미지를 활용하여 제품 사진을 쉽게 촬영하고 시각적 일관성을 유지하세요.
  • 상업용 품질 및 고해상도: 광고, 제품 사진 촬영 및 인쇄용으로 4MP를 지원합니다.
  • 간편한 로컬 실행: 클라우드에 독립적이며 표준 GPU에서 실행할 수 있어 비용과 유연성 측면에서 모두 이점이 있습니다.
  • 유연한 모델 선택: 표준형부터 상업용, 연구용까지 다양한 모델을 제공하므로, 필요와 예산에 가장 적합한 모델을 선택할 수 있습니다.

이러한 특징으로 인해 FLUX.2는 전문적인 워크플로, 상업적 용도, 대량 생산 및 비용과 속도가 중요한 프로젝트에 적합한 강력한 선택이 됩니다.

마지막 생각들:

FLUX.2는 실용적인 교차점에 위치합니다. 개방형 연구 옵션 제어 및 재현성이 필요한 팀을 위해 관리형, 프로덕션 API 낮은 지연 시간, 예측 가능한 출력, 그리고 출처를 우선시하는 팀을 위해. BFL은 개방형 및 관리형 버전(dev/pro/flex)을 모두 제공함으로써, 실험, 반복적 설계, 운영 등 다양한 워크플로우가 충실도, 속도, 맞춤 설정, 그리고 거버넌스 간의 각기 다른 균형을 필요로 한다는 점을 인지하고 있습니다.

개발자는 액세스할 수 있습니다 Flux.2 개발 API, Flux.2 Flex APIFlux.2 Pro API CometAPI를 통해. 시작하려면 CometAPI의 모델 기능을 살펴보세요. 운동장. 접속하기 전에 CometAPI에 로그인하고 API 키를 받았는지 확인하세요. e티피에이 공식 가격보다 훨씬 낮은 가격을 제공하여 통합을 돕습니다.

출발 준비 되셨나요?→ 지금 CometAPI에 가입하세요 !

AI에 대한 더 많은 팁, 가이드 및 뉴스를 알고 싶다면 저희를 팔로우하세요. VKX 및  디스코드!

더 보기

하나의 API로 500개 이상의 모델

최대 20% 할인