FLUX.2는 Black Forest Labs의 2세대 이미지 생성 및 편집 모델 제품군(2025년 11월 25일 출시)입니다. 프로덕션급 포토리얼리즘, 최대 4MP의 다중 참조 편집, 구조화/JSON 프롬프팅, 그리고 다양한 관리형 엔드포인트(Pro, Flex) 및 오픈웨이트 옵션(Dev)을 제공합니다.
좋은 소식은 CometAPI가 Flux.2 API를 통합했다는 것입니다. 이 가이드에서는 FLUX.2의 정의, API 호출 방법, 고급 워크플로(텍스트→이미지, 유연한 컨트롤, 다중 참조 편집)를 코드 예제와 모범 사례를 통해 설명합니다.
FLUX.2란 무엇이고 왜 중요한가요?
FLUX.2는 FLUX 이미지 모델 제품군의 후속작으로, 최대 4메가픽셀의 프로덕션 해상도에서 고품질 텍스트-이미지 생성 및 다중 참조 이미지 편집을 위해 설계되었습니다. FLUX.2는 데모가 아닌, 실제 크리에이티브 워크플로우(브랜드 안전 자산, 참조 간 일관된 문자 및 스타일, 향상된 타이포그래피, 세밀한 디테일)를 위해 제작되었으며, 생성된 이미지와 실제 이미지 간의 격차를 줄이는 것을 목표로 합니다.
주요 결과 FLUX.2는 다음을 제공하도록 설계되었습니다.
- 광고, 제품 이미지, UI 모형에 적합한 사실적인 결과물입니다.
- 기본 다중 참조 편집: 단일 편집에서 여러 입력 이미지의 요소를 결합, 교환 또는 구성합니다.
- 다양한 사용 사례에 대한 변형: 공개적으로 사용 가능한 개발자 모델, 프로덕션에 최적화된 Pro 엔드포인트, 저수준 제어를 위한 Flex 엔드포인트.
높은 수준에서 FLUX.2는 잠재 생성 백본(흐름/변환기 아키텍처)과 의미 기반을 위한 비전-언어 모델을 결합하고, 새롭게 훈련된 VAE를 통해 여러 변형 간에 공유 잠재 공간을 제공합니다. 이러한 설계를 통해 모델은 더 높은 충실도로 생성 및 재구성(편집)을 수행하는 동시에 학습 및 미세 조정을 위한 표현을 학습 가능하게 유지합니다. 특히 개방형 VAE는 호스팅 및 자체 호스팅 워크플로의 잠재 공간을 표준화한다는 점에서 주목할 만합니다.
이것이 중요한 이유: 언어와 잠재 흐름 매칭을 결합하면 더 강력한 프롬프트 추종(다중 구성 지침이 예측 가능하게 동작하도록), 더 나은 타이포그래피, 그리고 여러 참조를 통한 생성 및 편집을 모두 지원하는 단일 아키텍처가 제공됩니다. 이는 크리에이터에게 복잡한 지침과 혼합된 입력(텍스트 + 이미지)에 대해 더욱 안정적인 출력을 제공한다는 것을 의미합니다.
FLUX.2 API에 어떻게 접근하나요?
환경을 준비하세요
CometAPI에 등록하고 로그인한 후 프로필 패널에서 API 키를 받으세요. 개발자로서 API에 대한 지식이 어느 정도 있으신 분이면 더 좋습니다(저희가 도와드릴 테니 걱정하지 마세요).
또한 원하는 요청 방법과 적절한 Flux.2 모델을 선택해야 합니다.
어떤 엔드포인트와 인증이 필요합니까?
Replicate Predictions API는 Black Forest Labs의 다양한 FLUX 모델을 표준 Replicate 형식을 통해 사용하여 고품질 이미지를 생성할 수 있는 기능을 제공합니다. 이 API는 신속한 프로토타입 제작부터 전문가급 이미지 생성까지 다양한 사용 사례에 최적화된 광범위한 FLUX 모델 변형을 지원합니다. 사용자는 URL 경로(https://api.cometapi.com/replicate/v1/models/{models}/predictions)에서 모델 이름만 변경하면 여러 모델 간에 원활하게 전환할 수 있어 다양한 크리에이티브 및 상업적 애플리케이션에 유연하게 활용할 수 있습니다.
코멧API https://api.cometapi.com/flux/v1/{model}에서 관리형 엔드포인트를 노출하고, 이미지 생성 및 편집을 위해 flux-2-pro, flux-2-flex, flux-2-flex와 같은 엔드포인트 이름을 지정합니다. 요청에는 API 키가 필요합니다. x-key 헤더.
모델 패밀리 및 컴퓨팅 트레이드오프
- FLUX.2 (개방형 가중치) — 로컬 제어, 연구 실험 또는 자체 인프라에서 추론을 실행해야 할 때 사용하세요. Dev는 개방형(32B)이며 탐색적 연구 및 미세 조정에 적합합니다. 구성 가능성이 더 높지만 인프라 및 최적화에 대한 책임은 사용자에게 있습니다.
- FLUX.2 프로 — 프로덕션을 위한 속도, 품질, 비용의 최적의 균형을 제공합니다. Pro 버전은 예측 가능한 지연 시간, 일관된 신속한 처리, 빠른 처리량을 위해 최적화되었으며, 최대 8개의 API 참조 이미지(API를 통해 총 9MP)를 지원합니다. 대량 편집이나 안정성과 예측 가능한 가격이 필요할 때 이 기능을 사용하세요.
- FLUX.2 (관리형 + 제어가능성) — 저수준 생성 제어를 노출합니다(예:
steps,guidance) 더 많은 참조(최대 10개)를 지원하고, 더 높은 지연 시간과 비용을 감수하더라도 품질/디테일이 약간 더 높아집니다. 타이포그래피 충실도, 정확한 색상, 또는 매우 세밀한 구성 조정 등 최종적인 크리에이티브 컨트롤이 필요할 때는 Flex를 사용하세요.
프로토타입에 대해 데브 또는 저렴한 찬성 계획한 다음 마이그레이션하세요 찬성 규모나 굽힘 엄격하게 제어된 최종 렌더링을 위해.
FLUX.2 API를 어떻게 사용하나요?
요청 라이프사이클(작업 + 폴링 모델)
편집/생성 요청에 대한 응답은 다음과 같습니다. 작업 객체 포함하는 polling_url 및 id요청을 생성한 후 폴링(또는 웹훅 사용)하여 서명된 결과 URL을 가져옵니다. 서명된 URL은 수명이 짧으므로(일반적으로 약 10분) 출력을 즉시 가져올 수 있습니다.
호스팅된 API는 비동기 작업 모델을 따릅니다.
- POST 생성 요청 → 반환
task id및polling_url추정치 추가cost. - 여론조사를 실시하다
polling_url까지status == "Ready", 이미지 결과(대개 base64 또는 호스팅 URL)를 검색합니다.
예: Python(요청) - 제출 및 투표
import time, requests, os
API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"
payload = {
"prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
"width": 1024, "height": 1024, "seed": 42
}
r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task
while True:
time.sleep(0.5)
status_r = requests.get(polling_url, headers={"x-key": API_KEY})
status_r.raise_for_status()
status = status_r.json()
if status == "Ready":
print("Result URL:", status)
break
elif status in ("Error", "Failed"):
print("Generation failed:", status)
break
이 패턴(제출 → 투표 또는 웹훅)은 관리되는 엔드포인트에 대한 기본 동기/비동기 흐름입니다.
이미지 편집 - 최소 예제(입력 URL이 있는 curl)
curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
-H "accept: application/json" \
-H "x-key: $CometAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
"input_image": "https://example.com/my-photo.jpg",
"width": 2048,
"height": 1536
}'
다중 참조 편집의 경우 다음을 사용하세요. input_image, input_image_2, input_image_3, … (Pro는 API를 통해 최대 8개의 참조를 지원하고, Flex는 최대 10개까지 지원하며, Dev는 메모리에 따라 최대 ~6개를 권장합니다).
어떤 기본 매개변수를 보내야 합니까?
중요한 요청 본문 필드(이미지 편집/생성)는 다음과 같습니다.
guidance및steps— 세부적인 제어가 가능합니다.prompt(문자열) — 최대 32K 토큰; 자세한 자연어 또는 구조화된 JSON.input_image(문자열) — 편집에 필요합니다(URL 또는 base64).input_image_2...input_image_9— 다중 참조 이미지.width/height— 16의 배수; 최대 4MP 출력.seed— 재현성을 위한 정수.safety_tolerance— 중간 수준.
전문적인 텍스트-이미지 생성을 위해 FLUX.2 Pro를 어떻게 활용할 수 있나요?
FLUX.2 Pro는 안정적이고 고품질의 결과물을 위해 설계되었습니다. 일관된 브랜드 수준의 결과물, 빠른 처리 시간, 그리고 기업 SLA(서비스 수준 계약)가 필요할 때 사용하세요.
워크플로 레시피 - 프로덕션 이미지
- 사전 처리 프롬프트: 짧은 "의도" 라인과 구조화된 속성 섹션(조명, 렌즈, 분위기, 브랜드 색상의 16진수 코드)을 유지하세요. FLUX.2는 브랜드 팔레트를 보존하는 데 도움이 되는 16진수 색상 조정을 지원합니다.
- 보수적인 기본값으로 시작하세요. 30
50단계와 지침 척도 69.0; 세부 사항에 대한 단계를 늘리고, 결과가 프롬프트에 더 엄격하게 부합하도록 지침을 늘립니다. - 시드 사용 + 결정론적 샘플링 A/B 테스트의 재현성을 위해.
- 다중 시도 샘플링의 경우 Pro 엔드포인트를 사용하세요. N개의 변형을 병렬로 요청하고 최상의 변형을 선택합니다. 이는 수동 하이퍼파라미터 튜닝보다 저렴하고 빠릅니다.
- 후처리: 결정론적 파이프라인에서 노이즈 제거, 미세 톤 매핑 또는 벡터 스타일 수정을 수행할 수 있습니다. 네이티브 출력보다 높은 출력이 필요한 경우 소규모 GAN 또는 초고해상도 패스를 고려하세요.
이러한 단계가 도움이 되는 이유: Pro는 속도와 충실도의 균형을 맞추고 일반적으로 차세대 안전/콘텐츠 필터를 적용하므로 고객 대상 자산에 대한 합리적인 기본값입니다.
이미지 생성을 위한 최고의 팁
1. 구조화된 프롬프트는 생산에 효과적입니다. 프롬프트를 우선순위별로 정리하세요: 주제 → 동작 → 스타일 → 맥락. 여러 이미지에 걸쳐 결정적인 구도가 필요한 경우 JSON 프롬프트(장면, 피사체, 카메라, 조명, 색상 팔레트)를 사용하세요. JSON 스키마 사용 예시(가상):
{
"scene": "product shot",
"subjects": [
{"type":"mug","pose":"center","style":"ceramic, matte"},
{"type":"background","style":"wooden desk, window light"}
],
"camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}
2. 재현성: 패스 seed 나중에 재현하기 위해. 추적을 위해 카탈로그 매핑 프롬프트 + 시드 → 이미지를 보관하세요.
3. 배치 및 오케스트레이션: 대규모 프로덕션 실행의 경우, Pro에 여러 요청을 병렬로 제출하되, 속도 제한을 설정하여 속도 조절을 방지하세요. 예측 가능한 지연 시간을 위해서는 Pro 엔드포인트를 사용하는 것이 좋습니다. 작업 대기열과 워커 풀을 사용하면 서명된 결과를 준비된 후 빠르게 다운로드할 수 있습니다.
4. 절제 및 안전: safety_tolerance 검토 엄격성을 제어합니다. Pro 엔드포인트에는 사용 정책 및 콘텐츠 검토 후크가 포함되어 있으며, 게시 전 서버 측 검사를 통합합니다.
5. 후처리: 전문가용 결과물은 품질이 뛰어나지만, 가끔은 약간의 보정이 필요합니다. 파이프라인에 자동화된 후처리 단계(자르기, 색상 보정, 합성)를 구축하고 브랜드에 민감한 에셋은 직접 검토하세요.
FLUX.2 Flex 엔드포인트를 사용하여 출력을 사용자 정의하려면 어떻게 해야 합니까?
Flex는 "수술 도구" 변형입니다. 단계, 안내, 부정적 프롬프트, 타일 크기 및 참조 수를 조정하여 출력을 정확하게 형성합니다.
Flex를 선택해야 하는 경우
- 정확한 인쇄 렌더링(UI 모형, 라벨)이 필요합니다.
- 포즈와 조명을 제어하면서 여러 참조를 합성해야 합니다.
- 고급 프롬프트 기술(구조화된 프롬프트, 제약 체인)을 실험하고 있습니다.
예 - Flex 컨트롤 키와 그 효과
steps— 단계가 많을수록 세부 사항이 더 세밀해집니다(대기 시간은 길어집니다).guidance_scale— 높을수록 텍스트 프롬프트에 가깝고, 낮을수록 창의성이 더 높습니다.negative_prompt— 요소를 명시적으로 제거합니다(예: "워터마크 없음, 추가 손가락 없음").tile_size/tiled_inference— 매우 높은 해상도 생성을 위해 타일 추론 공간을 사용하여 메모리를 속도와 교환합니다.reference_weights— 일부 엔드포인트에서는 포즈와 스타일을 중시하는 이미지에 대한 편향을 참조에 가중치를 부여할 수 있습니다.
실용적인 팁 : 복잡한 구성의 경우, 짧고 낮은 가이던스로 미리보기를 실행하여 구성을 확인한 다음, 더 많은 단계와 높은 가이던스를 적용하여 확장합니다. 이 두 단계 기법은 비용을 절감하는 동시에 정확한 최종 결과물을 제공합니다.
예: 단계 및 지침이 포함된 Flex 요청
curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
-H "Content-Type: application/json" \
-H "x-key: $BFL_API_KEY" \
-d '{
"prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
"width": 1536, "height": 2048,
"steps": 50,
"guidance": 7.5,
"seed": 99999
}'
Tip 최종 크리에이티브 승인 작업에는 Flex를 사용하고, 대규모의 빠른 파이프라인 작업에는 Pro를 사용하세요. Flex는 타이포그래피 및 세부적인 작업에서 훨씬 더 제어하기 쉽습니다.
프로덕션 사용을 위한 모범 사례
다음은 FLUX.2를 대규모로 통합하기 위한 실전에서 검증된 패턴과 실용적인 조언입니다.
1) 메가픽셀 추적 및 캐싱을 통한 비용 제어
FLUX.2 청구는 메가픽셀을 기준으로 합니다. 입력 + 출력대량 생성의 경우, 작은 미리보기 렌더링(저해상도 빠른 단계)을 선호하고 MP가 높은 최종 렌더링만 확대합니다. 렌더링된 에셋을 캐시하거나 diff를 저장하여 동일한 작업을 다시 렌더링하지 않도록 합니다. 항상 Surface를 사용합니다. cost 응답으로 보내고 요청별로 기록합니다.
2) 계층을 현명하게 사용하세요: 미리보기 대 최종 렌더링 분할
- 프로토타입이나 다양한 변형을 위해 빠르고 단계가 짧은 Pro 렌더링을 실행합니다.
- 충실도가 중요한 최종 승인 출력에는 Flex 또는 고감도 Pro를 사용하세요. 이러한 하이브리드 방식은 처리량과 최종 이미지 품질의 균형을 유지합니다.
3) 프롬프트 엔지니어링 → 구조화된 프롬프트 및 JSON
FLUX.2의 이점을 활용하세요 구조화된 JSON 프롬프트 결정론적 구성(장면 객체, 카메라, 포즈, 16진수 색상 견본)이 필요할 때. 이렇게 하면 반복적인 프롬프트 주기가 줄어들고 배치의 재현성이 향상됩니다. Cloudflare 예시는 여러 부분으로 구성된 양식에 JSON 프롬프트가 내장된 것을 보여줍니다.
4) 재현성을 위한 시드 + 버전 관리
재현 가능한 결과가 필요한 경우 다음을 전달하세요. seed 메타데이터에 모델 버전/타임스탬프를 기록합니다. 결정론적 자산 파이프라인의 경우 프롬프트, 시드, 모델 변형, 해상도, 참조 이미지 해시 등의 매니페스트를 유지합니다. 이를 통해 추적성과 롤백 옵션이 향상됩니다.
결론
FLUX.2는 "인상적인 데모"와 "제작 크리에이티브 도구" 사이의 간극을 메우는 데 중점을 두고 있습니다. 다중 참조 편집, 고해상도 출력, 그리고 호스팅된 엔드포인트 세트(개방형 추론 코드 및 양자화된 소비자 빌드 포함)를 통해 팀은 다양한 실용적인 옵션을 제공합니다. 연구 및 맞춤 설정을 위해 로컬에서 실행하거나, 안정적인 제작 파이프라인을 위해 호스팅된 Pro/Flex 엔드포인트를 사용할 수 있습니다.
개발자는 액세스할 수 있습니다 Flux.2 개발 API, Flux.2 Flex API 및 Flux.2 Pro API CometAPI를 통해. 시작하려면 CometAPI의 모델 기능을 살펴보세요. 운동장 그리고 상담하십시오 API 가이드 자세한 내용은 CometAPI를 참조하세요. 접속하기 전에 CometAPI에 로그인하고 API 키를 발급받았는지 확인하세요. 와e티피에이 공식 가격보다 훨씬 낮은 가격을 제공하여 통합을 돕습니다.
출발 준비 되셨나요?→ 지금 CometAPI에 가입하세요 !
