Flux.2 API 사용 방법? 알아야 할 모든 것

FLUX.2는 Black Forest Labs의 2세대 이미지 생성 및 이미지 편집 모델 제품군입니다(2025년 11월 25일 출시). 이 제품군은 프로덕션급 포토리얼리즘, 최대 4MP의 멀티 레퍼런스 편집, 구조화된/JSON 프롬프팅, 그리고 관리형 엔드포인트(Pro, Flex)와 오픈 웨이트 옵션(Dev)을 제공합니다.

좋은 소식은 CometAPI가 Flux.2 API를 통합했다는 점입니다. 이 가이드에서는 FLUX.2가 무엇인지, API를 호출하는 방법, 그리고 고급 워크플로(텍스트→이미지, 유연한 제어, 멀티 레퍼런스 편집)를 코드 예제와 모범 사례와 함께 설명합니다.

FLUX.2란 무엇이며 왜 중요한가요?

FLUX.2는 FLUX 이미지 모델 제품군의 후속 버전으로, 높은 충실도의 텍스트-투-이미지 생성과 프로덕션 해상도(최대 약 4메가픽셀)에서의 멀티 레퍼런스 이미지 편집을 위해 설계되었습니다. FLUX.2는 데모보다 실제 크리에이티브 워크플로(브랜드 안전 자산, 레퍼런스 간 일관된 캐릭터와 스타일, 더 나은 타이포그래피와 작은 디테일)를 위해 만들어졌으며, 생성 이미지와 실제 이미지 간의 격차를 줄이는 것을 목표로 합니다.

FLUX.2가 제공하도록 설계된 핵심 결과

광고, 제품 이미지, UI 목업에 적합한 포토리얼리스틱 출력.
네이티브 멀티 레퍼런스 편집: 여러 입력 이미지의 요소를 단일 편집에서 결합, 교체 또는 합성.
다양한 사용 사례를 위한 변형: 공개적으로 사용 가능한 개발자 모델, 프로덕션에 최적화된 Pro 엔드포인트, 저수준 제어를 위한 Flex 엔드포인트.

상위 수준에서 FLUX.2는 잠재 생성 백본(플로우/트랜스포머 아키텍처)과 의미적 기반을 위한 비전-언어 모델, 그리고 변형 전반에 걸쳐 공유 잠재 공간을 제공하기 위해 새롭게 학습된 VAE를 결합합니다. 이 설계는 모델이 더 높은 충실도로 생성과 재구성(편집)을 모두 수행할 수 있게 하면서도, 학습 및 파인튜닝을 위해 표현을 학습 가능하게 유지합니다. 오픈 VAE는 특히 주목할 만한데, 호스팅 및 셀프 호스팅 워크플로 모두에 대해 잠재 공간을 표준화하기 때문입니다.

이것이 중요한 이유: 언어와 잠재 플로우 매칭을 결합하면 더 강력한 프롬프트 준수(즉, 여러 부분으로 이루어진 구성적 지시가 예측 가능하게 작동), 더 나은 타이포그래피, 그리고 다중 레퍼런스를 활용하는 생성 및 편집을 모두 지원하는 단일 아키텍처를 얻을 수 있습니다. 제작자에게 이는 복잡한 지시와 혼합 입력(텍스트 + 이미지)에 대해 더 신뢰할 수 있는 출력을 의미합니다.

FLUX.2 API에 어떻게 접근하나요?

환경 준비

CometAPI에 가입하고 로그인한 후 프로필 패널에서 API 키를 받으세요. 이상적으로는 개발자로서 약간의 API 지식이 있으면 좋습니다(이와 관련해 도움을 제공하므로 걱정하지 않으셔도 됩니다).

또한 원하는 요청 방식과 적절한 Flux.2 모델을 선택해야 합니다.

어떤 엔드포인트와 인증이 필요한가요?

Replicate Predictions API는 표준 Replicate 형식을 통해 Black Forest Labs의 다양한 FLUX 모델을 사용하여 고품질 이미지를 생성할 수 있는 접근을 제공합니다. 이 API는 빠른 프로토타이핑부터 전문가급 이미지 생성까지 다양한 사용 사례에 최적화된 포괄적인 FLUX 모델 변형을 지원합니다. 사용자는 URL 경로(https://api.cometapi.com/replicate/v1/models/{models}/predictions)에서 모델 이름만 변경하여 서로 다른 모델 간에 원활하게 전환할 수 있으므로, 다양한 크리에이티브 및 상업적 애플리케이션에 유연하게 사용할 수 있습니다.

CometAPI는 https://api.cometapi.com/flux/v1/{model} 아래에 관리형 엔드포인트를 제공하며, 이미지 생성 및 편집을 위해 flux-2-pro, flux-2-flex 및 flux-2-flex와 같은 엔드포인트 이름을 사용합니다. 요청에는 x-key 헤더에 API 키가 필요합니다.

모델 제품군 및 컴퓨팅 트레이드오프

FLUX.2 (오픈 웨이트) — 로컬 제어, 연구 실험 또는 자체 인프라에서 추론을 실행해야 할 때 사용합니다. Dev는 오픈 웨이트(32B)이며 탐색적 연구와 파인튜닝에 매우 적합합니다. 더 많은 설정이 가능하지만 인프라와 최적화는 직접 책임져야 합니다.
FLUX.2 pro — 프로덕션에서 속도, 품질, 비용의 균형이 가장 좋습니다. Pro는 예측 가능한 지연 시간, 일관된 프롬프트 준수, 빠른 처리량에 맞게 조정되었으며 최대 8개의 API 레퍼런스 이미지(API 기준 총 9MP)를 지원합니다. 대량 편집과 신뢰성 및 예측 가능한 가격이 필요할 때 사용하세요.
FLUX.2 (관리형 + 제어 가능성) — 저수준 생성 제어(예: steps, guidance)를 제공하고 더 많은 레퍼런스(최대 10개)와, 더 높은 지연 시간과 비용을 감수하는 경우 약간 더 높은 품질/디테일을 지원합니다. 최종적인 크리에이티브 제어(타이포그래피 충실도, 정확한 색상, 매우 세밀한 구성 조정)가 필요할 때 Flex를 사용하세요.

Dev 또는 저비용 Pro 플랜에서 프로토타이핑한 뒤, 규모 확장을 위해 Pro로, 고도로 제어된 최종 렌더를 위해 Flex로 전환하세요.

FLUX.2 API를 어떻게 사용하나요?

요청 라이프사이클(작업 + 폴링 모델)

편집/생성 요청에 대한 응답은 polling_url과 id를 포함하는 작업 객체입니다. 요청을 생성한 다음 폴링(또는 웹훅 사용)을 통해 서명된 결과 URL을 가져옵니다. 서명된 URL은 수명이 짧기 때문에(일반적으로 약 10분) 결과는 신속히 가져와야 합니다.

호스팅 API는 비동기 작업 모델을 따릅니다.

생성 요청을 POST → task id, polling_url, 예상 cost를 반환.
status == "Ready"가 될 때까지 polling_url을 폴링한 후 이미지 결과(대개 base64 또는 호스팅된 URL)를 가져옵니다.

예시: Python (requests) — 제출 및 폴링

import time, requests, os

API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"

payload = {
    "prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
    "width": 1024, "height": 1024, "seed": 42
}

r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task

while True:
    time.sleep(0.5)
    status_r = requests.get(polling_url, headers={"x-key": API_KEY})
    status_r.raise_for_status()
    status = status_r.json()
    if status == "Ready":
        print("Result URL:", status)
        break
    elif status in ("Error", "Failed"):
        print("Generation failed:", status)
        break

이 패턴(제출 → 폴링 또는 웹훅)은 관리형 엔드포인트의 기본적인 동기/비동기 흐름입니다.

이미지 편집 — 최소 예시(curl with input URL)

curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
  -H "accept: application/json" \
  -H "x-key: $CometAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
    "input_image": "https://example.com/my-photo.jpg",
    "width": 2048,
    "height": 1536
  }'

멀티 레퍼런스 편집의 경우 input_image, input_image_2, input_image_3, …를 사용합니다(Pro는 API를 통해 최대 8개 레퍼런스 지원, Flex는 최대 10개, Dev는 메모리에 따라 최대 약 6개 권장).

어떤 기본 파라미터를 보내야 하나요?

중요한 요청 본문 필드(이미지 편집/생성)는 다음과 같습니다:

guidance 및 steps — 세밀한 제어를 가능하게 합니다.
prompt (string) — 최대 32K 토큰, 상세한 자연어 또는 구조화된 JSON.
input_image (string) — 편집 시 필수(URL 또는 base64).
input_image_2 … input_image_9 — 멀티 레퍼런스 이미지.
width / height — 16의 배수, 출력 최대 4MP.
seed — 재현성을 위한 정수.
safety_tolerance — 조정 수준.

전문적인 텍스트-투-이미지 생성에 FLUX.2 Pro를 어떻게 활용할 수 있나요?

FLUX.2 Pro는 신뢰할 수 있고 고품질의 출력에 맞게 조정되어 있습니다. 일관된 브랜드 수준 결과, 빠른 처리 시간, 엔터프라이즈 SLA가 필요할 때 사용하세요.

워크플로 레시피 — 프로덕션 이미지

프롬프트 전처리: 짧은 “의도” 한 줄과 구조화된 속성 섹션(조명, 렌즈, 분위기, 브랜드 색상을 위한 색상 hex 코드)을 유지하세요. FLUX.2는 브랜드 팔레트 보존을 돕기 위해 hex 색상 제어를 지원합니다.
보수적인 기본값으로 시작: steps 30–50, guidance scale 6–9.0. 디테일이 필요하면 steps를 늘리고, 결과가 프롬프트를 더 엄격히 따르게 하려면 guidance를 높이세요.
재현성을 위해 seeds + deterministic sampling 사용: A/B 테스트에 유용합니다.
다중 시도 샘플링에는 Pro 엔드포인트 사용: N개의 변형을 병렬로 요청하고 가장 좋은 결과를 선택하세요. 수동 하이퍼파라미터 튜닝보다 더 저렴하고 빠릅니다.
후처리: 디노이즈, 약간의 톤 매핑 또는 결정론적 파이프라인에서 벡터 스타일 터치업을 수행하세요. 기본 출력보다 더 높은 해상도가 필요하면 작은 GAN 또는 초해상도 패스를 고려하세요.

이 단계들이 도움이 되는 이유: Pro는 속도와 충실도의 균형을 맞추며 일반적으로 생성 후 안전/콘텐츠 필터를 적용하므로, 고객 대상 자산에 대한 합리적인 기본 선택입니다.

이미지 생성 모범 팁

1. 프로덕션에서는 구조화된 프롬프팅이 유리합니다. 프롬프트를 우선순위별로 구성하세요: subject → action → style → context. 많은 이미지에서 결정론적 구성이 필요할 때는 JSON 프롬프팅(scene, subjects, camera, lighting, color_palette)을 사용하세요. 예시 JSON 스키마 사용법(의사 예시):

{
  "scene": "product shot",
  "subjects": [
    {"type":"mug","pose":"center","style":"ceramic, matte"},
    {"type":"background","style":"wooden desk, window light"}
  ],
  "camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}

2. 재현성: 나중에 재현하려면 seed를 전달하세요. 추적 가능성을 위해 prompt + seed → image 매핑 카탈로그를 유지하세요.

3. 배치 및 오케스트레이션: 대규모 프로덕션 실행에서는 많은 요청을 Pro에 병렬 제출하되, 스로틀링을 피하기 위해 속도 제한을 적용하세요. 예측 가능한 지연 시간을 위해 Pro 엔드포인트를 선호하세요. 서명된 결과가 준비되면 즉시 다운로드할 수 있도록 작업 큐와 워커 풀을 사용하세요.

4. 조정 및 안전: safety_tolerance를 사용하여 조정 엄격도를 제어하세요. Pro 엔드포인트에는 사용 정책 및 콘텐츠 조정 훅이 포함되어 있으므로, 게시 전에 서버 측 검사를 통합하세요.

5. 후처리: Pro 출력은 고품질이지만 가끔 작은 리터치가 필요할 수 있습니다. 파이프라인에 자동 후처리 단계(크롭, 색보정, 합성)를 구축하고 브랜드 민감 자산에 대해서는 사람 검수를 유지하세요.

FLUX.2 Flex 엔드포인트로 출력을 어떻게 사용자 지정할 수 있나요?

Flex는 “정밀 도구” 변형입니다. steps, guidance, negative prompts, tile sizes, reference counts를 조정하여 출력을 정교하게 형성할 수 있습니다.

Flex를 선택해야 하는 경우

정밀한 타이포그래피 렌더링(UI 목업, 라벨)이 필요할 때.
포즈와 조명에 대한 제어를 유지하며 여러 레퍼런스를 합성해야 할 때.
고급 프롬프트 기법(구조화된 프롬프트, 제약 조건 체인)을 실험 중일 때.

예시 — Flex 제어 키와 그 효과

steps — steps가 많을수록 더 세밀한 디테일(대신 지연 시간 증가).
guidance_scale — 높을수록 텍스트 프롬프트에 더 가깝고, 낮을수록 더 창의적.
negative_prompt — 요소를 명시적으로 제거(예: “no watermark, no extra fingers”).
tile_size / tiled_inference — 매우 고해상도 생성을 위해 메모리와 속도를 교환하며 추론 공간을 타일링.
reference_weights — 일부 엔드포인트에서는 어떤 이미지가 포즈와 스타일에 더 큰 영향을 줄지 가중치를 설정할 수 있습니다.

실용적인 팁: 복잡한 구성의 경우 짧고 low-guidance인 미리보기로 구성을 확인한 뒤, 더 많은 steps와 더 높은 guidance로 업스케일하세요. 이 2패스 기법은 비용을 줄이면서도 정밀한 최종 출력을 제공합니다.

예시: steps 및 guidance를 포함한 Flex 요청

curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
  -H "Content-Type: application/json" \
  -H "x-key: $BFL_API_KEY" \
  -d '{
    "prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
    "width": 1536, "height": 2048,
    "steps": 50,
    "guidance": 7.5,
    "seed": 99999
  }'

팁: 최종 크리에이티브 승인 단계에서는 Flex를, 대규모의 더 빠른 파이프라인에서는 Pro를 사용하세요. 타이포그래피와 미세 디테일 작업에서는 Flex가 눈에 띄게 더 높은 제어성을 제공합니다.

프로덕션 사용 모범 사례

아래는 대규모로 FLUX.2를 통합할 때 검증된 패턴과 실용적인 조언입니다.

1) 메가픽셀 추적 및 캐싱으로 비용 제어

FLUX.2 과금은 입력 + 출력의 메가픽셀 기준입니다. 대량 생성에서는 더 작은 미리보기 렌더(저해상도 빠른 steps)를 선호하고, 최종 렌더에만 더 높은 MP로 올리세요. 렌더링된 자산(또는 diff)을 캐시하여 동일한 작업을 다시 렌더링하지 않도록 하세요. 항상 응답의 cost를 표시하고 요청별로 로깅하세요.

2) 티어를 현명하게 사용: preview vs final-render 분리

프로토타이핑이나 많은 변형 생성에는 빠르고 낮은 step의 Pro 렌더를 실행하세요.
충실도가 중요한 최종 승인 출력에는 Flex 또는 고MP Pro 실행을 사용하세요. 이 하이브리드 접근법은 처리량과 최종 이미지 품질의 균형을 맞춥니다.

3) 프롬프트 엔지니어링 → 구조화된 프롬프트 및 JSON

결정론적 구도(장면 객체, 카메라, 포즈, hex 색상 스와치)가 필요할 때 FLUX.2의 구조화된 JSON 프롬프팅을 활용하세요. 이는 반복적인 프롬프팅 사이클을 줄이고, 더 재현 가능한 배치 결과로 이어집니다. Cloudflare 예제에서는 multipart forms에 JSON 프롬프트를 포함합니다.

4) 재현성을 위한 seed + 버전 관리

재현 가능한 결과가 필요할 때는 seed를 전달하고 메타데이터에 모델 버전/타임스탬프를 기록하세요. 결정론적 자산 파이프라인을 위해 manifest를 유지하세요: prompt, seed, model variant, resolution, reference image hashes. 이렇게 하면 추적성과 롤백 옵션이 향상됩니다.

결론

FLUX.2는 “인상적인 데모”와 “프로덕션용 크리에이티브 도구” 사이의 격차를 줄이는 데 초점을 맞추고 있습니다. 멀티 레퍼런스 편집, 고해상도 출력, 호스팅 엔드포인트 세트(오픈 추론 코드와 양자화된 소비자 빌드 포함)를 통해 팀에 많은 실질적 선택지를 제공합니다. 연구 및 사용자 지정을 위해 로컬에서 실행하거나, 안정적인 프로덕션 파이프라인을 위해 호스팅된 Pro/Flex 엔드포인트를 사용할 수 있습니다.

개발자는 CometAPI를 통해 Flux.2 Dev API, Flux.2 Flex API 및 Flux.2 Pro API에 접근할 수 있습니다. 시작하려면 Playground에서 CometAPI의 모델 기능을 살펴보고, 자세한 지침은 API guide를 참조하세요. 접근하기 전에 반드시 CometAPI에 로그인하고 API 키를 발급받았는지 확인하세요. CometAPI는 통합을 돕기 위해 공식 가격보다 훨씬 저렴한 가격을 제공합니다.

준비되셨나요? → 지금 CometAPI에 가입하세요!

AI 관련 더 많은 팁, 가이드, 뉴스가 궁금하다면 VK, X, Discord에서 저희를 팔로우하세요!