FLUX.2は、Black Forest Labsの第2世代画像生成・編集モデルファミリーです(2025年11月25日リリース)。プロダクショングレードのフォトリアリズム、最大4MPのマルチリファレンス編集、構造化/JSONプロンプト、そして管理エンドポイント(Pro、Flex)とオープンウェイトオプション(Dev)の選択肢を提供します。
朗報です。CometAPI は Flux.2 API を統合しました。このガイドでは、FLUX.2 とは何か、API の呼び出し方法、高度なワークフロー(テキスト→画像、柔軟な制御、複数参照編集)について、コード例とベストプラクティスを交えて解説します。
FLUX.2 とは何ですか? なぜ重要なのですか?
FLUX.2は、FLUXファミリーの画像モデルの後継モデルであり、プロダクション解像度(最大約4メガピクセル)での高忠実度のテキスト画像生成と複数参照画像編集のために設計されています。FLUX.2は、デモではなく、実際のクリエイティブワークフロー(ブランドセーフなアセット、参照間での一貫した文字とスタイル、優れたタイポグラフィと細部の表現)向けに構築されており、生成された画像と実際の画像とのギャップを埋めることを目指しています。
FLUX.2の主な成果は、
- 広告、製品画像、UI モックアップに適したフォトリアリスティックな出力。
- ネイティブのマルチ参照編集: 1 回の編集で複数の入力画像の要素を結合、交換、または構成します。
- さまざまなユースケース向けのバリエーション: 公開されている開発者モデル、本番環境向けに最適化された Pro エンドポイント、低レベルの制御用の Flex エンドポイント。
FLUX.2は、潜在的生成バックボーン(フロー/トランスフォーマーアーキテクチャ)と、セマンティックグラウンディングのための視覚言語モデル、そして新たに学習されたVAEを組み合わせて、バリアント間で共有される潜在空間を提供します。この設計により、モデルは生成と再構築(編集)の両方を高い忠実度で実行しながら、学習と微調整のための表現を学習可能に維持できます。このオープンVAEは、ホスト型およびセルフホスト型のワークフローの潜在空間を標準化している点で特に注目に値します。
これが重要な理由:言語と潜在フローマッチングを組み合わせることで、プロンプトへの追従性が向上し(複数のパートから成る構成指示が予測通りに動作する)、タイポグラフィが向上し、複数の参照による生成と編集の両方をサポートする単一のアーキテクチャが実現します。クリエイターにとって、これは複雑な指示や混合入力(テキストと画像)に対して、より信頼性の高い出力を実現することを意味します。
FLUX.2 API にアクセスするにはどうすればよいですか?
環境を整える
CometAPI に登録してログインし、プロフィールパネルから API キーを取得してください。開発者として、ある程度の API 知識をお持ちであることが理想的です(この点についてはサポートいたしますのでご安心ください)。
また、希望するリクエスト方法と適切な Flux.2 モデルを選択する必要があります。
どのようなエンドポイント、認証が必要ですか?
Replicate Predictions APIは、Black Forest Labsの様々なFLUXモデルを用いて、標準のReplicateフォーマットで高品質な画像を生成するためのアクセスを提供します。このAPIは、ラピッドプロトタイピングからプロフェッショナルグレードの画像生成まで、様々なユースケースに合わせて最適化された、幅広いFLUXモデルのバリエーションをサポートしています。ユーザーは、URLパス(https://api.cometapi.com/replicate/v1/models/{models}/predictions)内のモデル名を変更するだけで、異なるモデルをシームレスに切り替えることができるため、様々なクリエイティブアプリケーションや商用アプリケーションに柔軟に対応できます。
コメットAPI https://api.cometapi.com/flux/v1/{model} で管理エンドポイントを公開し、画像作成と編集用のエンドポイントを flux-2-pro、flux-2-flex、flux-2-flex などと名付けています。リクエストには API キーが必要です。 x-key ヘッダー 。
モデルファミリーとコンピューティングのトレードオフ
- FLUX.2 (オープンウェイト) — ローカル制御、研究実験、または独自のインフラストラクチャ上で推論を実行する必要がある場合に使用します。Devはオープンウェイト(32B)で、探索的研究や微調整に最適です。より柔軟に構成できますが、インフラストラクチャと最適化はお客様の責任となります。
- FLUX.2 プロ — 制作におけるスピード、品質、コストの最適なバランス。Pro版は、予測可能なレイテンシ、一貫したプロンプト遵守、高速スループットを実現するよう調整されており、最大8枚のAPI参照画像(API経由合計9MP)をサポートします。大量の編集作業や、信頼性と予測可能な価格設定が必要な場合にご利用ください。
- FLUX.2 (管理 + 制御性) — 低レベルの生成制御を公開する(例:
steps,guidance)をサポートし、より多くの参照(最大10個)と、若干高い品質/ディテールをサポートしますが、レイテンシとコストの増加を許容する必要があります。タイポグラフィの忠実度、正確な色、または非常に詳細な構成調整など、最終的なクリエイティブコントロールが必要な場合は、Flexをご利用ください。
プロトタイプオン デベロッパー または低コストの Pro 計画し、移行する Pro スケールまたは 硬さ(フレックス Flex) 高度に制御された最終レンダリングを実現します。
FLUX.2 API を使用するにはどうすればよいですか?
リクエストライフサイクル(タスク + ポーリングモデル)
編集/生成リクエストへの応答は タスクオブジェクト を含む polling_url および id; リクエストを作成し、ポーリング(またはWebhookの使用)して署名付き結果URLを取得します。署名付きURLの有効期間は短い(通常約10分)ため、出力は速やかに取得してください。
ホストされた API は非同期タスク モデルに従います。
- 生成リクエストをPOST → 返します
task idおよびpolling_urlプラス推定cost. - 投票する
polling_urlまでstatus == "Ready"、画像の結果 (多くの場合、base64 またはホストされた URL) を取得します。
例: Python (リクエスト) - 送信とポーリング
import time, requests, os
API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"
payload = {
"prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
"width": 1024, "height": 1024, "seed": 42
}
r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task
while True:
time.sleep(0.5)
status_r = requests.get(polling_url, headers={"x-key": API_KEY})
status_r.raise_for_status()
status = status_r.json()
if status == "Ready":
print("Result URL:", status)
break
elif status in ("Error", "Failed"):
print("Generation failed:", status)
break
このパターン (送信 → ポーリングまたは Webhook) は、管理対象エンドポイントの主な同期/非同期フローです。
画像編集 — 最小限の例 (入力 URL を指定した curl)
curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
-H "accept: application/json" \
-H "x-key: $CometAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
"input_image": "https://example.com/my-photo.jpg",
"width": 2048,
"height": 1536
}'
複数参照編集の場合は、 input_image, input_image_2, input_image_3、…(Pro は API 経由で最大 8 つの参照をサポート、Flex は最大 10、Dev はメモリに応じて最大 6 を推奨)。
どのような基本パラメータを送信すればよいですか?
重要なリクエスト本文フィールド (画像編集/生成) には次のものが含まれます。
guidanceおよびsteps— きめ細かな制御が可能になります。prompt(文字列) — 最大 32K トークン。詳細な自然言語または構造化された JSON。input_image(文字列) — 編集に必須 (URL または base64)。input_image_2...input_image_9— 複数の参照画像。width/height— 16 の倍数; 最大出力 4MP。seed— 再現性のための整数。safety_tolerance— 節度レベル。
FLUX.2 Pro を活用してプロフェッショナルなテキスト画像生成を行うにはどうすればよいでしょうか?
FLUX.2 Proは、信頼性の高い高品質な出力を実現するよう調整されています。ブランドレベルの一貫した成果、迅速な納期、そしてエンタープライズSLAが必要な場合にご利用ください。
ワークフローレシピ - 制作イメージ
- 前処理プロンプト: 簡潔な「意図」行と、構造化された属性セクション(照明、レンズ、ムード、ブランドカラーのカラー16進コード)を維持します。FLUX.2は、ブランドカラーパレットの維持を支援するために、16進カラーステアリングをサポートしています。
- 保守的なデフォルトから始めます。 ステップ 30 ~ 50、ガイダンス スケール 6 ~ 9.0。詳細についてはステップを増やし、結果がプロンプトに厳密に準拠するようにガイダンスを増やします。
- シードと決定論的サンプリングを使用する A/B テストの再現性のため。
- マルチトライサンプリングには Pro エンドポイントを使用します。 N 個のバリエーションを並列に要求し、最適なものを選択します。手動によるハイパーパラメータ調整よりも安価で高速です。
- 後処理: ノイズ除去、軽微なトーンマッピング、あるいはベクター形式の修正を決定論的なパイプラインで行います。ネイティブ出力よりも高い出力が必要な場合は、小規模なGANパスや超解像パスの使用を検討してください。
これらの手順が役立つ理由: Pro は速度と忠実度のバランスを取り、通常は生成後の安全性/コンテンツ フィルターを適用するため、顧客向けアセットの適切なデフォルトとなります。
画像生成のベストヒント
1. 構造化されたプロンプトが生産性の向上に繋がります。 プロンプトは優先度順に整理します:被写体 → アクション → スタイル → コンテキスト。多数の画像に渡って決定論的な構図が必要な場合は、JSONプロンプト(シーン、被写体、カメラ、照明、カラーパレット)を使用します。JSONスキーマの使用例(擬似例):
{
"scene": "product shot",
"subjects": [
{"type":"mug","pose":"center","style":"ceramic, matte"},
{"type":"background","style":"wooden desk, window light"}
],
"camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}
2.再現性: 合格 seed 後で再現するため。トレーサビリティのために、カタログマッピングのプロンプト + シード → 画像を保存しておいてください。
3. バッチとオーケストレーション: 大規模な本番環境では、Pro エンドポイントに多数のリクエストを並列送信しますが、スロットリングを回避するためにレート制限を設けてください。レイテンシを予測したい場合は、Pro エンドポイントを推奨します。ジョブキューとワーカープールを使用すると、署名済みの結果が準備でき次第、迅速にダウンロードできます。
4. 節度と安全性: safety_tolerance モデレーションの厳しさを制御します。Proエンドポイントには利用ポリシーとコンテンツモデレーションフックが含まれており、公開前にサーバー側のチェックを統合します。
5. 後処理: プロ仕様の出力は高品質ですが、細かい修正が必要な場合があります。パイプラインに自動ポストプロセス(切り抜き、カラーグレーディング、合成)を組み込み、ブランドイメージに敏感なアセットについては人間によるレビューを実施してください。
FLUX.2 Flex エンドポイントを使用して出力をカスタマイズするにはどうすればよいですか?
Flex は「外科用ツール」のバリエーションです。ステップ、ガイダンス、否定プロンプト、タイル サイズ、参照カウントを調整して、出力を正確に形作ります。
Flexを選択する場合
- 正確なタイポグラフィのレンダリング (UI モックアップ、ラベル) が必要です。
- ポーズと照明を制御しながら複数の参照を合成する必要があります。
- 高度なプロンプト手法 (構造化プロンプト、制約のチェーン) を試しています。
例 - Flexコントロールキーとその効果
steps— ステップ数が多いほど、詳細度が高くなります (遅延が発生します)。guidance_scale— 高いほどテキストプロンプトに近くなり、低いほど創造性が増します。negative_prompt— 要素を明示的に削除します(例:「透かしなし、余分な指なし」)。tile_size/tiled_inference— 非常に高解像度の生成の場合、推論空間をタイル化してメモリを節約し、速度を上げます。reference_weights— 一部のエンドポイントでは、参照に重みを付けて、どの画像がポーズとスタイルを決定するかを判断できます。
実用的なヒント: 複雑な構成の場合は、短時間で低ガイドのプレビューを実行して構成を確認し、その後、ステップ数を増やして高ガイドでアップスケールします。この2パス手法により、コストを削減しながら正確な最終出力が得られます。
例: 手順とガイダンス付きのFlexリクエスト
curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
-H "Content-Type: application/json" \
-H "x-key: $BFL_API_KEY" \
-d '{
"prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
"width": 1536, "height": 2048,
"steps": 50,
"guidance": 7.5,
"seed": 99999
}'
ヒント: 最終的なクリエイティブなサインオフにはFlexを、大規模で高速なパイプラインにはProをご使用ください。Flexは、タイポグラフィや微細なディテールの作業において、より優れた制御性を実現します。
本番環境での使用に関するベストプラクティス
以下は、FLUX.2 を大規模に統合するための実証済みのパターンと実用的なアドバイスです。
1) メガピクセルの追跡とキャッシュによるコスト管理
FLUX.2の課金はメガピクセルに基づいて行われます 入力 + 出力大量の生成を行う場合は、低解像度のプレビューレンダリング(クイックステップ)を優先し、高解像度の最終レンダリングにのみエスカレーションします。レンダリングしたアセットをキャッシュ(または差分を保存)して、同一のジョブを再レンダリングしないようにします。常にサーフェスを cost 応答で使用し、リクエストごとにログに記録します。
2) 階層を賢く使う: プレビューと最終レンダリングの分割
- プロトタイプや多数のバリエーションを作成するために、高速で低ステップの Pro レンダリングを実行します。
- 忠実度が重要となる最終承認出力には、Flexまたは高MP Proランをご利用ください。このハイブリッドアプローチは、スループットと最終的な画質のバランスを実現します。
3) プロンプトエンジニアリング → 構造化されたプロンプトとJSON
FLUX.2の 構造化されたJSONプロンプト シーンオブジェクト、カメラ、ポーズ、16進カラースウォッチなどの確定的な構成が必要な場合に使用します。これにより、反復的なプロンプトサイクルが削減され、より再現性の高いバッチ処理が可能になります。Cloudflareの例では、マルチパートフォームに埋め込まれたJSONプロンプトを示しています。
4) 再現性のためのシード+バージョン管理
再現性のある結果が必要な場合は、 seed モデルのバージョンとタイムスタンプをメタデータに記録します。決定論的なアセットパイプラインを実現するには、プロンプト、シード、モデルのバリアント、解像度、参照画像のハッシュを含むマニフェストを保持します。これにより、トレーサビリティとロールバックのオプションが向上します。
結論
FLUX.2は、「印象的なデモ」と「制作用クリエイティブツール」の間のギャップを埋めることに真摯に取り組んでいます。マルチリファレンス編集、高解像度出力、そしてホスト型エンドポイント(さらにオープンな推論コードと量子化されたコンシューマービルド)のセットにより、FLUX.2はチームに多くの実用的なオプションを提供します。ローカルで実行してリサーチやカスタマイズを行うか、ホスト型Pro/Flexエンドポイントを使用して安定した制作パイプラインを構築するかを選択できます。
開発者はアクセスできる Flux.2 開発 API, Flux.2 フレックス API および Flux.2 プロ API CometAPIを通じて。まずは、CometAPIのモデル機能を プレイグラウンド そして相談する APIガイド 詳細な手順についてはこちらをご覧ください。アクセスする前に、CometAPIにログインし、APIキーを取得していることを確認してください。 とeタピ 統合を支援するために、公式価格よりもはるかに低い価格を提供します。
準備はいいですか?→ 今すぐCometAPIに登録しましょう !
