Wie verwendet man die Flux.2-API? Alles, was Sie wissen müssen

FLUX.2 ist die zweite Generation der Bildgenerierungs- und Bildbearbeitungsmodelle von Black Forest Labs (Veröffentlichung: 25. November 2025). Es bietet fotorealistische Ergebnisse in Produktionsqualität, Multi-Referenz-Bearbeitung bis zu 4 MP, strukturierte/JSON-Eingabeaufforderungen sowie die Wahl zwischen verwalteten Endpunkten (Pro, Flex) und offenen Optionen (Dev).

Die gute Nachricht ist, dass CometAPI die Flux.2-API integriert hat. Dieser Leitfaden erklärt, was FLUX.2 ist, wie man die API aufruft und bietet fortgeschrittene Workflows (Text→Bild, flexible Steuerung, Bearbeitung mehrerer Referenzen) mit Codebeispielen und Best Practices.

Was ist FLUX.2 und warum ist es wichtig?

FLUX.2 ist der Nachfolger der FLUX-Bildmodellfamilie und wurde für die detailgetreue Text-zu-Bild-Generierung sowie die Bearbeitung von Bildern mit mehreren Referenzen in Produktionsauflösungen (bis zu ca. 4 Megapixel) entwickelt. FLUX.2 ist für reale kreative Workflows konzipiert (markensichere Assets, konsistente Zeichen und Stile über alle Referenzen hinweg, verbesserte Typografie und feinere Details) und nicht für Demos. Ziel ist es, die Lücke zwischen generierten und realen Bildern zu schließen.

Wichtigste Ergebnisse, die FLUX.2 liefern soll

Fotorealistische Ergebnisse, geeignet für Werbung, Produktabbildungen und UI-Mockups.
Native Multi-Referenz-Bearbeitung: Elemente aus mehreren Eingabebildern in einem einzigen Bearbeitungsvorgang kombinieren, austauschen oder zusammensetzen.
Varianten für verschiedene Anwendungsfälle: frei verfügbare Entwicklermodelle, ein für den Produktiveinsatz optimierter Pro-Endpunkt und ein Flex-Endpunkt für die Low-Level-Steuerung.

FLUX.2 kombiniert auf hohem Niveau ein latentes generatives Backbone (Flow/Transformer-Architektur) mit einem Bild-Sprach-Modell zur semantischen Verankerung und einem neu trainierten VAE, um einen gemeinsamen latenten Raum für verschiedene Varianten bereitzustellen. Dieses Design ermöglicht es dem Modell, sowohl Generierung als auch Rekonstruktion (Bearbeitung) mit höherer Genauigkeit durchzuführen, während die Repräsentation für Training und Feinabstimmung lernbar bleibt. Der offene VAE ist besonders hervorzuheben, da er den latenten Raum für gehostete und selbstgehostete Workflows standardisiert.

Warum das wichtig ist: Die Verknüpfung von Sprache und latentem Ablaufvergleich führt zu einer präziseren Befehlsausführung (sodass mehrteilige, zusammengesetzte Anweisungen vorhersehbar funktionieren), einer besseren Typografie und einer einheitlichen Architektur, die sowohl die Generierung als auch die Bearbeitung mit mehreren Referenzen unterstützt. Für Kreative bedeutet das zuverlässigere Ergebnisse bei komplexen Anweisungen und gemischten Eingaben (Text + Bilder).

Wie greife ich auf die FLUX.2-API zu?

Bereiten Sie die Umgebung vor

Registrieren Sie sich bei CometAPI und melden Sie sich an. Ihren API-Schlüssel finden Sie in Ihrem Profilbereich. Idealerweise verfügen Sie als Entwickler über API-Kenntnisse (wir unterstützen Sie dabei, keine Sorge).

Sie müssen außerdem die gewünschte Anfragemethode und das entsprechende Flux.2-Modell auswählen.

Welche Endpunkte und Authentifizierungsmethoden sind erforderlich?

Die Replicate Predictions API ermöglicht die Generierung hochwertiger Bilder mithilfe verschiedener FLUX-Modelle von Black Forest Labs im Standard-Replicate-Format. Die API unterstützt eine breite Palette von FLUX-Modellvarianten, die jeweils für unterschiedliche Anwendungsfälle optimiert sind – von Rapid Prototyping bis hin zur professionellen Bildgenerierung. Benutzer können nahtlos zwischen verschiedenen Modellen wechseln, indem sie einfach den Modellnamen im URL-Pfad (https://api.cometapi.com/replicate/v1/models/{models}/predictions) ändern. Dies macht die API flexibel für vielfältige kreative und kommerzielle Anwendungen.

CometAPI Stellt verwaltete Endpunkte unter https://api.cometapi.com/flux/v1/{model} bereit und benennt Endpunkte wie flux-2-pro, flux-2-flex und flux-2-flex für die Bilderstellung und -bearbeitung. Anfragen erfordern einen API-Schlüssel. x-key Kopfzeile.

Modellfamilie & Berechnungs-Kompromisse

FLUX.2 (offene Gewichte) Verwenden Sie die Dev-Version, wenn Sie lokale Kontrolle benötigen, Forschungsexperimente durchführen oder Inferenz auf Ihrer eigenen Infrastruktur ausführen möchten. Die Dev-Version ist ressourcenschonend (32 Byte) und hervorragend für explorative Forschung und Feinabstimmung geeignet. Sie bietet mehr Konfigurationsmöglichkeiten, jedoch sind Sie für die Infrastruktur und Optimierung selbst verantwortlich.
FLUX.2 pro Die Pro-Version bietet das optimale Verhältnis von Geschwindigkeit, Qualität und Kosten für die Produktion. Sie zeichnet sich durch vorhersehbare Latenz, zuverlässige Reaktionszeiten, hohen Durchsatz und die Unterstützung von bis zu 8 API-Referenzbildern (insgesamt 9 MP über die API) aus. Ideal für die Bearbeitung großer Bildmengen und wenn Zuverlässigkeit und planbare Preise gefragt sind.
FLUX.2 (verwaltet + steuerbar) — Legt Steuerungselemente für die Stromerzeugung auf niedriger Ebene offen (z. B. steps, guidanceFlex unterstützt mehr Referenzen (bis zu 10) und eine etwas höhere Qualität/Detailgenauigkeit, wenn Sie eine höhere Latenz und höhere Kosten in Kauf nehmen. Verwenden Sie Flex, wenn Sie die endgültige kreative Kontrolle benötigen – für typografische Genauigkeit, exakte Farben oder hochdetaillierte Kompositionsanpassungen.

Prototyp auf Entwickler oder eine kostengünstige Pro Planen Sie, dann migrieren Sie zu Pro zum Größenvergleich oder Flex für hochgradig kontrollierte finale Renderings.

Wie verwende ich die FLUX.2-API?

Anfragelebenszyklus (Aufgaben- und Abfragemodell)

Antworten auf Bearbeitungs-/Generierungsanfragen sind Aufgabenobjekte dazu gehören a polling_url kombiniert mit einem nachhaltigen Materialprofil. idSie erstellen eine Anfrage und rufen anschließend per Polling (oder Webhooks) die signierte Ergebnis-URL ab. Signierte URLs sind nur kurz gültig (typischerweise ca. 10 Minuten), daher sollten Sie die Ergebnisse zeitnah abrufen.

Die gehostete API folgt einem asynchronen Aufgabenmodell:

Eine Generationsanfrage per POST senden → gibt eine Antwort zurück task id kombiniert mit einem nachhaltigen Materialprofil. polling_url plus geschätzt cost.
Befragen Sie die polling_url bis status == "Ready"Anschließend wird das Bildresultat abgerufen (oft base64 oder eine gehostete URL).

Beispiel: Python (requests) – Absenden & Abfragen

import time, requests, os

API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"

payload = {
    "prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
    "width": 1024, "height": 1024, "seed": 42
}

r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task

while True:
    time.sleep(0.5)
    status_r = requests.get(polling_url, headers={"x-key": API_KEY})
    status_r.raise_for_status()
    status = status_r.json()
    if status == "Ready":
        print("Result URL:", status)
        break
    elif status in ("Error", "Failed"):
        print("Generation failed:", status)
        break

Dieses Muster (submit → poll oder webhook) ist der primäre synchrone/asynchrone Ablauf für die verwalteten Endpunkte.

Bildbearbeitung — Minimalbeispiel (curl mit Eingabe-URL)

curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
  -H "accept: application/json" \
  -H "x-key: $CometAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
    "input_image": "https://example.com/my-photo.jpg",
    "width": 2048,
    "height": 1536
  }'

Für die Bearbeitung mehrerer Referenzen verwenden Sie input_image, input_image_2, input_image_3, … (Pro unterstützt bis zu 8 Referenzen über die API; Flex bis zu 10; empfohlene Entwicklerversion: maximal ~6, abhängig vom Arbeitsspeicher).

Welche grundlegenden Parameter sollte ich senden?

Wichtige Felder im Anfragetext (Bildbearbeitung/Bildgenerierung) sind:

guidance kombiniert mit einem nachhaltigen Materialprofil. steps — ermöglichen eine fein abgestufte Steuerung.
prompt (Zeichenkette) — bis zu 32 Tokens; detaillierte natürliche Sprache oder strukturiertes JSON.
input_image (Zeichenkette) — erforderlich für Bearbeitungen (URL oder Base64).
input_image_2 ... input_image_9 — Bilder mit mehreren Referenzen.
width / height — Vielfache von 16; Ausgabe max. 4 MP.
seed — Ganzzahl zur Gewährleistung der Reproduzierbarkeit.
safety_tolerance — mittleres Niveau.

Wie kann ich FLUX.2 Pro für die professionelle Text-zu-Bild-Konvertierung nutzen?

FLUX.2 Pro ist auf zuverlässige, qualitativ hochwertige Ergebnisse optimiert. Nutzen Sie es, wenn Sie konsistente Ergebnisse auf Markenniveau, schnelle Bearbeitungszeiten und SLAs für Unternehmen benötigen.

Workflow-Rezept – Produktionsbilder

Vorverarbeitungsaufforderungen: Fügen Sie eine kurze „Intention“-Zeile sowie einen strukturierten Attributbereich hinzu (Beleuchtung, Objektiv, Stimmung, Hex-Farbcodes für Markenfarben). FLUX.2 unterstützt Hex-Farbsteuerung, um die Markenpalette beizubehalten.
Beginnen Sie mit konservativen Standardeinstellungen: Schritte 30–50 und Hilfestellungsskala 6–9.0; mehr Schritte für Details, mehr Hilfestellung, um sicherzustellen, dass die Ergebnisse den Vorgaben genauer entsprechen.
Verwendung von Seeds + deterministischem Sampling zur Reproduzierbarkeit bei A/B-Tests.
Verwenden Sie den Pro-Endpunkt für Mehrfach-Sampling: N Varianten parallel anfordern und die beste auswählen – günstiger und schneller als die manuelle Hyperparameter-Optimierung.
Nachbearbeitung: Rauschunterdrückung, leichte Tonwertkorrektur oder Vektor-Retusche in einer deterministischen Pipeline. Ziehen Sie einen kleinen GAN- oder Super-Resolution-Durchgang in Betracht, wenn Sie eine höhere Auflösung als die native benötigen.

Warum diese Schritte helfen: Pro bietet ein ausgewogenes Verhältnis zwischen Geschwindigkeit und Wiedergabetreue und setzt in der Regel nachträglich Sicherheits-/Inhaltsfilter durch, daher ist es die sinnvolle Standardeinstellung für Inhalte, die direkt mit Kunden in Kontakt stehen.

Die besten Tipps zum Generieren von Bildern

1. Strukturierte Prompts führen zu Produktionserfolgen. Ordnen Sie die Eingabeaufforderungen nach Priorität: Motiv → Handlung → Stil → Kontext. Verwenden Sie JSON-Eingabeaufforderungen (Szene, Motive, Kamera, Beleuchtung, Farbpalette), wenn Sie eine deterministische Komposition über viele Bilder hinweg benötigen. Beispiel für die Verwendung eines JSON-Schemas (Pseudo):

{
  "scene": "product shot",
  "subjects": [
    {"type":"mug","pose":"center","style":"ceramic, matte"},
    {"type":"background","style":"wooden desk, window light"}
  ],
  "camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}

2. Reproduzierbarkeit: Passieren seed Zur späteren Reproduktion. Bewahren Sie eine Katalogzuordnung (Aufforderung + Startwert → Bild) zur Nachverfolgbarkeit auf.

3. Stapelverarbeitung und Orchestrierung: Bei großen Produktionsläufen sollten Sie viele Anfragen parallel an Pro senden, jedoch die Anfragerate begrenzen, um eine Drosselung zu vermeiden. Der Pro-Endpunkt bietet eine bessere Übersicht über die Latenz. Nutzen Sie Job-Warteschlangen und Worker-Pools, um signierte Ergebnisse nach Fertigstellung schnell herunterzuladen.

4. Mäßigung und Sicherheit: Nutzen Sie safety_tolerance zur Steuerung der Moderationsstrenge. Pro-Endpunkte umfassen Nutzungsrichtlinien und Hooks zur Inhaltsmoderation; Integration serverseitiger Prüfungen vor der Veröffentlichung.

5. Nachbearbeitung: Professionelle Ergebnisse sind von hoher Qualität, benötigen aber gelegentlich kleinere Nachbearbeitungen. Integrieren Sie einen automatisierten Nachbearbeitungsschritt (Zuschneiden, Farbkorrektur, Komposition) in Ihre Pipeline und behalten Sie die manuelle Überprüfung markensensibler Assets bei.

Wie kann ich die Ausgaben mit dem FLUX.2 Flex-Endpunkt anpassen?

Flex ist die Variante des „chirurgischen Werkzeugs“: Schritte, Anleitungen, negative Hinweise, Kachelgrößen und Referenzzählungen lassen sich anpassen, um das Ergebnis präzise zu gestalten.

Wann sollte man Flex wählen?

Sie benötigen eine präzise typografische Darstellung (UI-Mockups, Beschriftungen).
Sie müssen mehrere Referenzen unter Kontrolle über Pose und Beleuchtung kombinieren.
Sie experimentieren mit fortgeschrittenen Prompt-Techniken (strukturierte Prompts, Constraint-Ketten).

Beispiel – Flex-Steuerungstasten und ihre Effekte

steps — mehr Schritte = feinere Details (auf Kosten der Latenz).
guidance_scale — höher = näher an der Textvorgabe, niedriger = mehr Kreativität.
negative_prompt — Elemente explizit entfernen (z. B. „kein Wasserzeichen, keine zusätzlichen Finger“).
tile_size / tiled_inference — für die Erzeugung sehr hoher Auflösungen, Kachelung des Inferenzraums, um Speicherplatz gegen Geschwindigkeit einzutauschen.
reference_weights — Einige Endpunkte ermöglichen es Ihnen, Referenzen so zu gewichten, dass sie die Frage beeinflussen, welches Bild die Pose im Vergleich zum Stil bestimmt.

Praktischer Tipp: Bei komplexen Kompositionen empfiehlt sich eine kurze Vorschau mit geringer Führungsgenauigkeit zur Überprüfung der Komposition. Anschließend kann die Skalierung mit mehr Schritten und höherer Führungsgenauigkeit fortgesetzt werden. Dieses zweistufige Verfahren reduziert die Kosten und liefert gleichzeitig präzise Endergebnisse.

Beispiel: Flex-Anfrage mit Schritten und Anleitung

curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
  -H "Content-Type: application/json" \
  -H "x-key: $BFL_API_KEY" \
  -d '{
    "prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
    "width": 1536, "height": 2048,
    "steps": 50,
    "guidance": 7.5,
    "seed": 99999
  }'

TIPP: Nutzen Sie Flex für die finale kreative Freigabe und Pro für umfangreiche, schnellere Workflows. Flex bietet eine deutlich präzisere Steuerung bei Typografie- und Detailaufgaben.

Bewährte Verfahren für die Produktionsnutzung

Nachfolgend finden Sie praxiserprobte Muster und pragmatische Ratschläge für die großflächige Integration von FLUX.2.

1) Kostenkontrolle durch Megapixel-Tracking und Caching

Die Abrechnung von FLUX.2 basiert auf der Megapixelzahl. Eingang + AusgangBei der Generierung großer Datenmengen empfiehlt es sich, kleinere Vorschau-Renderings (schnelle, niedrig aufgelöste Renderings) zu erstellen und erst später auf hochauflösende finale Renderings umzusteigen. Gerenderte Assets sollten zwischengespeichert (oder Unterschiede gespeichert) werden, um das erneute Rendern identischer Aufträge zu vermeiden. Immer die Oberfläche anzeigen. cost in Antworten und protokollieren Sie es pro Anfrage.

2) Stufen sinnvoll nutzen: Aufteilung zwischen Vorschau und finalem Rendering

Schnelle, stufenlose Pro-Renderings für Prototypen oder zahlreiche Varianten.
Verwenden Sie Flex- oder hochauflösende Pro-Durchläufe für die endgültige Freigabe, wenn es auf Detailtreue ankommt. Dieser Hybridansatz bietet ein ausgewogenes Verhältnis zwischen Durchsatz und Bildqualität.

3) Prompt-Engineering → strukturierte Prompts & JSON

Nutzen Sie die Vorteile von FLUX.2. strukturierte JSON-Eingabeaufforderung Wenn Sie eine deterministische Zusammensetzung benötigen (Szenenobjekte, Kamera, Posen, Hex-Farbfelder), reduziert dies die Anzahl der iterativen Abfragezyklen und führt zu besser reproduzierbaren Batches. Beispiele von Cloudflare zeigen JSON-Abfragen, die in Multipart-Formulare eingebettet sind.

4) Seed + Versionierung für Reproduzierbarkeit

Wenn Sie reproduzierbare Ergebnisse benötigen, übergeben Sie einen seed und protokollieren Sie die Modellversion/den Zeitstempel in den Metadaten. Bei deterministischen Asset-Pipelines sollte ein Manifest geführt werden: Eingabeaufforderung, Startwert, Modellvariante, Auflösung und Referenzbild-Hashes. Dies verbessert die Nachverfolgbarkeit und die Rollback-Optionen.

Fazit

FLUX.2 zielt genau darauf ab, die Lücke zwischen „beeindruckender Demo“ und „produktionsreifem Kreativwerkzeug“ zu schließen. Mit Multi-Referenz-Bearbeitung, hochauflösenden Ausgaben und einer Reihe gehosteter Endpunkte (sowie offenem Inferenzcode und quantisierten Verbraucher-Builds) bietet es Teams viele praktische Optionen: lokale Ausführung für Forschung und Anpassung oder Nutzung der gehosteten Pro/Flex-Endpunkte für stabile Produktionspipelines.

Entwickler können zugreifen Flux.2 Dev API, Flux.2 Flex API kombiniert mit einem nachhaltigen Materialprofil. Flux.2 Pro API über CometAPI. Erkunden Sie zunächst die Modellfunktionen von CometAPI in der Spielplatz und konsultieren Sie die API-Leitfaden Für detaillierte Anweisungen. Stellen Sie vor dem Zugriff sicher, dass Sie sich bei CometAPI angemeldet und den API-Schlüssel erhalten haben. Mit e tAPI bieten einen Preis weit unter dem offiziellen Preis an, um Ihnen bei der Integration zu helfen.

Bereit loszulegen? → Melden Sie sich noch heute für CometAPI an !

Wenn Sie weitere Tipps, Anleitungen und Neuigkeiten zu KI erfahren möchten, folgen Sie uns auf VK, X kombiniert mit einem nachhaltigen Materialprofil. Discord!