FLUX.2 [max] ist ein erstklassiges Visual‑Intelligence‑Modell von Black Forest Labs (BFL), das für Produktions‑Workflows entwickelt wurde: Marketing, Produktfotografie, E‑Commerce, kreative Pipelines und jede Anwendung, die eine konsistente Charakter-/Produktidentität, präzises Textrendering und fotorealistische Details bei Auflösungen im Multi‑Megapixel‑Bereich erfordert. Die Architektur ist auf starke Prompt‑Befolgung, Multi‑Referenz‑Fusion (bis zu zehn Eingabebilder) und Grounded‑Generierung (Fähigkeit, aktuellen Webkontext bei der Bilderzeugung einzubeziehen) ausgelegt.
Technische Spezifikationen (Tabelle)
| Feld | Wert / Hinweise |
|---|---|
| Modellname/Variante | FLUX.2 [max] (oft geschrieben als FLUX 2 Max). |
| Eingabetypen | Text‑Prompts + Referenzbilder (Bildeingaben werden akzeptiert). |
| Ausgabetypen | Bild (fotorealistisch & stilisiert), Bildbearbeitungen (Inpainting/Outpainting/Retexturierung) |
| Referenzbilder (max.) | Bis zu 8 Referenzbilder über die API |
| Native maximale Auflösung | Bis zu 4 Megapixel (z. B. ~2048×2048 oder gleichwertige MP‑Konfigurationen); empfohlene Produktionsgrößen typischerweise ≤2 MP für das Verhältnis von Geschwindigkeit/Kosten. |
| Kontextfenster (Text) | 32K Text‑Tokens (dokumentierte Eingabe‑Token‑Kapazität für die FLUX.2‑Familie). |
| Latenz/Geschwindigkeit | Für typische Konfigurationen werden „Unter‑10‑Sekunden“‑Generierungszeiten angegeben |
Was ist die FLUX.2 [max] API?
Die FLUX.2 [max] API ist der von BFL verwaltete Endpunkt, der das FLUX.2 [max]‑Modell für programmatische Text→Bild‑Generierung, Multi‑Referenz‑Bildbearbeitung und Grounded‑Generierungs‑Workflows bereitstellt. Sie akzeptiert JSON‑Anfragen mit Prompt‑Text und optionalen Bildreferenzen, unterstützt Standardparameter der Bildgenerierung (Abmessungen, Schritte, Guidance Scale, Seeds) und liefert generierte Bild‑URLs oder Bild‑Blobs gemäß dem Antwortformat des Anbieters.
Typische bereitgestellte API-Funktionen:
- Text→Bild‑Generierungs‑Endpunkt.
- Endpunkte für Bildbearbeitung/Inpainting/Outpainting, die Referenzbilder akzeptieren.
- Multi‑Referenz‑Indexierung (Tagging von Referenzbildern innerhalb einer Anfrage).
- Optionale Grounding-/Websuche‑Integration für aktuellen Kontext in der generierten Bilddarstellung (verfügbar in der [max]-Stufe).
Hauptfunktionen
- Grounded‑Generierung (Webkontext): [max] kann aktuellen, extern bezogenen Webkontext in die Generierungen einbeziehen, sodass Visuals bei Bedarf Trendprodukte oder aktuelle Ereignisse widerspiegeln. Dies ist ein herausragendes Unterscheidungsmerkmal.
- Hohe Wiedergabetreue / 4 MP native Ausgabe: realistische Beleuchtung, Texturen und stabile Geometrie bei produktionsgerechten Auflösungen.
- Multi‑Referenz‑Bearbeitung & starke Identitätskonsistenz: erhält Gesichter und Produktidentität über Bearbeitungen und Aufnahmen hinweg; unterstützt viele Referenzen, um konsistente Identität über Ausgaben hinweg zu bewahren.
- Erweiterte Prompt‑Befolgung & Stiltreue: darauf abgestimmt, komplexe Stilvorgaben originalgetreu umzusetzen und Typografie/kleine Textbestandteile besser als typische Bildmodelle zu bewahren (laut Anbietertests).
- Produktionskontrollen: JSON‑Regler, Pose‑Guidance, Retexturierungs‑Tools sowie hohe Kontrolle über Farben (Hex‑Codes) und Komposition für Studio‑Workflows.
Benchmark‑Leistung
- Platzierung in LM Arena / Image Arena: FLUX.2 [max] liegt auf öffentlichen Bildgenerierungs‑Bestenlisten weit oben; durch Crowdsourcing erstellte ELO‑Ranglisten (LM Arena / Image Arena) zeigen es im Bereich von 1150–1170 ELO (Beispiel: 1168 ELO auf der Text‑to‑Image‑Arena zum Zeitpunkt der Berichterstattung), womit es zu den führenden Nicht‑BigTech‑Bildmodellen zählt, auch wenn es einigen Top‑Einträgen der größten Anbieter hinterherläuft.
- Praxisnahe Benchmarks: Hohe visuelle Qualität im Vergleich zu Peer‑Modellen (insbesondere bessere Farbbalance, Texturdetails und kreative Stilbandbreite in vielen Direktvergleichen).
FLUX 2 max vs. Midjourney vs. Nano Banana
- Im Vergleich zu Midjourney v7 / der Midjourney‑Familie: Rezensenten merken an, dass FLUX.2‑Varianten (Pro/Max) direkt auf Produktions‑Fidelity und Multi‑Referenz‑Identitätskonsistenz abzielen, während Midjourneys Stärken weiterhin Stil und ästhetische Exploration sind. In strengen Identitäts-/Konsistenztests sehen einige Rezensenten FLUX.2 vorn, während Midjourney bei bestimmten kreativen Stylisierungen weiterhin glänzt. (vgl. Branchenreviews und direkte Modellvergleichsartikel).
- Im Vergleich zu Nano Banana Pro (und ähnlichen studio‑tauglichen Modellen): Nano Banana Pro und einige andere proprietäre Modelle sind als starke Multi‑Referenz‑/Virtual‑Studio‑Tools positioniert; FLUX.2 [max] konkurriert eng bei Bearbeitungskonsistenz und fotorealistischer Fidelity und bietet zugleich eine breitere Produktfamilie für Abwägungen zwischen Geschwindigkeit und Kontrolle.
Modellvarianten
| Variante | Zielanwendung | Kernstärke |
|---|---|---|
| FLUX.2 [max] | Professionelle Workflows | Höchste Fidelity & Bearbeitungskonsistenz |
| FLUX.2 [pro] | Ausgewogene Leistung | Gutes Verhältnis zwischen Geschwindigkeit und Qualität |
| FLUX.2 [flex] | Anpassbare Kontrolle | Fein abgestufte Generierungsparameter |
| FLUX.2 [dev] | Open‑Weight‑Forschung | Lokale Entwicklung & Experimentieren |
Typische Produktionsanwendungsfälle
- E‑Commerce/Produktfotografie: konsistente, markenkonforme Produkt‑Renderings und mehrere Varianten für A/B‑Tests erstellen, ohne physisches Fotoshooting.
- Werbe‑ & Marketing‑Assets: marktplatzreife Hero‑Images, Poster und Lifestyle‑Shots mit bis zu 4 MP für Kampagnenanforderungen produzieren.
- Charakter‑ & IP‑Kontinuität: Studios, die denselben Charakter/dasselbe Produkt über mehrere Szenen und Bearbeitungen hinweg mit erhaltener Identität erscheinen lassen müssen.
- Editorial & grounded Visualisierungen: aktuelle/reale Ereignisse oder trendige Produktkonzepte visualisieren, wobei Grounded‑Generierung genutzt wird, um aktuellen Kontext hinzuzufügen. (Vorsicht bei rechtlichen/ethischen Risiken für reale Personen.)
- Design & Prototyping: UI‑Mockups, Infografiken und Poster, bei denen lesbarer Text und kontrollierte Typografie erforderlich sind.
Zugriff auf die Flux 2 Max API
Schritt 1: Für den API‑Schlüssel registrieren
Melden Sie sich bei cometapi.com an. Wenn Sie noch kein Nutzer sind, registrieren Sie sich zunächst. Melden Sie sich in Ihrer CometAPI‑Konsole an. Holen Sie sich den Zugangs‑API‑Schlüssel für die Schnittstelle. Klicken Sie im persönlichen Bereich beim API‑Token auf „Add Token“, erhalten Sie den Token‑Schlüssel: sk‑xxxxx und senden Sie ab.
Schritt 2: Anfragen an die Flux 2 Max API senden
Wählen Sie den „flux-2-max“-Endpunkt, um die API‑Anfrage zu senden, und setzen Sie den Anfragekörper. Die Anfragemethode und der Anfragekörper stammen aus unserer Website‑API‑Dokumentation. Unsere Website bietet außerdem Apifox‑Tests zu Ihrer Bequemlichkeit. Ersetzen Sie <YOUR_API_KEY> durch Ihren tatsächlichen CometAPI‑Schlüssel aus Ihrem Konto. Basis‑URL ist Flux Bildgenerierung(https://api.cometapi.com/flux/v1/flux-2-max)
Fügen Sie Ihre Frage oder Anfrage in das Content‑Feld ein — darauf reagiert das Modell. Verarbeiten Sie die API‑Antwort, um die generierte Ausgabe zu erhalten.
Schritt 3: Ergebnisse abrufen und verifizieren
Nach der Generierung können Sie den Endpunkt /flux/v1/get_result verwenden, um erzeugte Bilder abzufragen oder den Prozessstatus zu überwachen. Nach der Verarbeitung antwortet die API mit dem Aufgabenstatus und den Ausgabedaten.
👇 Jetzt loslegen Flux‑Bilderzeugung – API‑Dokumentation