Was ist Flux.2 und Flux 2 ist jetzt auf CometAPI verfügbar

CometAPI
AnnaNov 26, 2025
Was ist Flux.2 und Flux 2 ist jetzt auf CometAPI verfügbar

FLUX.2 ist eine neu angekündigte Familie von Bildgenerierungs- und -bearbeitungsmodellen von Black Forest Labs, die produktionsreife Wiedergabetreue, Multi-Referenz-Bearbeitung (bis zu 10 Referenzen) und einsatzfähige Varianten von Open-Weight Dev bis Production Pro sowie eine steuerbare Flex-Stufe bietet.

Was ist FLUX.2?

FLUX.2 ist die produktionsreife Bildgenerierungs- und -bearbeitungsfamilie von Black Forest Labs, die Multi-Referenz-Conditioning, einen überarbeiteten latenten Raum (VAE) und fortgeschrittene Kontrollprimitive (Hex-Farbsteuerung, JSON-Prompting, Posenführung) kombiniert, um konsistente, hochfidele Ergebnisse für kreative und kommerzielle Workflows zu liefern. Sie unterstützt sowohl Text→Bild-Generierung als auch Multi-Referenz-Bildbearbeitung in einer einzigen Modellfamilie, und BFL liefert gehostete API-Endpunkte sowie Open-Weight-Artefakte für Forschung und lokale Inferenz. Das Angebot existiert über mehrere Distributionskanäle: Open Weights für Forscher/Entwickler (FLUX.2), gehostete Produktionsmodelle wie Flux.2 Pro und anpassbare gehostete Endpunkte wie Flux.2 Flex.

Zentrale Funktionen

  • Multi-Referenz-Bearbeitung: Kombinieren Sie bis zu 8–10 Referenzbilder für ein einzelnes Ergebnis, wobei Identitäts- und Stilkonsistenz erhalten bleiben. Dies ist besonders nützlich für Werbung, Produkt-Mockups oder Charakterkontinuität über kreative Varianten hinweg.
  • Hohe Auflösung (bis zu 4MP): Ausgaben bis zu 4 Megapixeln (zum Beispiel 2048×2048 und größer, abhängig vom Seitenverhältnis).
  • Fotorealismus + feine Details: Verbesserungen bei Händen, Gesichtern, Texturen und räumlichem Denken gegenüber früheren Open-Modellen.
  • Strukturiertes Prompting & JSON-Prompts: FLUX.2 unterstützt strukturierte/JSON-Prompts, die sich natürlich auf UI-Steuerelemente (Szene, subjects[], Stil, Beleuchtung, Kamera) abbilden lassen und so programmatische und reproduzierbare Generierung ermöglichen.
  • Typografie- und Farbtoleranz: Ungewöhnlich gute Textrendering- und exakte Farb- (Hex-) Steuerung für markensensitive Workflows.
  • Herkunftsnachweis & Sicherheit: Die Pro-API versieht erzeugte Bilder mit kryptografisch signierten C2PA-Metadaten und betreibt gestaffelte Filterung für unzulässige Inhaltskategorien.

Pro vs Flex vs Dev: Welches Modell wählen?

VarianteLatenz & KostenQualitätSteuerung & FunktionenMehrfachreferenz
FLUX.2optimiert für geringe Latenz (<10s in typischen API-Setups), umfasst Inhaltsfilter und kryptografisch signierte C2PA-Metadaten zum Herkunftsnachweis.Am höchsten (4MP, beste Wiedergabetreue)Voller Funktionsumfang, Produktions-SLAsBis zu 8 (API, 9MP-Grenze)
FLUX.2höhere Latenz als pro, bietet aber einstellbare Inferenz-Hyperparameter (Steps, Guidance-Scale etc.)HochAbstimmbar zwischen Wiedergabetreue und Diversität; einstellbare Inferenzschritte, Guidance-Scale und andere Sampling-Kontrollen für Qualitäts-/Geschwindigkeits-Trade-offs.Bis zu 10
FLUX.2Abhängig von HardwareStark (Open Weights)Vollständige Bearbeitung + Multi-Referenz; offener CheckpointEmpfohlener Maximalwert 6
FLUX.2Edge/ressourcenarmModerat (destilliert)Schnell, geringer VRAM-Footprint

Wann welche wählen

  • Wählen Sie dev, wenn Sie lokal ausführen müssen, algorithmische Forschung betreiben oder Open-Weight-Anpassungen benötigen (und hohe Hardware-Anforderungen akzeptieren).
  • Wählen Sie pro, wenn Sie vorhersehbare, latenzarme Produktionsbilder mit integrierten Sicherheits- und Herkunftsfunktionen benötigen.
  • Wählen Sie flex, wenn Sie an Inferenz-Hyperparametern iterieren (Steps, Guidance-Scale etc.) und einen verwalteten Endpunkt möchten, der diese Kontrolle freilegt.

Wie funktioniert FLUX.2?

FLUX.2 vereint drei wesentliche architektonische Elemente:

1. Rectified-Flow-Transformer-Backbone

Im Kern verwendet FLUX.2 eine Flow-Matching-/Rectified-Flow-Transformer-Architektur, die in einem gelernten latenten Raum arbeitet (eine moderne Alternative zur Diffusion für einige Produktionspipelines). Dieses Backbone ermöglicht hochfidele Wiedergabe und räumliches Denken, die die Konsistenz über mehrere Referenzen hinweg verbessern. Der „Flow-Matching“-Ansatz bietet gegenüber klassischer Diffusion andere Trade-offs in Abtastgeschwindigkeit und Wiedergabetreue.

2. Neuer Variational Autoencoder (VAE)

Ein speziell entwickelter Autoencoder komprimiert Bilder in eine latente Darstellung, die für die Generierungs- und Bearbeitungsaufgaben von FLUX.2 optimiert ist. BFL gibt an, dass der neue VAE die Komprimierbarkeit und Wiedergabetreue verbessert (bessere Lerndynamik und höherwertige Rekonstruktionen als frühere Generationen). Der VAE trägt maßgeblich zu sauberem Upscaling auf 4MP und verbesserter Detailtreue bei.

3. Vision–Language-Modell (VLM) mit langem Kontext

Ein VLM (laut veröffentlichten Hinweisen verwandt mit Visual–Language-Encodern der Mistral-Klasse) liefert die Sprach-Conditioning- und Realweltkenntnisse, die Prompts treffsicherer machen und das Befolgen komplexer Anweisungen (Posenführung, kontextuelle Edits etc.) verbessern. Die Kombination aus VLM und Flow-Backbone ermöglicht es FLUX.2, Komposition und Semantik in größeren Kontextfenstern zu erfassen.

Zusammenspiel zur Laufzeit (Runtime Flow)

  1. Eingaben kodieren: Referenzbilder werden über den VAE in latente Tokens kodiert; Textprompts werden vom VLM kodiert.
  2. Cross-modale Fusion: Das Transformer-Backbone verarbeitet Bildlatents + Texttokens und modelliert räumliche Beziehungen, Identitätsmerkmale und Bearbeitungsanweisungen.
  3. Flow-basierte Generierung: Die Rectified-Flow-Sampler generieren oder bearbeiten latente Bilder konditioniert auf der gefuschten Repräsentation.
  4. Dekodieren: Der VAE dekodiert Latents zurück in den Pixelraum und wendet optional abschließende Farbconstraints sowie Wasserzeichen/C2PA-Metadaten an.

Warum diese Architektur wichtig ist

Diese Kombination bringt drei praktische Vorteile: (1) Multi-Referenz-Kohärenz, weil Identität und Stil explizit im Latent modelliert werden; (2) besserer Text und bessere Typografie durch die engere Integration von VLM und Bildlatentraum; (3) skalierbare Bereitstellungsoptionen — dieselbe grundlegende Modellfamilie kann als Open Weights für die lokale Nutzung (dev), als verwalteter, latenzarmer Dienst (pro) oder als für Entwickler abstimmbarer Dienst (flex) bereitgestellt werden.

Wie gut ist FLUX.2?

Leistung in Benchmarks

Black Forest Labs veröffentlichte vergleichende Auswertungen und Charts, die zeigen, dass FLUX.2 in direkten Kopf-an-Kopf-Tests zur menschlichen Präferenz/Gewinnrate sowie in ELO-gegen-Kosten-Analysen mehrere Open-Weight-Zeitgenossen übertrifft. Aus dem veröffentlichten Anbieter-/Presseüberblick hervorgehobene Ergebnisse:

  • Text→Bild-Gewinnrate: FLUX.2 meldete ≈66,6% Gewinnrate (vs ~51,3% Qwen-Image, 48,1% Hunyuan Image 3.0).
  • Einzelreferenz-Bearbeitung: ≈59,8% Gewinnrate (vs ~49,3% Qwen-Image, 41,2% FLUX.1 Kontext).
  • Multi-Referenz-Bearbeitung: ≈63,6% Gewinnrate (vs ~36,4% für Qwen-Image).
  • ELO vs Kosten: Die FLUX.2-Familie (Pro, Flex, Dev) gruppiert sich in einem Band hoher Qualität bei relativ niedrigen Kosten (ELO ≈1030–1050 bei ~2–6 Cent pro Bild in der Preistabelle des Anbieters).

Multi-Referenz-Generierung

Eines der größten Features von FLUX.2 ist die Fähigkeit, mehrere konsistente Ausgaben mit mehreren Referenzbildern zu generieren.

Beispielsweise können Sie bei der Fotografie eines Produkts mehrere Fotos aus unterschiedlichen Blickwinkeln, unter verschiedenen Lichtbedingungen und vor unterschiedlichen Hintergründen hochladen und auf einmal mehrere Varianten desselben Bildes generieren.

Dieses Feature ermöglicht die schnelle, stapelweise Erstellung von Produktkatalogfotos für E‑Commerce-Websites, Werbebanner, Social-Media-Bildsets und mehr.

Im Gegensatz zur traditionellen Einzelbild-Generierung ist dieser Multi-Referenz-Mechanismus ideal für reale Workflows, die Konsistenz und Integrität betonen.

Hohe Auflösung, Business-Qualität (bis zu 4MP)

FLUX.2 unterstützt Ausgaben bis zu 4 Megapixeln (ungefähr 2000–3000 Pixel) und liefert damit eine Bildqualität, die sich für praktische Anwendungen wie Werbung, Druck, Beschilderung und Poster eignet.

Es verarbeitet Text, Logos, UI-Mockups, Infografiken und mehr ausgezeichnet und eignet sich damit nicht nur für künstlerische Kreation, sondern auch für Design und kommerzielle Nutzung.

Gleichzeitig wurde die Renderqualität von Schriften und Text verbessert, was es für die Erstellung von Werbebannern und Produktetiketten prädestiniert.

Unterstützt lokale GPU-Ausführung: Niedrige Kosten, niedrige Einstiegshürden

Bis heute sind viele leistungsstarke Bildgenerierungsmodelle praktisch nur in Rechenzentren mit massiven Ressourcen einsetzbar. FLUX.2 ist jedoch für den Betrieb auf Standard-GPUs (wie NVIDIA RTX) mit geringerem VRAM-Verbrauch optimiert.

Modelle müssen nicht mehr über die Cloud abgerufen werden; sie können lokal bearbeitet und generiert werden, was die Kosten deutlich senkt und die operative Flexibilität erhöht.

Dies ist nicht nur für Unternehmen, sondern auch für Einzelpersonen und kleine Teams ein großer Vorteil.

Vereinheitlichter Erstellungs- und Bearbeitungs-Workflow

FLUX.2 unterstützt nicht nur Text-zu-Bild (Text → Bildgenerierung), sondern auch Bild-zu-Bild (Bearbeiten und Stylen vorhandener Bilder).

So können Sie für Aufgaben wie „ein neues Bild von Grund auf zeichnen“, „bestehende Fotos bearbeiten und retuschieren“ und „mehrere Bilder wiederverwenden, um einheitliche Variationen zu erstellen“ konsistent ein einziges Modell verwenden.

Beispielsweise lässt sich der Hintergrund eines Produktfotos leicht in eine andere Stimmung ändern oder für Social Media in der Größe anpassen.

Zugriff auf die Flux.2-API

Wir freuen uns, bekanntzugeben, dass CometAPI die Flux.2-API integriert hat. Jetzt Unterstützung für das Replicate-Format-Modell (günstiger als die offiziellen Replicate-Preise), FLUX.2-Endpunkte:

  • black-forest-labs/flux-2-pro
  • black-forest-labs/flux-2-dev
  • black-forest-labs/flux-2-flex

Jetzt loslegen Vorhersagen erstellen – API-Dokumentation,

Möchten Sie es zuerst ausprobieren? Testen Sie FLUX.2 in unserem playground nach Registrierung und Login bei CometAPI; wenn Sie jetzt mit der API entwickeln möchten: Vorhersagen erstellen – API-Dokumentation.

FLUX.2 ist nicht nur ein weiteres Model-Release; es ist eine familienweite Produktstrategie, die Produktionsrealitäten adressiert: Wiedergabetreue, Editierbarkeit, Multi-Referenz-Kohärenz und praktische Bereitstellungspfade (verwaltete APIs und offene Checkpoints). Für Organisationen, die visuelle Inhalte in großem Maßstab produzieren, verspricht FLUX.2 spürbare Produktivitätsgewinne — vorausgesetzt, Teams kombinieren die technische Einführung mit solider Lizenz-Governance und Qualitätskontrolle.

Hauptanwendungen und vorgesehene Einsatzszenarien von FLUX.2

Produktvisuals/Erstellung von E‑Commerce-Katalogen

E‑Commerce-Unternehmen und Marken haben einen hohen Bedarf an zahlreichen Produktfotos aus mehreren Blickwinkeln, mit unterschiedlichen Lichtstimmungen, Hintergründen und Farbmodi.

  • Mit FLUX.2 können Sie schnell mehrere visuell konsistente Effekte erzeugen, ohne tatsächlich zu fotografieren.
  • So lässt sich Ihr Produktkatalog schnell erweitern, während Foto-, Zeit- und Verwaltungskosten sinken.

Erstellung von Werbe- und Marketingmaterialien

Der Bedarf an Designmaterial ist breit gefächert, darunter Werbebanner, Social-Media-Posting-Bilder, Visuals für Kampagnen und PR-Plakate.

  • Geben Sie einfach eine Textbeschreibung ein, um Bilder mit gewünschtem Stil, gewünschter Komposition und gewünschter Atmosphäre zu erhalten — eine starke Entlastung für Designer und Werbetreibende.
  • Außerdem eignet sich die Erzeugung von Variationen mittels mehrerer Referenzbilder für A/B-Tests kreativer Ideen und die Erstellung von Materialien, die mit mehreren Sprachen und Regionen kompatibel sind.

User Interface/User Experience Design, Prototyping

FLUX.2 unterstützt auch das Bearbeiten von Logos, Schriften, Layouts und Hintergründen und ist damit nicht nur für Fotogenerierung, sondern auch für das visuelle Design digitaler Produkte geeignet.

  • Sie können schnell erste Entwürfe, Wireframes, Event-Websites, Bildschirm-Mockups von Anwendungen und mehr erstellen.
  • Dies ist eine kosteneffiziente Produktionslösung, insbesondere für Start-ups und kleine Designteams.

Kunst/Kreative Arbeiten und private Nutzung

Natürlich kann es auch rein für „Kunstwerke“, „Illustrationen“ oder „Grafikdesign“ verwendet werden.

  • Erweitern Sie Ihren kreativen Horizont, indem Sie mit Textprompts und Referenzbildern Werke in unterschiedlichen Stimmungen und Stilen erstellen.
  • Sie können bestehende Fotos mit den Bildbearbeitungsfunktionen frei in künstlerische Stile überführen oder mit fantastischen Landschaften oder Charakterdesigns experimentieren.

Abgrenzung zu bestehenden Modellen und Wettbewerbern — Warum FLUX.2 wählen?

Vergleich mit anderen KI-Bildgenerierungsmodellen

Derzeit gibt es in der KI-Bildgenerierung viele Modelle (Open Source und kommerziell), etwa klassische Diffusionsmodelle und neueste Konkurrenzmodelle. Warum ist FLUX.2 so überzeugend? Die Gründe:

  • Integrierte Generierung und Bearbeitung: Viele Modelle fokussieren entweder auf „Generierung (Text zu Bild)“ oder „Bearbeitung (Bild zu Bild)“. FLUX.2 unterstützt beide Funktionen gleichzeitig und ermöglicht einen hochkonsistenten Workflow.
  • Mehrere Referenzeingaben: Nutzen Sie mehrere Referenzbilder für einfache Produktfotografie und durchgängige visuelle Konsistenz.
  • Kommerzielle Qualität und hohe Auflösung: Unterstützt 4MP für Werbung, Produktfotografie und Druck.
  • Einfache lokale Ausführung: Unabhängig von der Cloud und auf Standard-GPUs lauffähig — Vorteile sowohl bei Kosten als auch Flexibilität.
  • Flexible Modellauswahl: Bietet eine Bandbreite von Modellen von Standard bis kommerziell und Forschung, sodass Sie die Lösung wählen können, die am besten zu Ihren Anforderungen und Ihrem Budget passt.

Damit ist FLUX.2 eine leistungsstarke Wahl für professionelle Workflows, kommerzielle Nutzung, Produktion in großen Stückzahlen und Projekte, bei denen Kosten und Geschwindigkeit kritisch sind.

Fazit:

FLUX.2 sitzt an einer pragmatischen Schnittstelle: Es bietet Open-Weight-Forschungsoptionen für Teams, die Kontrolle und Reproduzierbarkeit benötigen, und verwaltete, produktionsreife APIs für Teams, die niedrige Latenz, vorhersehbare Ausgaben und Herkunftsnachweis priorisieren. Mit der Auslieferung sowohl offener als auch verwalteter Varianten (dev/pro/flex) erkennt BFL an, dass unterschiedliche Workflows — Experimentieren, iterative Gestaltung und Produktion — unterschiedliche Trade-offs zwischen Wiedergabetreue, Geschwindigkeit, Anpassung und Governance erfordern.

Entwickler können über CometAPI auf die Flux.2 Dev API, Flux.2 Flex API und Flux.2 Pro API zugreifen. Beginnen Sie damit, die Modellfähigkeiten von CometAPI im Playground zu erkunden. Stellen Sie vor dem Zugriff sicher, dass Sie sich bei CometAPI angemeldet und einen API-Schlüssel erhalten haben. CometAPI bietet einen Preis deutlich unter dem offiziellen Preis, um Ihnen die Integration zu erleichtern.

Bereit? → Noch heute bei CometAPI registrieren!

Wenn Sie mehr Tipps, Anleitungen und Neuigkeiten zu KI erfahren möchten, folgen Sie uns auf VK, X und Discord!

Bereit, die KI-Entwicklungskosten um 20 % zu senken?

In wenigen Minuten kostenlos starten. Inklusive kostenlosem Testguthaben. Keine Kreditkarte erforderlich.

Mehr lesen