Flux.2 est désormais disponible sur CometAPI.

CometAPI
AnnaNov 26, 2025
Flux.2 est désormais disponible sur CometAPI.

FLUX.2 est une nouvelle famille de modèles de génération et d'édition d'images annoncée par Black Forest Labs, offrant une fidélité de qualité professionnelle, une édition multi-références (jusqu'à 10 références) et des variantes déployables allant de la version Dev ouverte à la version Pro de production et à un niveau Flex contrôlable.

Qu'est-ce que FLUX.2 ?

FLUX.2 est la suite logicielle de génération et d'édition d'images de qualité professionnelle de Black Forest Labs. Elle combine le conditionnement multi-référence, un espace latent retravaillé (VAE) et des primitives de contrôle avancées (gestion des couleurs hexadécimales, invites JSON, guidage de pose) pour fournir des résultats cohérents et de haute fidélité pour les flux de travail créatifs et commerciaux. Elle prend en charge la génération de texte en image et l'édition d'images multi-référence au sein d'une seule famille de modèles. BFL fournit des points de terminaison API hébergés ainsi que des artefacts à poids ouverts pour la recherche et l'inférence locale. L'offre est disponible via plusieurs canaux de distribution : poids ouverts pour les chercheurs et les développeurs (FLUX.2 ), des modèles de production hébergés tels que **Flux.2 Pro**et des points de terminaison hébergés personnalisables comme Flux.2 Flex.

Capacités clés

  • Édition multiréférence : Combinez jusqu'à 8 à 10 images de référence pour une seule sortie tout en préservant la cohérence de l'identité visuelle et du style. Ceci est particulièrement utile pour la publicité, les maquettes de produits ou la continuité des personnages entre différentes variantes créatives.
  • Haute résolution (jusqu'à 4 MP) : sorties jusqu'à 4 mégapixels (par exemple 2048×2048 et plus, selon le rapport d'aspect).
  • Photoréalisme + détails fins : Améliorations au niveau des mains, des visages, des textures et du raisonnement spatial par rapport aux modèles ouverts précédents.
  • Invites structurées et invites JSON : FLUX.2 prend en charge les invites structurées/JSON qui correspondent naturellement aux contrôles d'interface utilisateur (scène, sujets[], style, éclairage, caméra), permettant une génération programmatique et reproductible.
  • Typographie et fidélité des couleurs : rendu de texte exceptionnellement bon et gestion précise des couleurs (hexadécimal) pour les flux de travail sensibles à la marque.
  • Provenance et sécurité du contenu : L'API Pro applique des métadonnées C2PA signées cryptographiquement aux images produites et effectue un filtrage multicouche pour les catégories de contenu interdites.

Pro vs Flex vs Dev : quel modèle choisir ?

VarianteLatence et coûtQualitéCommandes et fonctionnalitésMulti-référence
FLUX.2optimisé pour une faible latence (<10s dans les configurations API typiques), comprend des filtres de contenu et des métadonnées C2PA signées cryptographiquement pour la provenance.Résolution maximale (4 MP, meilleure fidélité)Fonctionnalités complètes, SLA de productionJusqu'à 8 (API, limite de 9 MP)
FLUX.2latence plus élevée que pro mais expose des hyperparamètres d'inférence ajustables (étapes, échelle de guidage, etc.)HauteFidélité et diversité ajustables ; étapes d'inférence réglables, échelle de guidage et autres contrôles d'échantillonnage pour des compromis qualité/vitesse.Jusqu'à 10
FLUX.2Cela dépend du matérielFort (poids libres)Édition complète + références multiples ; point de contrôle ouvert6 maximum recommandés
FLUX.2Périphérie / ressources limitéesModéré (distillé)Rapide et peu encombrante

Quand choisir lequel

  • Choisir dev si vous devez exécuter localement, avez besoin de recherches algorithmiques ou exigez des personnalisations open-weight (et acceptez des besoins matériels élevés).
  • Choisir PRO lorsque vous avez besoin d'images de production prévisibles et à faible latence, avec des fonctions intégrées de sécurité et de provenance.
  • Choisir fléchir si vous itérez sur les hyperparamètres de génération (étapes de réglage, échelle de guidage, etc.) et que vous souhaitez un point de terminaison géré qui expose ce contrôle.

Comment fonctionne FLUX.2 ?

FLUX.2 réunit trois éléments architecturaux principaux :

1. Réseau principal de transformateurs à flux redressé

FLUX.2 utilise essentiellement un adaptation de flux / flux rectifié L'architecture de transformateurs opère dans un espace latent appris (une alternative moderne à la diffusion pour certains pipelines de production). Cette structure permet un rendu haute fidélité et un raisonnement spatial qui améliorent la cohérence entre plusieurs références. L'approche de « correspondance de flux » offre différents compromis entre vitesse d'échantillonnage et fidélité par rapport à la diffusion classique.

2. Nouvel auto-encodeur variationnel (VAE)

Un auto-encodeur dédié compresse les images en une représentation latente optimisée pour les tâches de génération et d'édition de FLUX.2. BFL indique que le nouveau VAE améliore la compressibilité et la fidélité (meilleure dynamique d'apprentissage et reconstructions de qualité supérieure aux générations précédentes). Le VAE contribue de manière essentielle à une mise à l'échelle nette jusqu'à 4 MP et à un niveau de détail accru.

3. Modèle vision-langage à contexte long (VLM)

Un VLM (dont la nature visuelle et linguistique serait liée aux encodeurs de type Mistral, d'après les notes de publication) fournit le conditionnement linguistique et les connaissances du monde réel nécessaires pour que les invites soient plus fidèles et que le modèle puisse mieux suivre des instructions complexes (guidage postural, modifications contextuelles, etc.). L'association d'un VLM à une architecture de flux permet à FLUX.2 de raisonner sur la composition et la sémantique à des échelles de contexte plus larges.

Comment ces éléments interagissent (flux d'exécution)

  1. Encoder les entrées : Les images de référence sont encodées via le VAE en jetons latents ; les invites textuelles sont encodées par le VLM.
  2. Fusion intermodale : L'architecture de base du transformateur ingère les données latentes d'image et les jetons de texte, et modélise les relations spatiales, les caractéristiques d'identité et les instructions d'édition.
  3. Génération basée sur les flux : Les échantillonneurs à flux rectifié génèrent ou modifient des images latentes conditionnées par la représentation fusionnée.
  4. Décoder: Le VAE décode les données latentes dans l'espace pixel, en appliquant éventuellement des contraintes de couleur finales et des métadonnées de filigrane/C2PA.

Pourquoi cette architecture est importante

Cette combinaison offre trois avantages pratiques : (1) cohérence multi-référence car l'identité et le style sont modélisés explicitement dans le latent ; (2) meilleur texte et typographie en raison d'une intégration plus étroite entre le VLM et l'espace latent de l'image ; (3) options de déploiement évolutives — la même famille de modèles de base peut être livrée sous forme de poids ouverts pour une utilisation locale (dev), sous forme de service géré à faible latence (pro) ou sous forme de service réglable pour les développeurs (flex).

En quoi FLUX.2 est-il bon ?

Performances lors des tests de référence

Black Forest Labs a publié des évaluations comparatives et des graphiques démontrant la supériorité de FLUX.2 sur plusieurs logiciels concurrents à poids libre lors de tests comparatifs directs de préférence humaine/taux de victoire et dans des analyses ELO/coût. Voici les principaux points saillants du résumé publié par le fournisseur et la presse :

  • Taux de victoire Texte→Image : FLUX.2 a signalé 66.6% taux de victoire (contre ~51.3 % Qwen-Image, 48.1 % Hunyuan Image 3.0).
  • Édition à référence unique : 59.8% taux de victoire (contre ~49.3% Qwen-Image, 41.2% FLUX.1 Kontext).
  • Édition multiréférence : 63.6% taux de victoire (contre ~36.4% pour Qwen-Image).
  • ELO vs coût : La famille FLUX.2 (Pro, Flex, Dev) se trouve dans une bande de qualité supérieure et de coût relativement bas (ELO ≈1030–1050 tout en fonctionnant à environ 2–6 cents par image dans le tableau de prix du fournisseur).

Génération multi-référence

L'une des principales caractéristiques de FLUX.2 est sa capacité à générer plusieurs résultats cohérents à partir de plusieurs images de référence.

Par exemple, lors de la prise de photos d'un produit, vous pouvez télécharger plusieurs photos prises sous différents angles, dans différentes conditions d'éclairage et sur différents fonds, et générer simultanément plusieurs variations de la même image.

Cette fonctionnalité vous permet de générer rapidement par lots des photos de catalogues de produits pour les sites web de commerce électronique, les bannières publicitaires, les ensembles d'images pour les réseaux sociaux, et bien plus encore.

Contrairement à la génération traditionnelle d'une seule image, ce mécanisme multi-référence est idéal pour les flux de travail réels qui mettent l'accent sur la cohérence et l'intégrité.

Haute résolution, qualité professionnelle (jusqu'à 4 MP)

Le FLUX.2 prend en charge une sortie jusqu'à 4 mégapixels (environ 2000 à 3000 pixels), offrant une qualité d'image adaptée aux applications pratiques telles que la publicité, l'impression, la signalétique et les affiches.

Il gère parfaitement les textes, les logos, les maquettes d'interface utilisateur, les infographies et bien plus encore, ce qui le rend adapté non seulement à la création artistique, mais aussi à la conception et à un usage commercial.

Par ailleurs, la qualité de rendu des polices et du texte a également été améliorée, ce qui la rend adaptée à la création de bannières publicitaires et d'étiquettes de produits.

Prise en charge de l'exécution GPU locale : faible coût, faible barrière à l'entrée

À ce jour, de nombreux modèles de génération d'images haute performance ne sont utilisables que dans les centres de données dotés de ressources de calcul massives. Cependant, FLUX.2 est optimisé pour fonctionner sur des GPU standard (tels que NVIDIA RTX) avec une consommation de VRAM réduite.

Il n'est plus nécessaire d'accéder aux modèles via le cloud ; ils peuvent être modifiés et générés localement, ce qui réduit considérablement les coûts et accroît la flexibilité opérationnelle.

Il s'agit d'un avantage majeur non seulement pour les entreprises, mais aussi pour les créateurs indépendants et les petites équipes.

Flux de travail unifié de création et d'édition

FLUX.2 prend en charge non seulement la conversion de texte en image (texte → génération d'image), mais aussi la conversion d'image en image (édition et mise en forme d'images existantes).

Cela vous permet d'utiliser systématiquement un seul modèle pour des tâches telles que « dessiner une nouvelle image à partir de zéro », « éditer et retoucher des photos existantes » et « réutiliser plusieurs images pour créer des variations uniformes ».

Par exemple, il est facile de modifier l'arrière-plan d'une photo de produit pour créer une ambiance différente ou de la redimensionner pour les réseaux sociaux.

Comment accéder à l'API Flux.2

Nous sommes heureux d'annoncer que CometAPI a intégré l'API Flux.2. Prise en charge du modèle de format Replicate (tarif inférieur au tarif officiel de Replicate). Points de terminaison FLUX.2 :

  • black-forest-labs/flux-2-pro
  • laboratoires de la forêt noire/flux-2-dev
  • black-forest-labs/flux-2-flex

Commencez à construire maintenant Créer des prédictions – Documentation de l'API,

Vous voulez essayer en premier ? Testez FLUX.2 et dans notre cour de récréation après vous être inscrit et connecté à CometAPI, si vous souhaitez Commencez dès maintenant à développer avec l'API.: Créer des prédictions – Documentation de l'API.

FLUX.2 n'est pas un simple ajout de modèle ; il s'agit d'une stratégie produit globale qui prend en compte les réalités de la production : fidélité, facilité d'édition, cohérence multi-références et méthodes de déploiement pratiques (API gérées et points de contrôle ouverts). Pour les organisations produisant du contenu visuel à grande échelle, FLUX.2 promet des gains de productivité significatifs, à condition que les équipes associent l'adoption technique à une gouvernance des licences robuste et à un contrôle qualité rigoureux.

Principales utilisations et cas d'utilisation prévus de FLUX.2

Création de visuels produits/catalogue e-commerce

Les entreprises et les marques de commerce électronique ont une forte demande pour la prise de nombreuses photos de produits sous plusieurs angles, en utilisant différents éclairages, arrière-plans et modes de couleur.

  • Avec FLUX.2, vous pouvez générer rapidement de multiples effets visuellement cohérents sans avoir à filmer aucune image.
  • Cela vous permet d'élargir rapidement votre catalogue de produits tout en réduisant les coûts liés à la photographie, au temps et à la gestion.

Création de supports publicitaires et marketing

La demande en supports graphiques est vaste et comprend notamment les bannières publicitaires, les images pour les publications sur les réseaux sociaux, les visuels pour les campagnes promotionnelles et les affiches de relations publiques.

  • Il suffit de fournir une description textuelle pour obtenir des images avec le style, la composition et l'atmosphère souhaités, ce qui réduit considérablement la charge de travail des concepteurs et des annonceurs.
  • De plus, comme des variations peuvent être générées à partir de plusieurs images de référence, il convient également aux tests A/B d'idées créatives et à la création de supports compatibles avec plusieurs langues et régions.

Conception d'interface utilisateur/d'expérience utilisateur, prototypage

FLUX.2 prend également en charge l'édition de logos, de polices, de mises en page et d'arrière-plans, ce qui le rend adapté non seulement à la génération de photos, mais aussi à la conception visuelle de produits numériques.

  • Vous pouvez rapidement créer des maquettes préliminaires, des wireframes, des sites web événementiels, des maquettes d'écrans d'application, et bien plus encore.
  • Il s'agit d'une solution de production économique, particulièrement adaptée aux startups et aux petites équipes de conception.

Œuvres artistiques/créatives et usage personnel

Bien sûr, il peut aussi être utilisé uniquement pour des « œuvres d'art », des « illustrations » ou du « graphisme ».

  • Élargissez vos horizons créatifs en créant des œuvres aux ambiances et styles variés à l'aide de textes et d'images de référence.
  • Vous pouvez également utiliser les fonctionnalités de retouche d'image pour réutiliser librement des photos existantes dans des styles artistiques, ou expérimenter avec des paysages fantastiques ou des personnages.

Différencié des modèles existants et de la concurrence — Pourquoi choisir FLUX.2 ?

Comparaison avec d'autres modèles de génération d'images par IA

Actuellement, de nombreux modèles (open source et commerciaux) existent dans le domaine de la génération d'images par IA, tels que les modèles de diffusion traditionnels et les modèles concurrents les plus récents. Alors, pourquoi FLUX.2 est-il si convaincant ? Voici les raisons :

  • Génération et édition intégrées : De nombreux modèles se concentrent soit sur la « génération (texte vers image) », soit sur « l’édition (image vers image) ». FLUX.2 prend en charge les deux fonctions simultanément, assurant ainsi un flux de travail très cohérent.
  • Utilisation de plusieurs images de référence : Utilisez plusieurs images de référence pour faciliter la photographie des produits et obtenir une cohérence visuelle.
  • Qualité professionnelle et haute résolution : Prend en charge les capteurs 4 MP pour la publicité, la photographie de produits et l’impression.
  • Exécution locale simplifiée : indépendante du cloud, elle peut fonctionner sur des GPU standard, offrant des avantages en termes de coût et de flexibilité.
  • Sélection flexible des modèles : Offre une variété de modèles couvrant toutes les applications, des applications standard aux applications commerciales et de recherche, vous permettant de choisir celui qui correspond le mieux à vos besoins et à votre budget.

Cela fait de FLUX.2 un choix performant pour les flux de travail professionnels, l'utilisation commerciale, la production à grand volume et les projets où le coût et la rapidité sont essentiels.

Dernières réflexions :

FLUX.2 se situe à un carrefour pragmatique : il offre options de recherche à poids ouvert pour les équipes qui ont besoin de contrôle et de reproductibilité, et API gérées en production Pour les équipes qui privilégient une faible latence, des résultats prévisibles et la traçabilité. En proposant des versions ouvertes et gérées (dev/pro/flex), BFL reconnaît que les différents flux de travail (expérimentation, conception itérative et production) nécessitent des compromis différents entre fidélité, rapidité, personnalisation et gouvernance.

Les développeurs peuvent accéder API de développement Flux.2, API Flux.2 Flex et API Flux.2 Pro via CometAPI. Pour commencer, explorez les fonctionnalités de modélisation de CometAPI dans le cour de récréationAvant d'y accéder, veuillez vous assurer de vous être connecté à CometAPI et d'avoir obtenu la clé API. AvecetAPI proposer un prix bien inférieur au prix officiel pour vous aider à vous intégrer.

Prêt à partir ?→ Inscrivez-vous à CometAPI dès aujourd'hui !

Si vous souhaitez connaître plus de conseils, de guides et d'actualités sur l'IA, suivez-nous sur VKX et Discord!

En savoir plus

500+ Modèles en Une API

Jusqu'à 20% de réduction