Qu’est-ce que FLUX.2 Flex
FLUX.2 est le membre « flexible » (API gérée) de la famille de produits FLUX.2 de Black Forest Labs. Il est conçu pour les développeurs et les équipes créatives qui ont besoin de :
- un contrôle explicite des paramètres de génération (steps d’inférence, guidance scale, etc.) afin d’arbitrer entre vitesse et fidélité pendant des workflows itératifs ;
- une typographie / un rendu de texte robustes ainsi qu’une gestion très fine des détails (infographies, maquettes d’UI, étiquettes de produits) ; et
- une édition multi-référence fiable (combiner des éléments provenant de plusieurs photos tout en maintenant l’identité/la cohérence).
FLUX.2 est proposé en plusieurs variantes de produit (Pro, Flex, Dev, Klein) ciblant différents usages — Flex se situe entre Pro (qualité maximale + latence fixe) et Dev (checkpoint à poids ouverts pour la recherche/l’usage local).
Fonctionnalités clés (ce que FLUX.2 Flex apporte)
- Génération contrôlable : paramètres explicites (steps, guidance scale) pour équilibrer vitesse et fidélité au prompt.
- Sortie haute résolution : capable de produire des résultats jusqu’à 4 mégapixels (4MP) tout en préservant les détails.
- Entrées multi-références : accepte plusieurs images de référence (Flex prend en charge jusqu’à 10 images de référence ; les nombres pour Dev/Pro varient selon le niveau). Cela permet des rendus cohérents de personnages/produits entre différentes sorties.
- Typographie et rendu de texte améliorés : BFL met en avant une amélioration substantielle du rendu des glyphes, du crénage et des mises en page sur plusieurs lignes — ce qui rend FLUX.2 attractif pour l’UI, le packaging et les infographies.
- API gérée avec tarification au mégapixel (modèle de coût prévisible) : la tarification de Flex utilise un modèle par mégapixel (voir la section Tarification).
Détails techniques de FLUX.2 Flex
Architecture principale : FLUX.2 utilise une architecture latent flow-matching (flow transformer) combinée à un modèle vision-langage (BFL indique qu’il associe un VLM Mistral-3 24B à un rectified flow transformer). Le VAE utilisé par FLUX.2 a été réentraîné afin d’améliorer le compromis entre capacité d’apprentissage/qualité/compression. Ces choix aident pour la connaissance du monde, la logique compositionnelle et une meilleure adhérence au prompt.
FLUX.2 : temps de génération typiques rapportés d’environ ~22 s (texte uniquement) et ~40 s (avec image d’entrée), accepte jusqu’à 10 entrées et est tarifé autour de $0.048 par mégapixel (entrée + sortie combinées) sur CometAPI.
Nom du modèle : black-forest-labs/flux-2-flex
Contraintes d’entrée : Flex accepte plusieurs entrées (jusqu’à 10 entrées dans l’offre gérée) et une limite totale de mégapixels en entrée est appliquée (un maximum agrégé de 14MP est mentionné). La résolution de sortie au-delà de 4MP est généralement sous-échantillonnée ou limitée par le service.
Performances de benchmark de FLUX.2 Flex
Évaluation du taux de victoire de type humain (benchmark fournisseur) : dans les tests comparatifs publiés par BFL, les variantes FLUX.2 (notamment ) ont montré de solides taux de victoire face à des modèles ouverts contemporains : ~66.6% de taux de victoire en text-to-image, 59.8% en édition à référence unique et 63.6% en édition multi-référence par rapport à d’autres modèles ouverts cités. BFL a également présenté un graphique ELO vs. coût par image plaçant les variantes FLUX.2 dans la plage de ~1030–1050 ELO pour des coûts par image de l’ordre de 2–6 centimes.
Limites de FLUX.2 Flex
- Coût évolutif avec les références / la résolution : Flex utilise une tarification par mégapixel. L’ajout de plusieurs images de référence ou l’augmentation de la résolution de sortie accroît le coût linéairement selon le modèle au mégapixel annoncé. Pour les workflows comportant de nombreuses itérations avec plusieurs références, le coût peut s’accumuler rapidement.
- Modes d’échec liés au prompt/à la cohérence : bien que FLUX.2 améliore la cohérence des personnages, des prompts complexes à attributs multiples peuvent encore produire des échecs (artefacts, mélanges inattendus, ou dérive de pose/d’identité) selon la conception du prompt et le nombre de références.
- Contenu et sécurité : bien que BFL signale une forte robustesse dans les tests de modération/d’entrées non conformes, les modèles d’image ne sont pas parfaits ; des risques subsistent pour la génération de contenus protégés par le droit d’auteur, l’usurpation d’identité ou des contenus dangereux.
Cas d’usage typiques / recommandés
- Variantes d’images publicitaires et marketing où le même modèle/acteur/produit doit rester cohérent à travers de nombreuses scènes ou arrière-plans (cohérence multi-référence).
- Photographie produit et essayage virtuel (préserver les détails du produit à travers différents arrière-plans).
- Séries éditoriales/de mode nécessitant la même identité sur de nombreuses prises de vue.
- Prototypage rapide et recherche (le checkpoint dev permet l’expérimentation, le fine-tuning et les workflows LoRA/adapters).
Comment accéder à l’API Flux.2 Flex
Étape 1 : S’inscrire pour obtenir une clé API
Connectez-vous à cometapi.com. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous inscrire. Connectez-vous à votre console CometAPI. Obtenez la clé API d’accès à l’interface. Cliquez sur « Add Token » dans la section API token du centre personnel, obtenez la clé de jeton : sk-xxxxx et validez.
Étape 2 : Envoyer des requêtes à l’API Flux.2 Flex
Sélectionnez le point de terminaison « black-forest-labs/flux-2-flex » pour envoyer la requête API et définissez le corps de la requête. La méthode de requête et le corps de requête sont disponibles dans la documentation API de notre site web. Notre site web fournit également un test Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par votre véritable clé CometAPI de votre compte.
Insérez votre question ou votre requête dans le champ content — c’est à cela que le modèle répondra. Traitez la réponse API pour obtenir la réponse générée.
Étape 3 : Récupérer et vérifier les résultats
Traitez la réponse API pour obtenir la réponse générée. Après traitement, l’API renvoie le statut de la tâche et les données de sortie.
CometAPI prend désormais en charge les modèles au format Replicate : 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
Promotion à durée limitée : moins cher que le tarif officiel de Replicate !
👇 Commencez à développer maintenant Create Predictions – API Doc
⚡ Sélection flexible :
- Pro : Conçu pour une production à haute efficacité et une livraison rapide.
- Flex : Maximise la qualité d’image avec des paramètres ajustables.
- Dev : Optimisation adaptée aux développeurs.