Funciones clave (lo que hace Flux.2 Dev)
- Generación de texto→imagen con alta fidelidad al prompt y tipografía / renderizado de pequeños detalles mejorados.
- Edición multirreferencia — combina varias imágenes de referencia en una sola salida, preservando la consistencia de identidad/estilo
- Un solo checkpoint para generación + edición (no se requiere un modelo de edición por separado).
- Checkpoint de pesos abiertos grande (32B) que permite investigación local, cuantización y adaptación por la comunidad.)
- VAE optimizado para un mejor compromiso aprendizaje–calidad–compresión (habilita ediciones/salidas de 4MP).
Detalles técnicos (arquitectura e ingeniería)
- Recuento de parámetros: 32 mil millones de parámetros para el checkpoint FLUX.2.
- Diseño central: emparejamiento de flujo latente / transformer de flujo rectificado combinado con un modelo de visión y lenguaje (BFL dice que acoplan un VLM Mistral-3 24B con el backbone del transformer para el anclaje semántico). El VLM aporta conocimiento del mundo y anclaje textual, mientras que el transformer modela la estructura espacial/composicional.
- VAE: nuevo VAE de FLUX.2 (publicado bajo Apache-2.0) reentrenado para mejorar la fidelidad de reconstrucción y la capacidad de aprendizaje latente, habilitando edición de alta resolución.
- Muestreo y destilación: entrenado usando técnicas de destilación guiada para mejorar la eficiencia y la fidelidad de la inferencia.
Rendimiento en benchmarks
Black Forest Labs publicó evaluaciones comparativas y gráficos que muestran el rendimiento de FLUX.2 frente a modelos de imagen abiertos y alojados contemporáneos. Cifras clave publicadas (BFL / resúmenes de prensa):
- Tasa de victoria texto-a-imagen: FLUX.2 ~66.6% (vs. Qwen-Image 51.3%, Hunyuan ~48.1% en el conjunto de datos cara a cara de BFL).
- Tasa de victoria en edición con una sola referencia: FLUX.2 ~59.8% (vs. Qwen-Image 49.3%, FLUX.1 Kontext ~41.2%).
- Tasa de victoria en edición multirreferencia: FLUX.2 ~63.6% (vs. Qwen-Image 36.4%). BFL también informa una capacidad multirreferencia de hasta 10 referencias en su conjunto de evaluación.
Casos de uso típicos/recomendados
- Variantes de imágenes para anuncios y marketing donde el mismo modelo/actor/producto debe permanecer consistente en muchas escenas o fondos (consistencia multirreferencia).
- Fotografía de producto y prueba virtual (conserva los detalles del producto en distintos fondos).
- Producciones editoriales/de moda que requieren la misma identidad en muchas tomas.
- Prototipado rápido e investigación (el checkpoint dev permite experimentación, ajuste fino y flujos de trabajo LoRA/adapter).
Cómo acceder a la API de Flux.2 dev
Paso 1: Regístrate para obtener la clave de API
Inicia sesión en cometapi.com. Si aún no eres usuario, regístrate primero. Inicia sesión en tu Consola de CometAPI. Obtén la clave de API de credenciales de acceso de la interfaz. Haz clic en “Add Token” en el token de API del centro personal, obtén la clave del token: sk-xxxxx y envíala.

Paso 2: Envía solicitudes a la API de Flux.2 dev
Selecciona el endpoint “black-forest-labs/flux-2-dev ” para enviar la solicitud a la API y define el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API en nuestro sitio web. Nuestro sitio web también ofrece pruebas en Apifox para tu comodidad. Reemplaza <YOUR_API_KEY> con tu clave real de CometAPI de tu cuenta.
Inserta tu pregunta o solicitud en el campo content—esto es a lo que responderá el modelo . Procesa la respuesta de la API para obtener la respuesta generada.
Paso 3: Recupera y verifica los resultados
Procesa la respuesta de la API para obtener la respuesta generada. Tras el procesamiento, la API responde con el estado de la tarea y los datos de salida.
CometAPI ahora es compatible con modelos en formato Replicate: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
Promoción por tiempo limitado: ¡más bajo que el precio oficial de Replicate!
👇 Comienza a crear ahora Crear predicciones – Documentación de la API
⚡ Selección flexible:
- Pro: Diseñado para producción de alta eficiencia y entrega rápida.
- Flex: Maximiza la calidad de imagen con parámetros ajustables.
- Dev: Optimización orientada a desarrolladores.