¿Qué es Flux.2 y Flux 2 ya está disponible en CometAPI?

CometAPI
AnnaNov 26, 2025
¿Qué es Flux.2 y Flux 2 ya está disponible en CometAPI?

FLUX.2 es una familia recientemente anunciada de modelos de generación y edición de imágenes de Black Forest Labs que ofrecen fidelidad de nivel de producción, edición de múltiples referencias (hasta 10 referencias) y variantes implementables que van desde Dev de peso abierto hasta Pro de producción y un nivel Flex controlable.

¿Qué es FLUX.2?

FLUX.2 es la familia de generación y edición de imágenes de alta producción de Black Forest Labs. Combina el condicionamiento multirreferencia, un espacio latente rediseñado (VAE) y primitivas de control avanzadas (control de color hexadecimal, indicaciones JSON, guía de pose) para ofrecer resultados consistentes y de alta fidelidad para flujos de trabajo creativos y comerciales. Admite la generación de texto e imágenes y la edición de imágenes multirreferencia en una única familia de modelos. BFL incluye puntos finales de API alojados, así como artefactos de peso abierto para investigación e inferencia local. La oferta se distribuye a través de múltiples canales: pesos abiertos para investigadores/desarrolladores (FLUX.2 ), modelos de producción alojados como **Flux.2 Pro**y puntos finales alojados personalizables como Flux.2 Flex.

Capacidades clave

  • Edición multireferencia: Combine hasta 8-10 imágenes de referencia para un solo resultado, manteniendo la coherencia de identidad y estilo. Esto es especialmente útil para publicidad, maquetas de productos o continuidad de personajes entre variantes creativas.
  • Alta resolución (hasta 4MP): salidas de hasta 4 megapíxeles (por ejemplo, 2048×2048 y más grandes, dependiendo de la relación de aspecto).
  • Fotorrealismo + fino detalle: Mejoras en manos, caras, texturas y razonamiento espacial frente a modelos abiertos anteriores.
  • Indicaciones estructuradas y indicaciones JSON: FLUX.2 admite indicaciones estructuradas/JSON que se asignan naturalmente a los controles de la interfaz de usuario (escena, sujetos[], estilo, iluminación, cámara), lo que permite una generación programática y reproducible.
  • Tipografía y fidelidad del color: Representación de texto inusualmente buena y dirección de color exacta (hexadecimal) para flujos de trabajo sensibles a la marca.
  • Contenido-procedencia y seguridad: La API Pro aplica metadatos C2PA firmados criptográficamente a las imágenes producidas y opera un filtrado en capas para categorías de contenido no permitido.

Pro vs Flex vs Dev: ¿Qué modelo elegir?

VarianteLatencia y costoCalidadControl y funcionesmultireferencia
FLUX.2Optimizado para baja latencia (<10 s en configuraciones de API típicas), incluye filtros de contenido y metadatos C2PA firmados criptográficamente para procedencia.Más alto (4MP, mejor fidelidad)Funciones completas, SLA de producciónHasta 8 (API, límite de 9 MP)
FLUX.2mayor latencia que pro pero expone hiperparámetros de inferencia ajustables (pasos, escala de guía, etc.)AltaFidelidad vs. diversidad ajustables; pasos de inferencia ajustables, escala de guía y otros controles de muestreo para lograr compensaciones entre calidad y velocidad.Hasta 10
FLUX.2Depende del hardwareFuerte (pesos abiertos)Edición completa + multireferencia; punto de control abiertoRecomendado máximo 6
FLUX.2Edge / bajos recursosModerado (destilado)Rápido, con un consumo de VRAM reducido

¿Cuándo elegir cuál?

  • Selecciona dev Si debe ejecutar localmente, necesita investigación algorítmica o requiere personalizaciones de peso abierto (y acepta altas necesidades de hardware).
  • Selecciona PRO cuando necesita imágenes de producción predecibles y de baja latencia con funciones de procedencia y seguridad integradas.
  • Selecciona flexionar Si está iterando sobre hiperparámetros de generación (pasos de ajuste, escala de orientación, etc.) y desea un punto final administrado que exponga ese control.

¿Cómo funciona FLUX.2?

FLUX.2 reúne tres elementos arquitectónicos principales:

1. Red troncal del transformador de flujo rectificado

En esencia, FLUX.2 utiliza un adaptación de flujo / flujo rectificado Arquitectura de transformador que opera en un espacio latente aprendido (una alternativa moderna a la difusión para algunas líneas de producción). Esta estructura permite una representación de alta fidelidad y un razonamiento espacial que mejoran la consistencia entre múltiples referencias. El enfoque de "adaptación de flujo" ofrece diferentes ventajas y desventajas en cuanto a velocidad y fidelidad de muestreo en comparación con la difusión clásica.

2. Nuevo codificador automático variacional (VAE)

Un autocodificador diseñado específicamente comprime las imágenes en una representación latente optimizada para las tareas de generación y edición de FLUX.2. BFL afirma que el nuevo VAE mejora la compresibilidad y la fidelidad (mejor dinámica de aprendizaje y reconstrucciones de mayor calidad que las generaciones anteriores). El VAE contribuye de forma clave a un escalado limpio a 4 MP y a un nivel de detalle mejorado.

3. Modelo de visión-lenguaje de contexto largo (VLM)

Un VLM (relacionado con los codificadores visuales del lenguaje de clase Mistral, según se informa en notas publicadas) proporciona el condicionamiento del lenguaje y el conocimiento del mundo real que hacen que las indicaciones sean más fieles y que el modelo siga mejor instrucciones complejas (guía de poses, ediciones contextuales, etc.). La combinación de un VLM con una estructura de flujo permite a FLUX.2 razonar sobre la composición y la semántica en ventanas de contexto más amplias.

Cómo interactúan estas piezas (flujo de tiempo de ejecución)

  1. Codificar entrada(s): Las imágenes de referencia se codifican a través del VAE en tokens latentes; las indicaciones de texto se codifican mediante el VLM.
  2. Fusión intermodal: La columna vertebral del transformador ingiere latentes de imagen + tokens de texto y modela relaciones espaciales, características de identidad e instrucciones de edición.
  3. Generación basada en flujo: Los muestreadores de flujo rectificado generan o editan imágenes latentes condicionadas a la representación fusionada.
  4. Descodificar: El VAE decodifica las latentes en espacio de píxeles, aplicando opcionalmente restricciones de color finales y metadatos de marca de agua/C2PA.

Por qué es importante esta arquitectura

Esta combinación produce tres ventajas prácticas: (1) coherencia multirreferencial porque la identidad y el estilo se modelan explícitamente en lo latente; (2) mejor texto y tipografía debido a una integración más estrecha entre VLM y el espacio latente de la imagen; (3) opciones de implementación escalables —la misma familia de modelos básicos se puede enviar como pesos abiertos para uso local (dev), como un servicio administrado de baja latencia (pro) o como un servicio ajustable para desarrolladores (flex).

¿Por qué FLUX.2 es bueno?

Desempeñarse en los puntos de referencia

Black Forest Labs publicó evaluaciones comparativas y gráficos que muestran que FLUX.2 supera a varios de sus competidores de peso abierto en pruebas comparativas de preferencia humana/tasa de victorias y en análisis de ELO vs. costo. Los aspectos más destacados del resumen publicado por el proveedor y la prensa incluyen:

  • Tasa de victorias de texto → imagen: FLUX.2 reportado ≈66.6% tasa de victorias (frente a ~51.3% Qwen-Image, 48.1% Hunyuan Image 3.0).
  • Edición de referencia única: ≈59.8% tasa de victorias (frente a ~49.3% Qwen-Image, 41.2% FLUX.1 Kontext).
  • Edición multireferencia: ≈63.6% tasa de victorias (frente al ~36.4% de Qwen-Image).
  • ELO vs costo: El grupo de la familia FLUX.2 (Pro, Flex, Dev) pertenece a una banda de costo relativamente bajo y calidad superior (ELO ≈1030–1050 mientras opera a ~2–6 centavos por imagen en la tabla de precios del proveedor).

Generación de múltiples referencias

Una de las características más importantes de FLUX.2 es su capacidad de generar múltiples salidas consistentes utilizando múltiples imágenes de referencia.

Por ejemplo, al fotografiar un producto, puedes cargar varias fotos tomadas desde diferentes ángulos, bajo diferentes condiciones de iluminación y contra diferentes fondos, y generar múltiples variaciones de la misma imagen a la vez.

Esta función le permite generar rápidamente por lotes fotografías de catálogos de productos para sitios web de comercio electrónico, banners publicitarios, conjuntos de imágenes de redes sociales y más.

A diferencia de la generación tradicional de una sola imagen, este mecanismo de múltiples referencias es ideal para flujos de trabajo del mundo real que enfatizan la consistencia y la integridad.

Alta resolución, calidad empresarial (hasta 4 MP)

FLUX.2 admite una salida de hasta 4 megapíxeles (aproximadamente 2000-3000 píxeles), lo que proporciona una calidad de imagen adecuada para aplicaciones prácticas como publicidad, impresión, señalización y carteles.

Maneja texto, logotipos, maquetas de UI, infografías y más a la perfección, lo que lo hace adecuado no solo para la creación artística sino también para el diseño y el uso comercial.

Mientras tanto, también se ha mejorado la calidad de representación de las fuentes y el texto, lo que lo hace adecuado para crear banners publicitarios y etiquetas de productos.

Admite ejecución de GPU local: bajo costo, baja barrera de entrada

Hasta la fecha, muchos modelos de generación de imágenes de alto rendimiento solo son prácticos en centros de datos con grandes recursos informáticos. Sin embargo, FLUX.2 está optimizado para funcionar en GPU estándar (como NVIDIA RTX) con un menor consumo de VRAM.

Ya no es necesario acceder a los modelos a través de la nube; se pueden editar y generar localmente, lo que reduce significativamente los costos y aumenta la flexibilidad operativa.

Esta es una gran ventaja no sólo para las empresas, sino también para creadores individuales y equipos pequeños.

Flujo de trabajo unificado de creación y edición

FLUX.2 admite no solo la conversión de texto a imagen (generación de texto → imagen), sino también la conversión de imagen a imagen (edición y estilo de imágenes existentes).

Esto le permite utilizar consistentemente un único modelo para tareas como “dibujar una nueva imagen desde cero”, “editar y retocar fotos existentes” y “reutilizar múltiples imágenes para crear variaciones uniformes”.

Por ejemplo, es fácil cambiar el fondo de la foto de un producto a una atmósfera diferente o cambiar su tamaño para las redes sociales.

Cómo acceder a la API de Flux.2

Nos complace anunciar que CometAPI ha integrado la API Flux.2. Ahora es compatible con el modelo de formato de réplica (precio inferior al oficial de réplica) y los puntos finales de FLUX.2:

  • laboratorios de la selva negra/flux-2-pro
  • laboratorios de la selva negra/flux-2-dev
  • laboratorios de la selva negra/flux-2-flex

Comience a construir ahora Crear predicciones – Documentación de la API,

¿Quieres probar primero? Pruebe FLUX.2 y en nuestro Area de juegos Después de registrarse e iniciar sesión en CometAPI, si desea Empiece a construir con API ahora: Crear predicciones – Documentación de la API.

FLUX.2 no es simplemente un lanzamiento de modelo; es una estrategia de producto a nivel de familia que aborda las realidades de la producción: fidelidad, editabilidad, coherencia multirreferencial y vías de implementación prácticas (API gestionadas y puntos de control abiertos). Para las organizaciones que producen contenido visual a gran escala, FLUX.2 promete importantes mejoras de productividad, siempre que los equipos combinen la adopción técnica con una sólida gobernanza de licencias y control de calidad.

Usos principales y casos de uso previstos de FLUX.2

Creación de imágenes de productos/catálogos de comercio electrónico

Las empresas y marcas de comercio electrónico tienen una gran demanda de tomar numerosas fotografías de productos desde múltiples ángulos, utilizando diferentes iluminaciones, fondos y modos de color.

  • Con FLUX.2, puedes generar rápidamente múltiples efectos visualmente consistentes sin necesidad de filmar ningún contenido.
  • Esto le permite ampliar rápidamente su catálogo de productos y al mismo tiempo reducir los costos de fotografía, tiempo y administración.

Creación de materiales publicitarios y de marketing

La demanda de materiales de diseño es amplia e incluye banners publicitarios, imágenes para publicaciones en redes sociales, elementos visuales para campañas promocionales y carteles de relaciones públicas.

  • Simplemente proporcione una descripción de texto para obtener imágenes con el estilo, la composición y la atmósfera deseados, reduciendo en gran medida la carga de los diseñadores y anunciantes.
  • Además, debido a que se pueden generar variaciones utilizando múltiples imágenes de referencia, también es adecuado para realizar pruebas A/B de ideas creativas y crear materiales compatibles con múltiples idiomas y regiones.

Diseño de interfaz de usuario/experiencia de usuario, creación de prototipos

FLUX.2 también admite la edición de logotipos, fuentes, diseños y fondos, lo que lo hace adecuado no solo para la generación de fotografías sino también para el diseño visual de productos digitales.

  • Puede crear rápidamente diseños preliminares, wireframes, sitios web de eventos, maquetas de pantallas de aplicaciones y más.
  • Se trata de una solución de producción rentable, especialmente adecuada para empresas emergentes y pequeños equipos de diseño.

Arte/Obras creativas y uso personal

Por supuesto, también se puede utilizar puramente para “obras de arte”, “ilustraciones” o “diseño gráfico”.

  • Amplíe sus horizontes creativos creando obras en distintos estados de ánimo y estilos utilizando indicaciones de texto e imágenes de referencia.
  • También puedes utilizar funciones de edición de imágenes para reutilizar libremente fotos existentes en estilos artísticos o experimentar con paisajes fantásticos o diseños de personajes.

Diferenciado de los modelos y competidores existentes: ¿por qué elegir FLUX.2?

Comparación con otros modelos de generación de imágenes de IA

Actualmente, existen numerosos modelos (de código abierto y comerciales) en el campo de la generación de imágenes con IA, como los modelos de difusión tradicionales y los modelos más recientes de la competencia. Entonces, ¿por qué FLUX.2 es tan atractivo? Las razones son las siguientes:

  • Generación y edición integradas: Muchos modelos se centran en la generación (de texto a imagen) o en la edición (de imagen a imagen). FLUX.2 admite ambas funciones simultáneamente, logrando un flujo de trabajo altamente consistente.
  • Múltiples entradas de referencia: utilice múltiples imágenes de referencia para facilitar la fotografía del producto y lograr una consistencia visual constante.
  • Calidad comercial y alta resolución: admite 4 MP para publicidad, fotografía de productos e impresión.
  • Fácil ejecución local: es independiente de la nube y puede ejecutarse en GPU estándar, lo que ofrece ventajas tanto en costo como en flexibilidad.
  • Selección de modelos flexible: ofrece una variedad de modelos que cubren todo, desde aplicaciones estándar hasta aplicaciones comerciales y de investigación, lo que le permite elegir el que mejor se adapte a sus necesidades y presupuesto.

Esto hace que FLUX.2 sea una opción poderosa para flujos de trabajo profesionales, uso comercial, producción de gran volumen y proyectos donde el costo y la velocidad son fundamentales.

En conclusión:

FLUX.2 se encuentra en una intersección pragmática: ofrece opciones de investigación de peso abierto para equipos que necesitan control y reproducibilidad, y API de producción administradas Para equipos que priorizan la baja latencia, los resultados predecibles y la procedencia. Al ofrecer variantes abiertas y gestionadas (desarrollo/profesión/flexibilidad), BFL reconoce que los diferentes flujos de trabajo (experimentación, diseño iterativo y producción) requieren diferentes equilibrios entre fidelidad, velocidad, personalización y gobernanza.

Los desarrolladores pueden acceder API de desarrollo de Flux.2, API flexible de Flux.2 y API de Flux.2 Pro a través de CometAPI. Para comenzar, explore las capacidades del modelo de CometAPI en el PlaygroundAntes de acceder, asegúrese de haber iniciado sesión en CometAPI y de haber obtenido la clave API. ComoeAPI Ofrecemos un precio muy inferior al oficial para ayudarte a integrarte.

¿Listo para ir?→ Regístrate en CometAPI hoy !

Si quieres conocer más consejos, guías y novedades sobre IA síguenos en VKX  y  Discord!

Leer Más

500+ Modelos en Una API

Hasta 20% de Descuento