FLUX.2 [max] es un modelo de inteligencia visual de primer nivel de Black Forest Labs (BFL) diseñado para flujos de trabajo de producción: marketing, fotografía de producto, comercio electrónico, cadenas creativas y cualquier aplicación que requiera identidad coherente de personajes/productos, renderizado de texto preciso y detalle fotorrealista a resoluciones de varios megapíxeles. La arquitectura está diseñada para un fuerte seguimiento de instrucciones, fusión multirreferencia (hasta diez imágenes de entrada) y generación fundamentada (capacidad de incorporar contexto web actualizado al producir imágenes).
Especificaciones técnicas (tabla)
| Campo | Valor / notas |
|---|---|
| Nombre del modelo / variante | FLUX.2 [max] (a menudo escrito FLUX 2 Max). |
| Tipos de entrada | Indicaciones de texto + imágenes de referencia (se aceptan entradas de imagen). |
| Tipos de salida | Imagen (fotorrealista y estilizada), ediciones de imagen (inpainting/outpainting/retexturizado) |
| Imágenes de referencia (máx.) | Hasta 8 imágenes de referencia vía API |
| Resolución máxima nativa | Hasta 4 megapíxeles (p. ej., ~2048×2048 o configuraciones equivalentes en MP); los tamaños recomendados para producción suelen ser ≤2MP por la relación velocidad/costo. |
| Ventana de contexto (texto) | 32K tokens de texto (capacidad de tokens de entrada documentada para la familia FLUX.2). |
| Latencia / velocidad | Velocidades de generación «inferiores a 10 segundos» citadas para configuraciones típicas |
¿Qué es la API de FLUX.2 [max]?
La API de FLUX.2 [max] es el endpoint gestionado de BFL que expone el modelo FLUX.2 [max] para la generación programática de texto→imagen, edición de imágenes multirreferencia y flujos de generación fundamentada. Acepta solicitudes JSON con texto de prompt y referencias de imagen opcionales, admite parámetros estándar de generación de imágenes (dimensiones, pasos, escala de guía, semillas) y devuelve URL de imágenes generadas o blobs de imagen según el formato de respuesta del proveedor.
Capacidades típicas de la API expuestas:
- Endpoint de generación texto→imagen.
- Endpoints de edición de imagen / inpainting / outpainting que aceptan imágenes de referencia.
- Indexación multirreferencia (etiquetado de imágenes de referencia dentro de una solicitud).
- Integración opcional de grounding/búsqueda web para aportar contexto actualizado en las imágenes generadas (disponible en el nivel [max]).
Características principales
- Generación fundamentada (contexto web): [max] puede incorporar contexto web reciente y externo en sus generaciones para que los elementos visuales reflejen productos en tendencia o eventos actuales cuando se solicita. Esta es una diferenciación clave.
- Alta fidelidad / salida nativa de 4MP: iluminación realista, texturas y geometría estable a resoluciones de grado de producción.
- Edición multirreferencia y fuerte consistencia de identidad: preserva rostros e identidad de producto en ediciones y entre tomas; admite muchas referencias para mantener una identidad consistente en las salidas.
- Seguimiento avanzado de instrucciones y fidelidad de estilo: ajustado para reproducir fielmente instrucciones de estilo complejas y mantener mejor la tipografía/texto pequeño que los modelos de imagen típicos (según pruebas del proveedor).
- Controles de producción: parámetros de control JSON, guía de pose, herramientas de retexturizado y alto control sobre colores (códigos hexadecimales) y composición para flujos de estudio.
Rendimiento en benchmarks
- Posición en LM Arena / Image Arena: FLUX.2 [max] se sitúa alto en los rankings públicos de generación de imágenes; las clasificaciones ELO colaborativas (LM Arena / Image Arena) lo sitúan alrededor del rango de 1150–1170 ELO (ejemplo: 1168 ELO en la arena de Texto a Imagen en el momento del informe), ubicándolo entre los principales modelos de imagen no BigTech aunque por detrás de algunas de las entradas líderes de los proveedores más grandes.
- Pruebas prácticas: Gran calidad visual frente a modelos pares (notablemente mejor balance de color, detalle de texturas y amplitud de estilo creativo en muchas pruebas cara a cara).
FLUX 2 max vs. Midjourney vs. Nano Banana
- Frente a Midjourney v7 / familia Midjourney: los reseñadores señalan que las variantes FLUX.2 (Pro/Max) apuntan directamente a la fidelidad de producción y a la consistencia de identidad multirreferencia, mientras que las fortalezas de Midjourney siguen siendo el estilo y la exploración estética. En pruebas estrictas de identidad/consistencia, algunos reseñadores colocan a FLUX.2 por delante, mientras que Midjourney aún sobresale en ciertas estilizaciones creativas. (comparar: reseñas de la industria y artículos de comparación directa de modelos).
- Frente a Nano Banana Pro (y modelos de estudio de grado similar): Nano Banana Pro y algunos otros modelos propietarios se posicionan como sólidas herramientas de estudio virtual/multirreferencia; FLUX.2 [max] compite de cerca en consistencia de edición y fidelidad fotorrealista, al tiempo que ofrece una familia de productos más amplia para equilibrar velocidad/control.
Variantes del modelo
| Variante | Uso objetivo | Fortaleza clave |
|---|---|---|
| FLUX.2 [max] | Flujos de trabajo profesionales | Máxima fidelidad y consistencia en edición |
| FLUX.2 [pro] | Rendimiento equilibrado | Buen equilibrio velocidad-calidad |
| FLUX.2 [flex] | Control ajustable | Parámetros de generación de ajuste fino |
| FLUX.2 [dev] | Investigación de pesos abiertos | Desarrollo local y experimentación |
Casos de uso típicos en producción
- Comercio electrónico / fotografía de producto: crear renders de producto coherentes con la marca y múltiples variantes para pruebas A/B sin una sesión de fotos física.
- Activos de publicidad y marketing: producir imágenes hero, pósters y escenas lifestyle listas para el mercado de hasta 4MP para necesidades de campaña.
- Continuidad de personajes e IP: estudios que necesitan que el mismo personaje/producto aparezca en múltiples escenas y ediciones con identidad preservada.
- Visualizaciones editoriales y fundamentadas: visualizar eventos actuales/del mundo real o conceptos de productos en tendencia usando generación fundamentada para añadir contexto reciente. (Ten cuidado con el riesgo legal/ético para personas reales.)
- Diseño y prototipado: maquetas de UI, infografías y pósters donde se requiere texto legible y tipografía controlada.
Cómo acceder a la API de Flux 2 Max
Paso 1: Regístrate para obtener la clave de API
Inicia sesión en cometapi.com. Si aún no eres usuario, regístrate primero. Accede a tu consola de CometAPI. Obtén la clave de API de credenciales de acceso de la interfaz. Haz clic en “Add Token” en el token de API del centro personal, obtén la clave del token: sk-xxxxx y envíala.
Paso 2: Envía solicitudes a la API de Flux 2 Max
Selecciona el endpoint “flux-2-max” para enviar la solicitud a la API y configura el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API en nuestro sitio web. Nuestro sitio web también ofrece pruebas en Apifox para tu comodidad. Sustituye <YOUR_API_KEY> por tu clave real de CometAPI de tu cuenta. La URL base es flux generate image(https://api.cometapi.com/flux/v1/flux-2-max)
Inserta tu pregunta o solicitud en el campo content —esto es a lo que responderá el modelo—. Procesa la respuesta de la API para obtener la respuesta generada.
Paso 3: Recupera y verifica los resultados
Tras la generación, puedes usar el endpoint /flux/v1/get_result para consultar las imágenes generadas o monitorear el estado del proceso. Tras el procesamiento, la API responde con el estado de la tarea y los datos de salida.
👇 Empieza a crear ahora Generación de imágenes de Flux – Documentación de la API