F

FLUX 2 MAX

Por Solicitud:$0.01
FLUX.2 [max] es un modelo de inteligencia visual de primer nivel de Black Forest Labs (BFL) diseñado para flujos de trabajo de producción: marketing, fotografía de producto, comercio electrónico, flujos creativos y cualquier aplicación que requiera una identidad coherente de personajes/productos, renderizado de texto preciso y detalle fotorrealista a resoluciones de varios megapíxeles. La arquitectura está diseñada para un seguimiento sólido de instrucciones, fusión de múltiples referencias (hasta diez imágenes de entrada) y generación fundamentada (capacidad de incorporar contexto web actualizado al producir imágenes).
Nuevo
Uso comercial

FLUX.2 [max] es un modelo de inteligencia visual de primer nivel de Black Forest Labs (BFL) diseñado para flujos de trabajo de producción: marketing, fotografía de producto, comercio electrónico, pipelines creativos y cualquier aplicación que requiera identidad consistente de personajes/productos, renderizado preciso de texto y detalle fotorrealista a resoluciones de varios megapíxeles. La arquitectura está diseñada para un fuerte seguimiento de prompts, fusión multirreferencia (hasta diez imágenes de entrada) y generación fundamentada (capacidad de incorporar contexto web actualizado al producir imágenes).

Especificaciones técnicas (tabla)

CampoValor / notas
Nombre del modelo / varianteFLUX.2 [max] (a menudo escrito FLUX 2 Max).
Tipos de entradaPrompts de texto + imágenes de referencia (se aceptan entradas de imagen).
Tipos de salidaImagen (fotorrealista y estilizada), ediciones de imagen (inpainting/outpainting/retexturizado)
Imágenes de referencia (máx.)Hasta 8 imágenes de referencia vía API
Resolución nativa máximaHasta 4 megapíxeles (p. ej., ~2048×2048 o configuraciones MP equivalentes); los tamaños de producción recomendados suelen ser ≤2MP por la relación velocidad/coste.
Ventana de contexto (texto)32K tokens de texto (capacidad de tokens de entrada documentada para la familia FLUX.2).
Latencia / velocidadVelocidades de generación «sub-10 segundos» citadas para configuraciones típicas

¿Qué es la API de FLUX.2 [max]?

La API de FLUX.2 [max] es el endpoint gestionado de BFL que expone el modelo FLUX.2 [max] para generación programática de texto→imagen, edición de imágenes multirreferencia y flujos de generación fundamentada. Acepta solicitudes JSON con texto de prompt y referencias de imagen opcionales, admite parámetros estándar de generación de imágenes (dimensiones, pasos, escala de guía, semillas) y devuelve URL de imágenes generadas o blobs de imagen según el formato de respuesta del proveedor.

Capacidades típicas expuestas por la API:

  • Endpoint de generación de Texto→Imagen.
  • Endpoints de edición de imagen / inpainting / outpainting que aceptan imágenes de referencia.
  • Indexación multirreferencia (etiquetado de imágenes de referencia dentro de una solicitud).
  • Integración opcional de grounding / búsqueda web para contexto actualizado en las imágenes generadas (disponible en el nivel [max]).

Principales características

  • Generación fundamentada (contexto web): [max] puede incorporar contexto web reciente y de fuentes externas en sus generaciones para que los visuales reflejen productos en tendencia o eventos actuales cuando se solicite. Esta es una diferenciación destacada.
  • Alta fidelidad / salida nativa de 4MP: iluminación realista, texturas y geometría estable a resoluciones de nivel de producción.
  • Edición multirreferencia y gran consistencia de identidad: preserva rostros e identidad de producto en ediciones y tomas; admite muchas referencias para mantener una identidad consistente en las salidas.
  • Seguimiento avanzado de prompts y fidelidad de estilo: ajustado para reproducir fielmente instrucciones de estilo complejas y mantener mejor la tipografía / fidelidad de texto pequeño que los modelos de imagen típicos (según pruebas del proveedor).
  • Controles de producción: controles en JSON, guía de pose, herramientas de retexturizado y alto control sobre colores (códigos hex) y composición para flujos de trabajo de estudio.

Rendimiento en benchmarks

  • Posición en LM Arena / Image Arena: FLUX.2 [max] se sitúa alto en los rankings públicos de generación de imágenes; las clasificaciones ELO de origen colectivo (LM Arena / Image Arena) lo muestran alrededor del rango de 1150–1170 ELO (ejemplo: 1168 ELO en la arena de Texto a Imagen en el momento del informe), ubicándolo entre los principales modelos de imagen no pertenecientes a BigTech, aunque por detrás de algunas entradas de los proveedores más grandes.
  • Benchmarks prácticos: Gran calidad visual frente a modelos pares (notablemente mejor balance de color, detalle de textura y rango de estilo creativo en muchas pruebas cara a cara).

FLUX 2 max vs Midjourney vs Nano Banana

  • Vs. Midjourney v7 / familia Midjourney: los analistas señalan que las variantes de FLUX.2 (Pro/Max) apuntan directamente a la fidelidad de producción y a la consistencia de identidad multirreferencia, donde las fortalezas de Midjourney siguen siendo el estilo y la exploración estética. En pruebas estrictas de identidad/consistencia, algunos analistas colocan a FLUX.2 por delante, mientras que Midjourney aún sobresale en ciertas estilizaciones creativas. (véanse: reseñas de la industria y artículos de comparación directa de modelos).
  • Vs. Nano Banana Pro (y modelos similares de nivel de estudio): Nano Banana Pro y otros pocos modelos propietarios se posicionan como potentes herramientas multirreferencia / de estudio virtual; FLUX.2 [max] compite de cerca en consistencia de edición y fidelidad fotorrealista, al tiempo que ofrece una familia de productos más amplia para compensaciones entre velocidad y control.

Casos de uso típicos de producción

  • Comercio electrónico / fotografía de producto: crear renders de producto consistentes y conformes con la marca y múltiples variantes para pruebas A/B sin una sesión fotográfica física.
  • Activos de publicidad y marketing: producir imágenes hero, pósteres y tomas lifestyle listas para el mercado de hasta 4MP para las necesidades de campaña.
  • Continuidad de personajes e IP: estudios que necesitan que el mismo personaje/producto aparezca en múltiples escenas y ediciones con la identidad preservada.
  • Visualizaciones editoriales y fundamentadas: visualizar eventos actuales/del mundo real o conceptos de productos en tendencia usando generación fundamentada para añadir contexto reciente. (Tener cuidado con los riesgos legales/éticos para personas reales.)
  • Diseño y prototipado: maquetas de UI, infografías y pósteres donde se requiera texto legible y tipografía controlada.

Cómo acceder a la API de Flux 2 Max

Paso 1: Regístrate para obtener la clave de API

Inicia sesión en cometapi.com. Si aún no eres nuestro usuario, regístrate primero. Accede a tu consola de CometAPI. Obtén la clave de API de credenciales de acceso de la interfaz. Haz clic en «Add Token» en el token de API en el centro personal, obtén la clave del token: sk-xxxxx y envíala.

Flux.2 Flex API

Paso 2: Envía solicitudes a la API de Flux 2 Max

Selecciona el endpoint «flux-2-max» para enviar la solicitud de API y establece el cuerpo de la solicitud. El método de solicitud y el cuerpo de la solicitud se obtienen de la documentación de la API en nuestro sitio web. Nuestro sitio también proporciona prueba en Apifox para tu conveniencia. Reemplaza <YOUR_API_KEY> con tu clave real de CometAPI de tu cuenta. La URL base es flux generate image(https://api.cometapi.com/flux/v1/flux-2-max)

Inserta tu pregunta o solicitud en el campo content — eso es a lo que responderá el modelo. Procesa la respuesta de la API para obtener la respuesta generada.

Paso 3: Recupera y verifica los resultados

Tras la generación, puedes usar el endpoint /flux/v1/get_result para consultar las imágenes generadas o monitorizar el estado del proceso. Tras el procesamiento, la API responde con el estado de la tarea y los datos de salida.

👇 Empieza a construir ahora Generación de imágenes de Flux – Documentación de la API

Más modelos