¿Cómo usar la API de Flux.2? Todo lo que necesitas saber

FLUX.2 es la segunda generación de modelos de generación y edición de imágenes de Black Forest Labs (lanzada el 25 de noviembre de 2025). Ofrece fotorrealismo de alta calidad, edición multirreferencia de hasta 4 MP, indicaciones estructuradas/JSON y una selección de terminales gestionadas (Pro, Flex) y opciones de peso abierto (Dev).

La buena noticia es que CometAPI ha integrado la API Flux.2. Esta guía explica qué es FLUX.2, cómo llamar a la API y flujos de trabajo avanzados (texto→imagen, control flexible, edición multireferencia), con ejemplos de código y buenas prácticas.

¿Qué es FLUX.2 y por qué es importante?

FLUX.2 es la continuación de la familia de modelos de imagen FLUX, diseñada para la generación de texto a imagen de alta fidelidad y la edición de imágenes multirreferencia con resoluciones de producción (hasta ~4 megapíxeles). FLUX.2 está diseñado para flujos de trabajo creativos reales (recursos seguros para la marca, caracteres y estilos consistentes en todas las referencias, mejor tipografía y pequeños detalles) en lugar de demostraciones, y su objetivo es reducir la brecha entre las imágenes generadas y las reales.

Resultados clave FLUX.2 está diseñado para ofrecer

Resultados fotorrealistas adecuados para publicidad, imágenes de productos y maquetas de interfaz de usuario.
Edición multireferencia nativa: combine, intercambie o componga elementos de múltiples imágenes de entrada en una sola edición.
Variantes para diferentes casos de uso: modelos de desarrollador disponibles abiertamente, un punto final Pro optimizado para producción y un punto final Flex para control de bajo nivel.

A alto nivel, FLUX.2 combina una estructura generativa latente (arquitectura de flujo/transformador) con un modelo de visión-lenguaje para la base semántica, y un VAE recién entrenado para proporcionar un espacio latente compartido entre variantes. Este diseño permite al modelo generar y reconstruir (editar) con mayor fidelidad, manteniendo la representación aprendible para el entrenamiento y el ajuste. El VAE abierto es particularmente notable porque estandariza el espacio latente para flujos de trabajo alojados y autoalojados.

Por qué es importante: la combinación del lenguaje y la correspondencia de flujo latente permite un seguimiento más preciso de las indicaciones (de modo que las instrucciones compositivas de varias partes se comportan de forma predecible), una mejor tipografía y una arquitectura única que permite la generación y edición con múltiples referencias. Para los creadores, esto se traduce en resultados más fiables para instrucciones complejas e insumos mixtos (texto e imágenes).

¿Cómo accedo a la API de FLUX.2?

Preparar el entorno

Regístrate e inicia sesión en CometAPI y obtén tu clave API desde tu panel de perfil. Idealmente, deberías tener conocimientos de API como desarrollador (te ayudaremos con esto, así que no te preocupes).

También deberá seleccionar el método de solicitud deseado y el modelo Flux.2 apropiado.

¿Qué puntos finales y autenticación se requieren?

La API Replicate Predictions permite generar imágenes de alta calidad utilizando diversos modelos FLUX de Black Forest Labs mediante el formato estándar Replicate. Esta API admite una amplia gama de variantes de modelos FLUX, cada una optimizada para diferentes casos de uso, desde la creación rápida de prototipos hasta la generación de imágenes de nivel profesional. Los usuarios pueden cambiar fácilmente entre diferentes modelos simplemente cambiando el nombre del modelo en la URL (https://api.cometapi.com/replicate/v1/models/{models}/predictions), lo que la hace flexible para diversas aplicaciones creativas y comerciales.

CometAPI Expone puntos finales administrados en https://api.cometapi.com/flux/v1/{model} y nombra puntos finales como flux-2-pro, flux-2-flex y flux-2-flex para la creación y edición de imágenes. Las solicitudes requieren una clave API en el archivo. x-key encabezado .

Familia de modelos y compensaciones de cálculo

FLUX.2 (pesos abiertos) — Úselo cuando necesite control local, experimentos de investigación o para ejecutar inferencias en su propia infraestructura. Dev es de peso abierto (32B) y excelente para investigación exploratoria y ajustes. Es más configurable, pero usted es responsable de la infraestructura y la optimización.
FLUX.2 profesional — El mejor equilibrio entre velocidad, calidad y coste para la producción. La versión Pro está optimizada para una latencia predecible, un cumplimiento constante de las indicaciones, un alto rendimiento y admite hasta 8 imágenes de referencia API (9 MP en total mediante API). Úsela para ediciones de gran volumen y cuando necesite fiabilidad y precios predecibles.
FLUX.2 (administrado + controlable) — Expone controles de generación de bajo nivel (por ejemplo, steps, guidance) y admite más referencias (hasta 10) y una calidad/detalle ligeramente superior al aceptar una mayor latencia y un mayor coste. Use Flex cuando necesite el control creativo final: fidelidad tipográfica, colores exactos o ajustes de composición muy detallados.

Prototipo en Dev o un bajo costo Pro planificar y luego migrar a Pro para escala o Flex para renders finales altamente controlados.

¿Cómo uso la API FLUX.2?

Ciclo de vida de la solicitud (modelo de tarea + sondeo)

Las respuestas a las solicitudes de edición/generación son objetos de tarea que incluyen un polling_url y idCrea una solicitud y luego sondea (o usa webhooks) para obtener la URL del resultado firmada. Las URL firmadas tienen una vida útil corta (normalmente unos 10 minutos), por lo que se obtienen los resultados rápidamente.

La API alojada sigue un modelo de tarea asincrónica:

POST una solicitud de generación → devuelve un task id y polling_url más estimado cost.
Encuesta a la polling_url hasta status == "Ready", luego recupera el resultado de la imagen (generalmente base64 o una URL alojada).

Ejemplo: Python (solicitudes): enviar y sondear

import time, requests, os

API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"

payload = {
    "prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
    "width": 1024, "height": 1024, "seed": 42
}

r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task

while True:
    time.sleep(0.5)
    status_r = requests.get(polling_url, headers={"x-key": API_KEY})
    status_r.raise_for_status()
    status = status_r.json()
    if status == "Ready":
        print("Result URL:", status)
        break
    elif status in ("Error", "Failed"):
        print("Generation failed:", status)
        break

Este patrón (enviar → sondeo o webhook) es el flujo sincrónico/asincrónico principal para los puntos finales administrados.

Edición de imágenes: ejemplo mínimo (curl con URL de entrada)

curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
  -H "accept: application/json" \
  -H "x-key: $CometAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
    "input_image": "https://example.com/my-photo.jpg",
    "width": 2048,
    "height": 1536
  }'

Para la edición de múltiples referencias, utilice input_image, input_image_2, input_image_3, … (Pro admite hasta 8 referencias a través de API; Flex hasta 10; Dev recomienda un máximo de ~6 dependiendo de la memoria).

¿Qué parámetros básicos debo enviar?

Los campos importantes del cuerpo de la solicitud (edición/generación de imágenes) incluyen:

guidance y steps — permitir un control detallado.
prompt (cadena) — hasta 32 000 tokens; lenguaje natural detallado o JSON estructurado.
input_image (cadena) — requerida para ediciones (URL o base64).
input_image_2 ... input_image_9 — imágenes multi-referencia.
width / height — múltiplos de 16; salida máxima 4MP.
seed — entero para reproducibilidad.
safety_tolerance — nivel de moderación.

¿Cómo puedo aprovechar FLUX.2 Pro para la generación profesional de texto a imagen?

FLUX.2 Pro está optimizado para obtener resultados fiables y de alta calidad. Úselo cuando necesite resultados consistentes para su marca, plazos de entrega rápidos y acuerdos de nivel de servicio (SLA) empresariales.

Receta de flujo de trabajo: imágenes de producción

Indicaciones de preprocesamiento: Mantenga una línea de "intención" breve y una sección de atributos estructurados (iluminación, lente, ambiente, códigos hexadecimales de color para los colores de la marca). FLUX.2 admite la dirección de color hexadecimal para preservar las paletas de la marca.
Comience con valores predeterminados conservadores: pasos 30–50 y escala de orientación 6–9.0; aumente los pasos para obtener más detalles, aumente la orientación para que los resultados se adhieran más estrictamente a la indicación.
Utilice semillas + muestreo determinista para la reproducibilidad en pruebas A/B.
Utilice el punto final Pro para el muestreo de múltiples intentos: Solicite N variaciones en paralelo y elija la mejor: más económica y rápida que el ajuste manual de hiperparámetros.
Post-proceso: Eliminación de ruido, mapeo de tonos menor o retoques de estilo vectorial en una canalización determinista. Considere una GAN pequeña o una pasada de superresolución si necesita una salida superior a la nativa.

Por qué ayudan estos pasos: Pro equilibra velocidad y fidelidad y generalmente aplica filtros de contenido/seguridad posteriores a la generación, por lo que es la opción predeterminada sensata para los activos orientados al cliente.

Los mejores consejos para generar imágenes

1. La estimulación estructurada favorece la producción. Organice las indicaciones por prioridad: tema → acción → estilo → contexto. Use indicaciones JSON (escena, sujetos, cámara, iluminación, paleta de colores) cuando necesite una composición determinista en varias imágenes. Ejemplo de uso del esquema JSON (pseudo):

{
  "scene": "product shot",
  "subjects": [
    {"type":"mug","pose":"center","style":"ceramic, matte"},
    {"type":"background","style":"wooden desk, window light"}
  ],
  "camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}

2. Reproducibilidad: Pass seed Para reproducir posteriormente. Mantenga un indicador de mapeo de catálogo + semilla → imagen para trazabilidad.

3. Lotes y orquestación: Para grandes producciones, envíe muchas solicitudes en paralelo a Pro, pero limite la velocidad para evitar limitaciones; prefiera el punto final Pro para una latencia predecible. Use colas de trabajos y grupos de trabajadores para descargar rápidamente los resultados firmados una vez listos.

4. Moderación y seguridad: Use safety_tolerance Para controlar el rigor de la moderación. Los puntos finales Pro incluyen políticas de uso y ganchos de moderación de contenido; integran comprobaciones del servidor antes de publicar.

5. Posprocesamiento: Los resultados profesionales son de alta calidad, pero a veces requieren pequeños retoques. Incorpora un paso de posprocesamiento automatizado (recorte, corrección de color, composición) en tu proceso de producción y reserva la revisión manual de los recursos sensibles de la marca.

¿Cómo puedo personalizar las salidas con el punto final FLUX.2 Flex?

Flex es la variante de “herramienta quirúrgica”: ajusta los pasos, la guía, las indicaciones negativas, los tamaños de los mosaicos y los recuentos de referencias para dar forma al resultado con precisión.

Cuándo elegir Flex

Necesita una representación tipográfica precisa (maquetas de UI, etiquetas).
Debes componer múltiples referencias con control sobre la pose y la iluminación.
Estás experimentando con técnicas de indicaciones avanzadas (indicaciones estructuradas, cadenas de restricciones).

Ejemplo: Teclas de control flexibles y sus efectos

steps — más pasos = detalles más finos (a costa de latencia).
guidance_scale — más alto = más cerca del texto indicado, más bajo = más creatividad.
negative_prompt — eliminar elementos explícitamente (por ejemplo, “sin marca de agua, sin dedos adicionales”).
tile_size / tiled_inference — para una generación de muy alta resolución, espacio de inferencia de mosaicos para intercambiar memoria por velocidad.
reference_weights — algunos puntos finales le permiten ponderar las referencias para determinar qué imagen determina la pose frente al estilo.

Consejo práctico: Para composiciones complejas, ejecute una vista previa breve con poca guía para verificar la composición y, a continuación, aumente la escala con más pasos y mayor guía. Esta técnica de dos pasadas reduce el coste y proporciona resultados finales precisos.

Ejemplo: Solicitud flexible con pasos y orientación

curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
  -H "Content-Type: application/json" \
  -H "x-key: $BFL_API_KEY" \
  -d '{
    "prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
    "width": 1536, "height": 2048,
    "steps": 50,
    "guidance": 7.5,
    "seed": 99999
  }'

Consejo: Usa Flex durante las aprobaciones creativas finales y Pro para procesos de trabajo a gran escala y más rápidos. Flex es notablemente más controlable para tareas de tipografía y microdetalle.

Mejores prácticas para el uso en producción

A continuación se presentan patrones probados en batalla y consejos pragmáticos para integrar FLUX.2 a escala.

1) Controle los costos mediante el seguimiento de megapíxeles y el almacenamiento en caché

La facturación de FLUX.2 se basa en megapíxeles de entrada + salidaPara la generación de gran volumen, prefiera renderizados de vista previa más pequeños (pasos rápidos de baja resolución) y escale solo a renderizados finales de MP más altos. Almacene en caché los recursos renderizados (o almacene las diferencias) para no volver a renderizar trabajos idénticos. Siempre superponga cost en respuestas y registrarlo por solicitud.

2) Use los niveles de forma inteligente: división entre vista previa y renderizado final

Ejecute renderizados Pro rápidos y de pasos bajos para crear prototipos o muchas variantes.
Utilice Flex o series Pro de alta resolución para obtener resultados finales aprobados donde la fidelidad es crucial. Este enfoque híbrido equilibra el rendimiento y la calidad de imagen final.

3) Ingeniería de indicaciones → indicaciones estructuradas y JSON

Aproveche las ventajas de FLUX.2 solicitud JSON estructurada Cuando se necesita una composición determinista (objetos de la escena, cámara, poses, muestras de color hexadecimales). Esto reduce los ciclos iterativos de solicitud y permite lotes más reproducibles. Los ejemplos de Cloudflare muestran solicitudes JSON integradas en formularios multiparte.

4) Semilla + versionado para reproducibilidad

Cuando necesite resultados reproducibles, pase una seed y registrar la versión/marca de tiempo del modelo en los metadatos. Para las canalizaciones de activos deterministas, mantenga un manifiesto: indicador, semilla, variante del modelo, resolución y hashes de imágenes de referencia. Esto mejora la trazabilidad y las opciones de reversión.

Conclusión

FLUX.2 está diseñado específicamente para acortar la distancia entre una demo impresionante y una herramienta creativa de producción. Con edición multireferencia, resultados de alta resolución y un conjunto de puntos finales alojados (además de código de inferencia abierto y compilaciones cuantificadas para consumidores), ofrece a los equipos numerosas opciones prácticas: ejecutar localmente para investigación y personalización, o usar los puntos finales alojados de Pro/Flex para procesos de producción estables.

Los desarrolladores pueden acceder API de desarrollo de Flux.2, API flexible de Flux.2 y API de Flux.2 Pro a través de CometAPI. Para comenzar, explore las capacidades del modelo de CometAPI en el Playground y consultar el Guía de API Para obtener instrucciones detalladas, consulte la sección "Antes de acceder, asegúrese de haber iniciado sesión en CometAPI y de haber obtenido la clave API". Como e API Ofrecemos un precio muy inferior al oficial para ayudarte a integrarte.

¿Listo para ir?→ Regístrate en CometAPI hoy !

Si quieres conocer más consejos, guías y novedades sobre IA síguenos en VK, X y Discord!