Como usar a API Flux.2? Tudo o que você precisa saber.

FLUX.2 é a segunda geração da família de modelos de geração e edição de imagens da Black Forest Labs (lançada em 25 de novembro de 2025). Oferece fotorrealismo de nível profissional, edição com múltiplas referências de até 4MP, prompts estruturados/JSON e opções de endpoints gerenciados (Pro, Flex) e opções de peso aberto (Dev).

A boa notícia é que a CometAPI integrou a API Flux.2. Este guia explica o que é o Flux.2, como chamar a API e fluxos de trabalho avançados (texto → imagem, controle flexível, edição com múltiplas referências), com exemplos de código e boas práticas.

O que é FLUX.2 e por que é importante?

FLUX.2 é a continuação da família de modelos de imagem FLUX — projetada para geração de texto em imagem de alta fidelidade e edição de imagens com múltiplas referências em resoluções de produção (até ~4 megapixels). FLUX.2 foi desenvolvido para fluxos de trabalho criativos reais (ativos seguros para a marca, caracteres e estilos consistentes em todas as referências, tipografia aprimorada e atenção aos detalhes), e não apenas para demonstrações, com o objetivo de reduzir a diferença entre imagens geradas e imagens reais.

Principais resultados: O FLUX.2 foi projetado para proporcionar

Imagens fotorrealistas ideais para publicidade, fotos de produtos e protótipos de interfaces de usuário.
Edição nativa com múltiplas referências: combine, troque ou componha elementos de várias imagens de entrada em uma única edição.
Variantes para diferentes casos de uso: modelos de desenvolvedor disponíveis publicamente, um endpoint Pro otimizado para produção e um endpoint Flex para controle de baixo nível.

Em linhas gerais, o FLUX.2 combina uma estrutura generativa latente (arquitetura de fluxo/transformador) com um modelo de visão-linguagem para fundamentação semântica e um VAE recém-treinado para fornecer um espaço latente compartilhado entre as variantes. Esse design permite que o modelo realize tanto a geração quanto a reconstrução (edição) com maior fidelidade, mantendo a representação treinável para treinamento e ajuste fino. O VAE aberto é particularmente notável porque padroniza o espaço latente para fluxos de trabalho hospedados e auto-hospedados.

Por que isso é importante: a combinação de linguagem e correspondência de fluxo latente resulta em um acompanhamento de instruções mais robusto (permitindo que instruções compostas e com várias partes se comportem de maneira previsível), melhor tipografia e uma arquitetura única que suporta tanto a geração quanto a edição com múltiplas referências. Para os criadores, isso significa resultados mais confiáveis para instruções complexas e entradas mistas (texto + imagens).

Como faço para acessar a API do FLUX.2?

Prepare o ambiente

Cadastre-se e faça login no CometAPI para obter sua chave de API no painel do seu perfil. Idealmente, você deve ter algum conhecimento de API como desenvolvedor (nós forneceremos assistência nesse sentido, então não se preocupe).

Você também precisará selecionar o método de requisição desejado e o modelo Flux.2 apropriado.

Quais endpoints exigem autenticação?

A API Replicate Predictions permite gerar imagens de alta qualidade usando diversos modelos FLUX da Black Forest Labs, através do formato padrão Replicate. Esta API suporta uma ampla gama de variantes de modelos FLUX, cada uma otimizada para diferentes casos de uso, desde prototipagem rápida até geração de imagens de nível profissional. Os usuários podem alternar facilmente entre diferentes modelos, simplesmente alterando o nome do modelo no caminho da URL (https://api.cometapi.com/replicate/v1/models/{models}/predictions), o que a torna flexível para diversas aplicações criativas e comerciais.

CometAPI Expõe endpoints gerenciados em https://api.cometapi.com/flux/v1/{model} e nomeia endpoints como flux-2-pro, flux-2-flex e flux-2-flex para criação e edição de imagens. As solicitações exigem uma chave de API no x-key cabeçalho.

Família de modelos e compensações computacionais

FLUX.2 (pesos abertos) — Use quando precisar de controle local, experimentos de pesquisa ou para executar inferência em sua própria infraestrutura. O Dev é de código aberto (32 bits) e excelente para pesquisa exploratória e ajustes finos. É mais configurável, mas você é responsável pela infraestrutura e otimização.
FLUX.2 pro — O melhor equilíbrio entre velocidade, qualidade e custo para produção. A versão Pro foi otimizada para latência previsível, cumprimento consistente dos prazos, alta taxa de transferência e suporta até 8 imagens de referência via API (9 MP no total, via API). Use esta opção para edição de alto volume e quando precisar de confiabilidade e preços previsíveis.
FLUX.2 (gerenciado + controlável) — Expõe controles de geração de baixo nível (por exemplo, steps, guidancee suporta mais referências (até 10) e qualidade/detalhes ligeiramente superiores, mediante o pagamento de uma latência e um custo maiores. Utilize o Flex quando precisar do controlo criativo final — fidelidade tipográfica, cores exatas ou ajustes de composição altamente detalhados.

Protótipo em Dev ou de baixo custo Pro planeje e depois migre para Pro para escala ou Flexionar Para renderizações finais altamente controladas.

Como faço para usar a API FLUX.2?

Ciclo de vida da requisição (modelo de tarefa + polling)

As respostas às solicitações de edição/geração são objetos de tarefa que incluem um polling_url e idVocê cria uma solicitação e, em seguida, consulta (ou usa webhooks) para recuperar a URL de resultado assinada. URLs assinadas têm curta duração (normalmente cerca de 10 minutos), portanto, busque os resultados prontamente.

A API hospedada segue um modelo de tarefas assíncronas:

Enviar uma solicitação de geração POST → retorna um task id e polling_url mais estimado cost.
Faça a pesquisa polling_url até status == "Ready"Em seguida, recupere o resultado da imagem (geralmente em base64 ou um URL hospedado).

Exemplo: Python (requests) — enviar e consultar

import time, requests, os

API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"

payload = {
    "prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
    "width": 1024, "height": 1024, "seed": 42
}

r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task

while True:
    time.sleep(0.5)
    status_r = requests.get(polling_url, headers={"x-key": API_KEY})
    status_r.raise_for_status()
    status = status_r.json()
    if status == "Ready":
        print("Result URL:", status)
        break
    elif status in ("Error", "Failed"):
        print("Generation failed:", status)
        break

Esse padrão (envio → pesquisa ou webhook) é o principal fluxo síncrono/assíncrono para os endpoints gerenciados.

Edição de imagens — exemplo mínimo (curl com URL de entrada)

curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
  -H "accept: application/json" \
  -H "x-key: $CometAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
    "input_image": "https://example.com/my-photo.jpg",
    "width": 2048,
    "height": 1536
  }'

Para edição com múltiplas referências, utilize input_image, input_image_2, input_image_3… (A versão Pro suporta até 8 referências via API; a versão Flex, até 10; a versão Dev recomenda um máximo de aproximadamente 6, dependendo da memória).

Quais parâmetros básicos devo enviar?

Os campos importantes no corpo da requisição (edição/geração de imagens) incluem:

guidance e steps — permitir controle preciso.
prompt (string) — até 32 mil tokens; linguagem natural detalhada ou JSON estruturado.
input_image (string) — obrigatório para edições (URL ou base64).
input_image_2 ... input_image_9 — imagens com múltiplas referências.
width / height — múltiplos de 16; saída máxima de 4MP.
seed — número inteiro para garantir a reprodutibilidade.
safety_tolerance — nível de moderação.

Como posso aproveitar o FLUX.2 Pro para geração profissional de imagens a partir de texto?

O FLUX.2 Pro foi projetado para oferecer resultados confiáveis e de alta qualidade. Use-o quando precisar de resultados consistentes com o mesmo nível de qualidade da sua marca, prazos de entrega rápidos e SLAs corporativos.

Receita de fluxo de trabalho — imagens de produção

Instruções de pré-processamento: Mantenha uma breve descrição da intenção, além de uma seção de atributos estruturada (iluminação, lente, atmosfera, códigos hexadecimais para as cores da marca). O FLUX.2 oferece suporte ao direcionamento de cores hexadecimais para ajudar a preservar as paletas da marca.
Comece com configurações padrão conservadoras: Etapas 30 a 50 e escala de orientação de 6 a 9.0; aumente as etapas para obter detalhes e aumente a orientação para que os resultados estejam mais de acordo com as instruções.
Utilizar sementes + amostragem determinística para garantir a reprodutibilidade em testes A/B.
Utilize o endpoint Pro para amostragem com múltiplas tentativas: Solicitar N variações em paralelo e escolher a melhor — mais barato e mais rápido do que o ajuste manual de hiperparâmetros.
Pós-processamento: Redução de ruído, mapeamento de tons menores ou retoques vetoriais em um pipeline determinístico. Considere uma pequena GAN ou uma passagem de super-resolução se precisar de uma saída com qualidade superior à nativa.

Por que essas etapas ajudam: O modo Pro equilibra velocidade e fidelidade e geralmente aplica filtros de segurança/conteúdo pós-geração, sendo, portanto, a opção padrão sensata para ativos voltados para o cliente.

Melhores dicas para gerar imagens

1. O uso de instruções estruturadas traz benefícios para a produção. Organize os prompts por prioridade: assunto → ação → estilo → contexto. Use prompts em JSON (cena, assuntos, câmera, iluminação, paleta de cores) quando precisar de uma composição determinística em várias imagens. Exemplo de uso do esquema JSON (pseudo):

{
  "scene": "product shot",
  "subjects": [
    {"type":"mug","pose":"center","style":"ceramic, matte"},
    {"type":"background","style":"wooden desk, window light"}
  ],
  "camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}

2. Reprodutibilidade: Passar seed para reproduzir posteriormente. Mantenha um mapeamento de catálogo, prompt + semente → imagem para rastreabilidade.

3. Processamento em lote e orquestração: Para grandes execuções de produção, envie várias solicitações em paralelo para o Pro, mas limite a taxa para evitar restrições; prefira o endpoint Pro para latência previsível. Use filas de tarefas e pools de trabalhadores para baixar os resultados assinados rapidamente assim que estiverem prontos.

4. Moderação e segurança: Uso safety_tolerance Para controlar o rigor da moderação. Os endpoints Pro incluem políticas de uso e recursos de moderação de conteúdo; integre verificações no servidor antes da publicação.

5. Pós-processamento: Os arquivos profissionais são de alta qualidade, mas ocasionalmente precisam de pequenos retoques. Crie uma etapa de pós-processamento automatizada (recorte, correção de cor, composição) em seu fluxo de trabalho e mantenha a revisão humana para arquivos sensíveis à marca.

Como posso personalizar as saídas com o endpoint FLUX.2 Flex?

Flex é a variante "ferramenta cirúrgica": ajuste etapas, orientações, avisos negativos, tamanhos de blocos e contagens de referência para moldar a saída com precisão.

Quando escolher o Flex

Você precisa de uma renderização tipográfica precisa (protótipos de interface do usuário, rótulos).
Você deve compor múltiplas referências com controle sobre a pose e a iluminação.
Você está experimentando técnicas avançadas de prompts (prompts estruturados, cadeias de restrições).

Exemplo — Teclas de controle Flex e seus efeitos

steps — Mais etapas = maior detalhamento (ao custo de latência).
guidance_scale — Quanto maior o valor, mais próximo do texto sugerido; quanto menor o valor, mais criatividade.
negative_prompt — remover elementos explicitamente (ex: “sem marca d'água, sem dedos extras”).
tile_size / tiled_inference — para geração de altíssima resolução, o espaço de inferência de mosaico troca memória por velocidade.
reference_weights — alguns endpoints permitem ponderar as referências para influenciar qual imagem direciona a pose em vez do estilo.

Dica prática: Para composições complexas, execute uma pré-visualização curta e com baixa precisão para verificar a composição e, em seguida, aumente a escala com mais etapas e maior precisão. Essa técnica de duas etapas reduz o custo e, ao mesmo tempo, fornece resultados finais precisos.

Exemplo: Solicitação flexível com etapas e orientações

curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
  -H "Content-Type: application/json" \
  -H "x-key: $BFL_API_KEY" \
  -d '{
    "prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
    "width": 1536, "height": 2048,
    "steps": 50,
    "guidance": 7.5,
    "seed": 99999
  }'

Dica: Use o Flex durante as aprovações criativas finais e o Pro para fluxos de trabalho mais rápidos e em larga escala. O Flex oferece um controle consideravelmente maior para tipografia e tarefas que exigem precisão em microdetalhes.

Melhores práticas para uso em produção

A seguir, apresentamos padrões testados em batalha e conselhos práticos para integrar o FLUX.2 em larga escala.

1) Controle os custos rastreando megapixels e armazenando em cache.

A cobrança do FLUX.2 é baseada em megapixels de entrada + saídaPara geração de alto volume, prefira renderizações de pré-visualização menores (etapas rápidas de baixa resolução) e só passe para renderizações finais com maior resolução. Armazene em cache os ativos renderizados (ou guarde as diferenças) para não renderizar novamente trabalhos idênticos. Sempre utilize a interface de renderização. cost Nas respostas, registre-as por solicitação.

2) Use as camadas de forma inteligente: divisão entre pré-visualização e renderização final.

Execute renderizações Pro rápidas e com poucos passos para prototipagem ou muitas variantes.
Use o Flex ou o Pro de alta resolução para obter as imagens finais aprovadas, onde a fidelidade é importante. Essa abordagem híbrida equilibra a produtividade e a qualidade da imagem final.

3) Engenharia de prompts → prompts estruturados e JSON

Aproveite as vantagens do FLUX.2 prompts JSON estruturados Quando você precisa de composição determinística (objetos de cena, câmera, poses, amostras de cores hexadecimais). Isso reduz os ciclos iterativos de solicitação e leva a lotes mais reproduzíveis. Os exemplos da Cloudflare mostram solicitações JSON incorporadas em formulários multipartes.

4) Semente + versionamento para reprodutibilidade

Quando você precisar de resultados reproduzíveis, passe um seed e registre a versão/data e hora do modelo nos metadados. Para pipelines de ativos determinísticos, mantenha um manifesto: prompt, seed, variante do modelo, resolução e hashes da imagem de referência. Isso melhora a rastreabilidade e as opções de reversão.

Conclusão

O FLUX.2 visa diretamente preencher a lacuna entre uma "demonstração impressionante" e uma "ferramenta criativa de produção". Com edição multirreferencial, saídas de alta resolução e um conjunto de endpoints hospedados (além de código de inferência aberto e builds de consumo quantizados), ele oferece às equipes diversas opções práticas: executar localmente para pesquisa e personalização ou usar os endpoints Pro/Flex hospedados para pipelines de produção estáveis.

Os desenvolvedores podem acessar API de desenvolvimento Flux.2, API Flux.2 Flex e API Flux.2 Pro por meio da CometAPI. Para começar, explore os recursos de modelagem da CometAPI no Playground e consulte o Guia de API para obter instruções detalhadas. Antes de acessar, certifique-se de ter feito login no CometAPI e obtido a chave da API. Com e tAPI oferecem um preço muito mais baixo que o preço oficial para ajudar você a se integrar.

Pronto para ir?→ Inscreva-se no CometAPI hoje mesmo !

Se você quiser saber mais dicas, guias e novidades sobre IA, siga-nos em VK, X e Discord!