O que é FLUX.2 Flex
FLUX.2 é o membro “flexível” (API gerenciada) da família de produtos FLUX.2 da Black Forest Labs. Ele foi projetado para desenvolvedores e equipes criativas que precisam de:
- controle explícito sobre parâmetros de geração (etapas de inferência, escala de orientação, etc.) para poder trocar velocidade por fidelidade durante fluxos de trabalho iterativos;
- tipografia/renderização de texto robusta e tratamento de detalhes muito finos (infográficos, mockups de UI, rótulos de produto); e
- edição confiável com múltiplas referências (combinar elementos de várias fotos mantendo identidade/consistência).
FLUX.2 é oferecido como múltiplas variantes de produto (Pro, Flex, Dev, Klein) que atendem a diferentes padrões de uso — Flex fica entre Pro (qualidade mais alta + latência fixa) e Dev (checkpoint de pesos abertos para pesquisa/uso local).
Principais recursos (o que o FLUX.2 Flex traz para a mesa)
- Controle de geração: parâmetros explícitos (etapas, escala de orientação) para equilibrar velocidade vs. fidelidade ao prompt.
- Saída em alta resolução: capaz de produzir até 4 megapixels (4MP) preservando os detalhes.
- Entradas com múltiplas referências: aceita múltiplas imagens de referência (Flex suporta até 10 imagens de referência; os números em Dev/Pro variam por nível). Isso permite renderizações consistentes de personagens/produtos entre saídas.
- Tipografia e renderização de texto melhoradas: a BFL enfatiza melhorias substanciais na renderização de glifos, kerning e layouts multilinha — tornando o FLUX.2 atraente para UI, embalagens e infográficos.
- API gerenciada com precificação por megapixel (modelo de custo previsível): a precificação do Flex usa um modelo por megapixel (consulte a seção de Preços).
Detalhes técnicos do FLUX.2 Flex
Arquitetura principal: FLUX.2 usa um backbone de latent flow-matching (flow transformer) combinado com um modelo de visão e linguagem (a BFL afirma que ele acopla um VLM Mistral-3 24B com um rectified flow transformer). O VAE usado pelo FLUX.2 foi reentreinado para melhorar o equilíbrio entre aprendibilidade/qualidade/compactação. Essas escolhas ajudam com conhecimento de mundo, lógica composicional e aderência mais rigorosa ao prompt.
FLUX.2: tempos típicos de geração reportados ~22 s (apenas texto) e ~40 s (com imagem de entrada), aceita até 10 entradas e custa cerca de $0,048 por megapixel (entrada + saída combinadas) no CometAPI.
Nome do modelo: black-forest-labs/flux-2-flex
Restrições de entrada: o Flex aceita múltiplas entradas (até 10 entradas na oferta gerenciada) e é aplicado um limite total de megapixels de entrada (declara um máximo agregado de entrada de 14MP). Resoluções de saída acima de 4MP geralmente são reduzidas ou limitadas pelo serviço.
Desempenho em benchmarks do FLUX.2 Flex
Avaliação de taxa de vitória em estilo humano (benchmark do fornecedor): nos testes diretos publicados pela BFL, as variantes do FLUX.2 (notably ) apresentaram fortes taxas de vitória vs. modelos abertos contemporâneos: ~66,6% em texto-para-imagem, 59,8% em edição com referência única e 63,6% em edição com múltiplas referências vs. outros modelos abertos citados. A BFL também apresentou um gráfico de ELO vs. custo por imagem, colocando as variantes do FLUX.2 na faixa de ~1030–1050 ELO com custos por imagem na faixa de 2–6 centavos.
Limitações do FLUX.2 Flex
- Escalonamento de custo com referências/resolução: o Flex usa precificação por megapixel. Adicionar múltiplas imagens de referência ou aumentar a resolução de saída eleva o custo linearmente sob o modelo por megapixel anunciado. Para fluxos de trabalho que iteram com muitas referências, o custo pode se acumular rapidamente.
- Modos de falha de prompt/consistência: embora o FLUX.2 melhore a consistência de personagens, prompts complexos com múltiplos atributos ainda podem produzir falhas (artefatos, mistura inesperada ou deriva de pose/identidade) dependendo do design do prompt e do número de referências.
- Conteúdo e segurança: embora a BFL relate forte resiliência em testes de moderação/entradas violativas, modelos de imagem não são perfeitos; permanecem riscos de gerar material protegido por direitos autorais, personificação ou conteúdo inseguro.
Casos de uso típicos/recomendados
- Variações de imagens para anúncios e marketing em que o mesmo modelo/ator/produto deve permanecer consistente em muitos cenários ou fundos (consistência com múltiplas referências).
- Fotografia de produto e “virtual try-on” (preservar detalhes do produto em diferentes fundos).
- Ensaios/editoriais de moda exigindo a mesma identidade em muitas fotos.
- Prototipagem rápida e pesquisa (o checkpoint Dev permite experimentação, fine-tuning e fluxos de trabalho com LoRA/adapters).
Como acessar a API do Flux.2 Flex
Etapa 1: Inscreva-se para obter a chave de API
Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Acesse seu console do CometAPI. Obtenha a credencial de acesso (API key) da interface. Clique em “Add Token” no token da API na área pessoal, obtenha a token key: sk-xxxxx e envie.
Etapa 2: Envie solicitações para a API do Flux.2 Flex
Selecione o endpoint “black-forest-labs/flux-2-flex” para enviar a solicitação de API e defina o corpo da requisição. O método e o corpo da requisição são obtidos na documentação da API em nosso site. Nosso site também fornece teste no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave CometAPI real da sua conta.
Insira sua pergunta ou solicitação no campo de conteúdo — é a isso que o modelo responderá. Processe a resposta da API para obter a resposta gerada.
Etapa 3: Recupere e verifique os resultados
Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.
CometAPI Agora com suporte a modelos no formato Replicate: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
Promoção por tempo limitado: preço inferior ao oficial do Replicate!
👇 Comece a construir agora Create Predictions – API Doc
⚡ Seleção flexível:
- Pro: projetado para produção de alta eficiência e entrega rápida.
- Flex: maximiza a qualidade da imagem com parâmetros ajustáveis.
- Dev: otimização voltada para desenvolvedores.