Principais recursos (o que o Flux.2 Dev faz)
- Geração Texto→Imagem com alta aderência ao prompt e melhorias na tipografia e na renderização de pequenos detalhes.
- Edição com múltiplas referências — combine várias imagens de referência em uma única saída, preservando a consistência de identidade/estilo
- Um único checkpoint para geração + edição (não é necessário um modelo de edição separado).
- Grande checkpoint de pesos abertos (32B) permitindo pesquisa local, quantização e adaptação pela comunidade.)
- VAE otimizado para um compromisso melhor entre capacidade de aprendizado–qualidade–compressão (permite edição/saídas de 4MP).
Detalhes técnicos (arquitetura e engenharia)
- Contagem de parâmetros: 32 bilhões de parâmetros para o checkpoint do FLUX.2.
- Design central: correspondência de fluxo latente / transformer de fluxo retificado combinado com um modelo visão-linguagem (a BFL diz que acoplam um VLM Mistral-3 24B ao backbone do transformer para ancoragem semântica). O VLM contribui com conhecimento de mundo e ancoragem textual, enquanto o transformer modela a estrutura espacial/composicional.
- VAE: novo VAE do FLUX.2 (lançado sob Apache-2.0) retreinado para melhorar a fidelidade de reconstrução e a capacidade de aprendizado no latente, permitindo edição em alta resolução.
- Amostragem e destilação: treinado usando técnicas de destilação guiada para melhorar a eficiência e a fidelidade na inferência.
Desempenho em benchmarks
A Black Forest Labs publicou avaliações comparativas e gráficos mostrando o desempenho do FLUX.2 versus modelos de imagem contemporâneos de pesos abertos e hospedados. Números principais publicados (BFL / resumos da imprensa):
- Taxa de vitória em texto-para-imagem: FLUX.2 ~66.6% (vs. Qwen-Image 51.3%, Hunyuan ~48.1% no conjunto head-to-head da BFL).
- Taxa de vitória em edição com referência única: FLUX.2 ~59.8% (vs. Qwen-Image 49.3%, FLUX.1 Kontext ~41.2%).
- Taxa de vitória em edição com múltiplas referências: FLUX.2 ~63.6% (vs. Qwen-Image 36.4%). A BFL também relata capacidade de múltiplas referências de até 10 referências em sua suíte de avaliação.
Casos de uso típicos/recomendados
- Variações de imagens para anúncios e marketing nas quais o mesmo modelo/ator/produto deve permanecer consistente em muitas cenas ou fundos (consistência multirreferência).
- Fotografia de produto e prova virtual (virtual try-on) (preservar detalhes do produto em diferentes fundos).
- Editorial/ensaios de moda exigindo a mesma identidade em muitas fotos.
- Prototipagem rápida e pesquisa (o checkpoint dev permite experimentação, fine-tuning e fluxos de trabalho com LoRA/adapter).
Como acessar a API do Flux.2 dev
Etapa 1: Cadastre-se para obter a chave de API
Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Entre no console do CometAPI. Obtenha a credencial de acesso, a chave de API da interface. Clique em “Add Token” no token de API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.

Etapa 2: Envie requisições para a API do Flux.2 dev
Selecione o endpoint “black-forest-labs/flux-2-dev ” para enviar a requisição de API e defina o corpo da requisição. O método e o corpo da requisição são obtidos na nossa documentação de API no site. Nosso site também oferece teste via Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua CometAPI key real da sua conta.
Insira sua pergunta ou solicitação no campo content — é isso ao que o modelo responderá. Procese a resposta da API para obter a resposta gerada.
Etapa 3: Recupere e verifique os resultados
Procese a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.
CometAPI Agora com suporte a modelos no formato Replicate: 🔹 black-forest-labs/flux-2-pro 🔹 black-forest-labs/flux-2-dev 🔹 black-forest-labs/flux-2-flex
Promoção por tempo limitado: mais baixo que o preço oficial da Replicate!
👇 Comece a construir agora Criar previsões – Documentação da API
⚡ Seleção flexível:
- Pro: Projetado para produção de alta eficiência e entrega rápida.
- Flex: Maximiza a qualidade da imagem com parâmetros ajustáveis.
- Dev: Otimização voltada para desenvolvedores.