FLUX.2 — второе поколение семейства моделей генерации и редактирования изображений от Black Forest Labs (релиз 25 ноября 2025 года). Оно предлагает производственный уровень фотореализма, многореференсное редактирование до 4MP, структурированное/JSON-промптирование, а также выбор управляемых эндпоинтов (Pro, Flex) и варианты с открытыми весами (Dev).
Хорошая новость: CometAPI интегрировал Flux.2 API. В этом руководстве объясняется, что такое FLUX.2, как вызывать API, а также продвинутые рабочие процессы (текст→изображение, гибкий контроль, многореференсное редактирование) с примерами кода и лучшими практиками.
Что такое FLUX.2 и почему это важно?
FLUX.2 — продолжение семейства моделей FLUX, созданное для высокоточной генерации изображений по тексту и редактирования изображений по нескольким референсам в производственных разрешениях (до ~4 мегапикселей). FLUX.2 ориентирован на реальные творческие процессы (безопасные для бренда ассеты, согласованные персонажи и стили между референсами, лучшая типографика и мелкие детали), а не на демо, и стремится сократить разрыв между сгенерированными и реальными изображениями.
Ключевые результаты, для которых создан FLUX.2
- Фотореалистичные результаты, подходящие для рекламы, продуктовых изображений и UI-макетов.
- Нативное многореференсное редактирование: комбинирование, замена или композиция элементов из нескольких входных изображений в одном редактировании.
- Варианты под разные задачи: открыто доступные модели для разработчиков, Pro-эндпоинт, оптимизированный для продакшена, и Flex-эндпоинт для низкоуровневого контроля.
На высоком уровне FLUX.2 сочетает латентный генеративный бэкбон (архитектура flow/transformer) с визуально-языковой моделью для семантической опоры и заново обученным VAE, обеспечивающим общее латентное пространство между вариантами. Такой дизайн позволяет модели выполнять и генерацию, и реконструкцию (редактирование) с более высокой точностью, сохраняя при этом представление обучаемым для обучения и дообучения. Открытый VAE особенно важен, поскольку стандартизирует латентное пространство для размещённых и саморасполагаемых (self-hosted) сценариев.
Почему это важно: сочетание языка и согласования латентных потоков даёт более строгое следование промпту (чтобы многокомпонентные, композиционные инструкции вели себя предсказуемо), лучшую типографику и единую архитектуру, поддерживающую как генерацию, так и редактирование с несколькими референсами. Для создателей это означает более надёжные результаты при сложных инструкциях и смешанных входных данных (текст + изображения).
Как получить доступ к FLUX.2 API?
Подготовка окружения
Зарегистрируйтесь и войдите в CometAPI и получите свой API-ключ в панели профиля. Желательно иметь базовые знания API как разработчик (мы поможем в этом, так что не переживайте).
Вам также нужно выбрать желаемый метод отправки запросов и соответствующую модель Flux.2.
Какие конечные точки и аутентификация требуются?
Replicate Predictions API предоставляет доступ к генерации высококачественных изображений с использованием различных моделей FLUX от Black Forest Labs через стандартный формат Replicate. Этот API поддерживает широкий спектр вариантов моделей FLUX, каждая оптимизирована под разные задачи — от быстрого прототипирования до профессиональной генерации. Пользователи могут легко переключаться между моделями, просто изменяя имя модели в пути URL (https://api.cometapi.com/replicate/v1/models/{models}/predictions), что делает сервис гибким для творческих и коммерческих приложений.
CometAPI предоставляет управляемые конечные точки по адресу https://api.cometapi.com/flux/v1/{model} и называет эндпоинты, например, flux-2-pro, flux-2-flex и flux-2-flex для создания и редактирования изображений. Для запросов требуется API-ключ в заголовке x-key.
Семейство моделей и компромиссы по вычислениям
- FLUX.2 (open weights) — Используйте, когда нужен локальный контроль, исследовательские эксперименты или запуск инференса на своей инфраструктуре. Dev — с открытыми весами (32B) и отлично подходит для исследовательской работы и дообучения. Он более настраиваемый, но ответственность за инфраструктуру и оптимизацию на вас.
- FLUX.2 pro — Лучший баланс скорости, качества и стоимости для продакшена. Pro настроен на предсказуемую задержку, стабильное следование промптам, высокий пропуск и поддерживает до 8 референсных изображений через API (итого 9MP). Используйте для редактирования в больших объёмах, когда важны надёжность и прогнозируемые цены.
- FLUX.2 (managed + controllability) — Предоставляет низкоуровневые элементы управления генерацией (например,
steps,guidance) и поддерживает больше референсов (до 10) и немного более высокое качество/детализацию при согласии на большую задержку и стоимость. Используйте Flex, когда нужен финальный творческий контроль — точная типографика, точные цвета или высокодетализированная композиция.
Прототипируйте на Dev или недорогом плане Pro, затем переходите на Pro для масштабирования или Flex для финальных рендеров с тонким контролем.
Как использовать FLUX.2 API?
Жизненный цикл запроса (модель задач и опроса)
Ответы на запросы генерации/редактирования — это объекты задач, включающие polling_url и id; вы создаёте запрос, а затем опрашиваете (или используете вебхуки), чтобы получить подписанный URL результата. Подписанные URL живут недолго (обычно ~10 минут), поэтому выгружайте результаты оперативно.
Хостируемый API использует асинхронную модель задач:
- POST-запрос на генерацию → возвращает
task idиpolling_urlплюс оценкуcost. - Опрос
polling_urlдо тех пор, покаstatus == "Ready", затем получение результата изображения (часто base64 или размещённый URL).
Пример: Python (requests) — отправка и опрос
import time, requests, os
API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"
payload = {
"prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
"width": 1024, "height": 1024, "seed": 42
}
r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task
while True:
time.sleep(0.5)
status_r = requests.get(polling_url, headers={"x-key": API_KEY})
status_r.raise_for_status()
status = status_r.json()
if status == "Ready":
print("Result URL:", status)
break
elif status in ("Error", "Failed"):
print("Generation failed:", status)
break
Эта схема (отправка → опрос или вебхук) — основной синхронный/асинхронный поток для управляемых эндпоинтов.
Редактирование изображений — минимальный пример (curl с входным URL)
curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
-H "accept: application/json" \
-H "x-key: $CometAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
"input_image": "",
"width": 2048,
"height": 1536
}'
Для многореференсного редактирования используйте input_image, input_image_2, input_image_3, … (Pro поддерживает до 8 референсов через API; Flex — до 10; для Dev рекомендуется максимум ~6 в зависимости от памяти).
Какие базовые параметры стоит передавать?
Важные поля тела запроса (редактирование/генерация изображений):
guidanceиsteps— обеспечивают тонкий контроль.prompt(string) — до 32K токенов; детализированный естественный язык или структурированный JSON.input_image(string) — обязателен для редактирования (URL или base64).input_image_2…input_image_9— многореференсные изображения.width/height— кратны 16; максимум вывода 4MP.seed— целое число для воспроизводимости.safety_tolerance— уровень модерации.
Как использовать FLUX.2 Pro для профессиональной генерации изображений по тексту?
FLUX.2 Pro настроен на надёжные, высококачественные результаты. Используйте его, когда нужны стабильные брендовые ассеты, быстрый цикл и SLA уровня предприятия.
Рецепт рабочего процесса — производственные изображения
- Предобрабатывайте промпты: короткая строка «намерения» плюс структурированный блок атрибутов (свет, объектив, настроение, цветовые коды HEX для бренд‑палитры). FLUX.2 поддерживает управление цветами по HEX, что помогает сохранять брендовые палитры.
- Начните с консервативных значений по умолчанию: steps 30–50 и guidance 6–9.0; увеличивайте steps для деталей, повышайте guidance, чтобы усиливать соответствие промпту.
- Используйте
seed+ детерминированное сэмплирование для воспроизводимости и A/B‑тестов. - Применяйте Pro‑эндпоинт для мульти‑сэмплинга: запрашивайте N вариаций параллельно и выбирайте лучшее — это дешевле и быстрее, чем ручной подбор гиперпараметров.
- Постобработка: шумоподавление, лёгкое тональное маппирование или векторные правки в детерминированном пайплайне. Для разрешений выше нативного рассмотрите небольшой GAN или супер‑разрешение.
Почему это помогает: Pro балансирует скорость и точность и обычно применяет фильтры безопасности/контента после генерации, поэтому это разумный выбор по умолчанию для клиентских ассетов.
Лучшие советы по генерации изображений
- Структурированные промпты выигрывают в продакшене. Организуйте промпты по приоритету: субъект → действие → стиль → контекст. Используйте JSON‑промптирование (scene, subjects, camera, lighting, color_palette), когда нужна детерминированная композиция во многих изображениях. Пример схемы JSON (псевдо):
{
"scene": "product shot",
"subjects": [
{"type":"mug","pose":"center","style":"ceramic, matte"},
{"type":"background","style":"wooden desk, window light"}
],
"camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}
- Воспроизводимость: передавайте
seed, чтобы повторить результат позже. Ведите каталог соответствий промпт + seed → изображение для трассируемости. - Пакетирование и оркестрация: для больших объёмов отправляйте много запросов параллельно в Pro, но ограничивайте скорость, чтобы избежать троттлинга; предпочитайте Pro для предсказуемой задержки. Используйте очереди задач и пулы воркеров, чтобы оперативно скачивать подписанные результаты, как только они готовы.
- Модерация и безопасность: используйте
safety_toleranceдля управления строгостью модерации. Pro‑эндпоинты включают политики использования и хуки модерации контента; интегрируйте серверные проверки перед публикацией. - Постобработка: вывод Pro высококачественный, но иногда требует небольших правок. Постройте автоматизированный шаг постобработки (кроп, колор‑грейдинг, композитинг) и оставьте ручную проверку для бренд‑чувствительных ассетов.
Как настраивать выводы с помощью FLUX.2 Flex?
Flex — вариант «хирургического инструмента»: настраивайте steps, guidance, negative prompts, размеры тайлов и число референсов, чтобы точно формировать результат.
Когда выбирать Flex
- Нужна точная типографика (UI‑макеты, лейблы).
- Необходимо скомпоновать несколько референсов с контролем позы и освещения.
- Вы экспериментируете с продвинутыми приёмами промптинга (структурированные промпты, цепочки ограничений).
Пример — ключи управления Flex и их эффект
steps— больше шагов = тоньше детали (за счёт задержки).guidance_scale— выше = ближе к текстовому промпту, ниже = больше креативности.negative_prompt— явное исключение элементов (например, «no watermark, no extra fingers»).tile_size/tiled_inference— для генерации сверхвысоких разрешений: разбиение на тайлы, чтобы обменять память на скорость.reference_weights— некоторые эндпоинты позволяют взвешивать референсы, чтобы задать, какое изображение определяет позу, а какое — стиль.
Практический совет: для сложных композиций запустите короткий предпросмотр с низким guidance, чтобы проверить композицию, затем увеличьте разрешение с большим числом шагов и более высоким guidance. Такой двухпроходный подход снижает стоимость и даёт точный итог.
Пример: запрос Flex со steps и guidance
curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
-H "Content-Type: application/json" \
-H "x-key: $BFL_API_KEY" \
-d '{
"prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
"width": 1536, "height": 2048,
"steps": 50,
"guidance": 7.5,
"seed": 99999
}'
Совет: Используйте Flex на финальных творческих согласованиях, а Pro — для масштабных, быстрых пайплайнов. Flex заметно более управляем для задач типографики и микродеталей.
Лучшие практики для продакшена
Ниже — проверенные паттерны и прагматичные рекомендации для интеграции FLUX.2 на масштабе.
1) Контролируйте стоимость по мегапикселям и кэширoванию
Выставление счетов FLUX.2 зависит от числа мегапикселей входа + выхода. Для больших объёмов предпочитайте небольшие предпросмотры (низкое разрешение, быстрые шаги) и повышайте разрешение только для финальных рендеров. Кэшируйте отрисованные ассеты (или храните диффы), чтобы не перегенерировать идентичные задачи. Всегда отображайте cost в ответах и логируйте по запросам.
2) Грамотное использование уровней: сплит «предпросмотр vs финальный рендер»
- Запускайте быстрые рендеры Pro с низким числом шагов для прототипирования или множества вариаций.
- Используйте Flex или высокое разрешение на Pro для финально одобренных материалов, когда критична детализация. Такой гибридный подход балансирует пропускную способность и качество итогового изображения.
3) Инжиниринг промптов → структурированные промпты и JSON
Пользуйтесь структурированным JSON‑промптированием, когда нужна детерминированная композиция (объекты сцены, камера, позы, цветовые образцы HEX). Это сокращает итерации и повышает воспроизводимость серий. Примеры Cloudflare показывают JSON‑промпты, встроенные в multipart‑формы.
4) Seed + версионирование для воспроизводимости
Когда нужна воспроизводимость, передавайте seed и записывайте версию модели/временную метку в метаданных. Для детерминированных пайплайнов ассетов ведите манифест: промпт, seed, вариант модели, разрешение, хэши референс‑изображений. Это повышает трассируемость и упрощает откат.
Заключение
FLUX.2 нацелен на то, чтобы превратить «впечатляющее демо» в «производственный креативный инструмент». С многореференсным редактированием, высокими разрешениями и набором хостируемых эндпоинтов (плюс открытый код инференса и квантизованные потребительские сборки) он даёт командам множество практических опций: запуск локально для исследований и кастомизации или использование размещённых эндпоинтов Pro/Flex для стабильных продакшен‑пайплайнов.
Разработчики могут получить доступ к Flux.2 Dev API, Flux.2 Flex API и Flux.2 Pro API через CometAPI. Чтобы начать, изучите возможности моделей CometAPI в Playground и обратитесь к API guide за подробными инструкциями. Прежде чем получить доступ, убедитесь, что вы вошли в CometAPI и получили API‑ключ. CometAPI предлагает цены существенно ниже официальных, чтобы упростить интеграцию.
Готовы начать? → Зарегистрируйтесь в CometAPI сегодня!
Хотите больше советов, гайдов и новостей об ИИ — подписывайтесь на нас в VK, X и Discord!
