FLUX.2 — это второе поколение семейства моделей Black Forest Labs для создания и редактирования изображений (выпущено 25 ноября 2025 г.). Оно обеспечивает фотореализм промышленного уровня, многореференсное редактирование с разрешением до 4 МП, структурированные запросы/JSON-запросы и выбор управляемых конечных точек (Pro, Flex) и версий с открытыми весами (Dev).
Хорошая новость заключается в том, что CometAPI интегрировал API Flux.2. В этом руководстве объясняется, что такое FLUX.2, как вызывать API и расширенные рабочие процессы (текст → изображение, гибкое управление, редактирование нескольких ссылок), с примерами кода и рекомендациями.
Что такое FLUX.2 и почему это важно?
FLUX.2 — это продолжение семейства моделей изображений FLUX, разработанное для высокоточной генерации текста в изображение и редактирования изображений по нескольким референсам в рабочем разрешении (до ~4 мегапикселей). FLUX.2 создан для реальных творческих рабочих процессов (безопасные для бренда ресурсы, единые символы и стили во всех референсах, улучшенная типографика и детализация), а не для демонстраций, и призван сократить разрыв между сгенерированными и реальными изображениями.
Ключевые результаты, для которых предназначен FLUX.2
- Фотореалистичные результаты, подходящие для рекламы, изображений продукции и макетов пользовательского интерфейса.
- Встроенное многореферентное редактирование: объединяйте, меняйте местами или компонуйте элементы из нескольких входных изображений в рамках одного редактирования.
- Варианты для различных вариантов использования: общедоступные модели для разработчиков, конечная точка Pro, оптимизированная для производства, и конечная точка Flex для низкоуровневого управления.
На высоком уровне FLUX.2 сочетает в себе латентную генеративную основу (архитектуру потока/трансформатора) с моделью «визуализация–язык» для семантического обоснования и недавно обученным виртуальным анахронизмом (VAE) для обеспечения общего латентного пространства между вариантами. Такая конструкция позволяет модели выполнять как генерацию, так и реконструкцию (редактирование) с более высокой точностью, сохраняя при этом обучаемость представления для обучения и тонкой настройки. Открытая VAE особенно примечательна тем, что стандартизирует латентное пространство для рабочих процессов, размещаемых и размещаемых на серверах.
Почему это важно: объединение языка и сопоставления латентного потока обеспечивает более точное следование подсказкам (чтобы многокомпонентные, композиционные инструкции вели себя предсказуемо), лучшую типографику и единую архитектуру, поддерживающую как генерацию, так и редактирование с несколькими ссылками. Для создателей это означает более надёжные выходные данные для сложных инструкций и смешанных входных данных (текст + изображения).
Как получить доступ к API FLUX.2?
Подготовьте среду
Зарегистрируйтесь и войдите в CometAPI, а затем получите ключ API в панели своего профиля. В идеале, вам необходимо иметь некоторые знания API как разработчику (мы окажем вам в этом помощь, так что не беспокойтесь).
Вам также потребуется выбрать желаемый метод запроса и соответствующую модель Flux.2.
Какие конечные точки и аутентификация требуются?
API Replicate Predictions предоставляет доступ к созданию высококачественных изображений с использованием различных моделей FLUX от Black Forest Labs в стандартном формате Replicate. Этот API поддерживает широкий спектр вариантов моделей FLUX, каждый из которых оптимизирован для различных вариантов использования: от быстрого прототипирования до создания изображений профессионального уровня. Пользователи могут легко переключаться между различными моделями, просто изменяя имя модели в URL-адресе (https://api.cometapi.com/replicate/v1/models/{models}/predictions), что делает его гибким для различных творческих и коммерческих приложений.
CometAPI Предоставляет управляемые конечные точки по адресу https://api.cometapi.com/flux/v1/{model} и присваивает им имена, например, flux-2-pro, flux-2-flex и flux-2-flex, для создания и редактирования изображений. Для запросов требуется ключ API в x-key заголовок .
Семейство моделей и компромиссы вычислений
- FLUX.2 (открытые веса) — Используйте, когда вам требуется локальное управление, исследовательские эксперименты или выполнение выводов на вашей собственной инфраструктуре. Dev — это библиотека с открытым весом (32 Б) и отлично подходит для исследований и тонкой настройки. Она более настраиваемая, но вы отвечаете за инфраструктуру и оптимизацию.
- FLUX.2 pro — Оптимальное соотношение скорости, качества и стоимости для производства. Версия Pro обеспечивает предсказуемую задержку, стабильное соблюдение сроков, высокую производительность и поддерживает до 8 эталонных изображений API (всего 9 Мп через API). Используйте её для редактирования больших объёмов, а также когда вам нужна надёжность и предсказуемые цены.
- FLUX.2 (управляемый + управляемость) — Предоставляет низкоуровневые элементы управления генерацией (например,
steps,guidance) и поддерживает больше ссылок (до 10) и немного более высокое качество/детализацию, если вы готовы к более высокой задержке и стоимости. Используйте Flex, когда вам нужен полный контроль над творческим процессом — точность типографики, точные цвета или детальная корректировка композиции.
Прототип на Дев или недорогой Pro план, затем переход на Pro для масштаба или сгибать для тщательно контролируемых финальных рендеров.
Как использовать API FLUX.2?
Жизненный цикл запроса (модель «задача + опрос»)
Ответы на запросы по редактированию/генерации объекты задачи которые включают в себя polling_url и id; вы создаете запрос, а затем опрашиваете (или используете веб-перехватчики) для получения подписанного URL-адреса результата. Подписанные URL-адреса недолговечны (обычно около 10 минут), поэтому извлекайте результаты как можно скорее.
Размещенный API следует модели асинхронных задач:
- POST запрос на генерацию → возвращает
task idиpolling_urlплюс предполагаемыйcost. - Опрос
polling_urlдоstatus == "Ready", затем извлечь результат изображения (часто base64 или размещенный URL).
Пример: Python (запросы) — отправка и опрос
import time, requests, os
API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"
payload = {
"prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
"width": 1024, "height": 1024, "seed": 42
}
r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task
while True:
time.sleep(0.5)
status_r = requests.get(polling_url, headers={"x-key": API_KEY})
status_r.raise_for_status()
status = status_r.json()
if status == "Ready":
print("Result URL:", status)
break
elif status in ("Error", "Failed"):
print("Generation failed:", status)
break
Этот шаблон (отправка → опрос или веб-перехватчик) является основным синхронным/асинхронным потоком для управляемых конечных точек.
Редактирование изображений — минимальный пример (curl с входным URL)
curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
-H "accept: application/json" \
-H "x-key: $CometAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
"input_image": "https://example.com/my-photo.jpg",
"width": 2048,
"height": 1536
}'
Для редактирования нескольких ссылок используйте input_image, input_image_2, input_image_3, … (Pro поддерживает до 8 ссылок через API; Flex — до 10; Dev рекомендует максимум ~6 в зависимости от объема памяти).
Какие основные параметры мне следует отправить?
Важные поля тела запроса (редактирование/генерация изображений) включают в себя:
guidanceиsteps— позволяют осуществлять тонкую настройку.prompt(строка) — до 32 тыс. токенов; подробный естественный язык или структурированный JSON.input_image(строка) — требуется для редактирования (URL или base64).input_image_2...input_image_9— многореферентные изображения.width/height— кратно 16; выход максимум 4 Мп.seed— целое число для воспроизводимости.safety_tolerance— уровень модерации.
Как можно использовать FLUX.2 Pro для профессиональной генерации текста в изображение?
FLUX.2 Pro создан для получения надежных и высококачественных результатов. Используйте его, когда вам нужны стабильные результаты на уровне бренда, быстрое выполнение заказов и корпоративные соглашения об уровне обслуживания (SLA).
Рецепт рабочего процесса — производственные изображения
- Запросы предварительной обработки: Добавьте короткую строку «намерение» и раздел структурированных атрибутов (освещение, объектив, настроение, шестнадцатеричные коды цветов бренда). FLUX.2 поддерживает шестнадцатеричное управление цветом для сохранения палитр бренда.
- Начните с консервативных значений по умолчанию: шаги 30–50 и шкала указаний 6–9.0; увеличивайте шаги для детализации, увеличивайте указание, чтобы результаты более строго соответствовали подсказке.
- Использовать семена + детерминированную выборку для воспроизводимости при A/B-тестировании.
- Используйте конечную точку Pro для многоповторной выборки: запрашивайте N вариаций параллельно и выбирайте лучший — дешевле и быстрее, чем ручная настройка гиперпараметров.
- Постобработка: Шумоподавление, тональная компрессия или векторная коррекция в детерминированном конвейере. Если вам требуется вывод с более высоким разрешением, чем в исходном формате, рассмотрите вариант с небольшим GAN или проходом с суперразрешением.
Почему эти шаги помогают: Pro сочетает в себе скорость и точность и обычно применяет фильтры безопасности/контента после создания, поэтому это разумный вариант по умолчанию для активов, ориентированных на клиента.
Лучшие советы по созданию изображений
1. Структурированные подсказки приносят пользу производству. Организуйте подсказки по приоритету: тема → действие → стиль → контекст. Используйте подсказки JSON (сцена, темы, камера, освещение, цветовая палитра), когда вам нужна определённая композиция для нескольких изображений. Пример использования схемы JSON (псевдо):
{
"scene": "product shot",
"subjects": [
{"type":"mug","pose":"center","style":"ceramic, matte"},
{"type":"background","style":"wooden desk, window light"}
],
"camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}
2. Воспроизводимость: Проходить seed Для последующего воспроизведения. Сохраните подсказку по сопоставлению каталога + исходный материал → изображение для отслеживания.
3. Партия и оркестровка: Для больших производственных циклов отправляйте много запросов параллельно в Pro, но с ограничением скорости, чтобы избежать перегрузки; предпочтительнее конечная точка Pro для предсказуемой задержки. Используйте очереди заданий и рабочие пулы для быстрой загрузки подписанных результатов по мере их готовности.
4. Умеренность и безопасность: Используйте safety_tolerance для контроля строгости модерации. Конечные точки Pro включают политики использования и механизмы модерации контента; интегрируют проверки на стороне сервера перед публикацией.
5. Постобработка: Профессиональные материалы отличаются высоким качеством, но иногда требуют небольшой ретуши. Встройте автоматизированный этап постобработки (кадрирование, цветокоррекция, композитинг) в свой процесс и контролируйте контент, имеющий отношение к бренду, вручную.
Как настроить выходные данные с помощью конечной точки FLUX.2 Flex?
Flex — это вариант «хирургического инструмента»: настраивайте шаги, указания, отрицательные подсказки, размеры плиток и количество ссылок для точного формирования выходных данных.
Когда выбрать Flex
- Вам нужна точная типографская визуализация (макеты пользовательского интерфейса, этикетки).
- Вам необходимо скомпоновать несколько референсов, контролируя позу и освещение.
- Вы экспериментируете с передовыми методами подсказок (структурированные подсказки, цепочки ограничений).
Пример — клавиши Flex Control и их эффекты
steps— больше шагов = больше деталей (за счет задержки).guidance_scale— выше = ближе к текстовой подсказке, ниже = больше креативности.negative_prompt— явно удалить элементы (например, «без водяных знаков, без лишних пальцев»).tile_size/tiled_inference— для генерации очень высокого разрешения разбейте пространство вывода на плитки, чтобы пожертвовать памятью ради скорости.reference_weights— некоторые конечные точки позволяют вам взвешивать ссылки на предвзятость, которая определяет позу или стиль изображения.
Практический совет: Для сложных композиций выполните короткий предварительный просмотр с низким уровнем наведения, чтобы проверить композицию, а затем масштабируйте её с большим количеством шагов и более высоким уровнем наведения. Этот двухпроходный метод снижает затраты и обеспечивает точные конечные результаты.
Пример: гибкий запрос с шагами и инструкциями
curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
-H "Content-Type: application/json" \
-H "x-key: $BFL_API_KEY" \
-d '{
"prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
"width": 1536, "height": 2048,
"steps": 50,
"guidance": 7.5,
"seed": 99999
}'
Наконечник: Используйте Flex для финального творческого согласования, а Pro — для масштабных и быстрых процессов. Flex заметно более управляем для задач по типографике и микродетализации.
Лучшие практики использования в производстве
Ниже приведены проверенные на практике шаблоны и практические советы по масштабной интеграции FLUX.2.
1) Контролируйте стоимость, отслеживая мегапиксели и кэшируя
Тарификация FLUX.2 основана на мегапикселях вход + выход. Для генерации больших объёмов отдавайте предпочтение предварительным рендерам меньшего размера (быстрые шаги в низком разрешении) и переходите только к финальным рендерам с более высоким разрешением. Кэшируйте отрендеренные ресурсы (или сохраняйте различия), чтобы не перерисовывать идентичные задания. Всегда используйте поверхность. cost в ответах и регистрируйте его для каждого запроса.
2) Используйте уровни с умом: разделение на предварительный и финальный рендеринг
- Выполняйте быстрые профессиональные рендеры с низким шагом для создания прототипов или множества вариантов.
- Используйте режимы Flex или Pro с высоким разрешением для финальных результатов, где важна точность. Этот гибридный подход позволяет добиться баланса между производительностью и качеством конечного изображения.
3) Разработка подсказок → структурированные подсказки и JSON
Воспользуйтесь преимуществами FLUX.2 структурированные подсказки JSON Когда вам нужна детерминированная композиция (объекты сцены, камера, позы, шестнадцатеричные образцы цветов). Это сокращает количество итеративных циклов подсказок и способствует более воспроизводимым пакетам. Примеры Cloudflare демонстрируют подсказки JSON, встроенные в составные формы.
4) Начальный уровень + версионирование для воспроизводимости
Когда вам нужны воспроизводимые результаты, пройдите seed и регистрировать версию/временную метку модели в метаданных. Для детерминированных конвейеров активов сохраняйте манифест: подсказку, начальное значение, вариант модели, разрешение, хэши эталонных изображений. Это улучшает отслеживаемость и возможности отката.
Заключение
FLUX.2 призван сократить разрыв между «впечатляющей демоверсией» и «инструментом для создания креативных продуктов». Благодаря многореференсному редактированию, выходным данным высокого разрешения и набору размещённых конечных точек (плюс открытый код вывода и квантованные потребительские сборки) он предоставляет командам множество практических возможностей: запуск локально для исследований и настройки или использование размещённых конечных точек Pro/Flex для стабильных производственных конвейеров.
Разработчики могут получить доступ API разработки Flux.2, Flux.2 Flex API и API Flux.2 Pro через CometAPI. Для начала изучите возможности моделирования CometAPI в Детская Площадка и проконсультируйтесь с API-руководство для получения подробных инструкций. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. сetAPI предложить цену намного ниже официальной, чтобы помочь вам интегрироваться.
Готовы к работе?→ Зарегистрируйтесь в CometAPI сегодня !
Если вы хотите узнать больше советов, руководств и новостей об искусственном интеллекте, подпишитесь на нас VK, X и Discord!
