API Flash-изображений Gemini 2.5 (Nano-Banana)

CometAPI
AnnaSep 10, 2025
API Flash-изображений Gemini 2.5 (Nano-Banana)

Gemini 2.5 Flash Image (также известный как «Nano banana») — новейшая нативная модель Google для создания и редактирования изображений в семействе Gemini 2.5. Она ориентирована на слияние нескольких изображений, точное редактирование на естественном языке и быстрые мультимодальные рабочие процессы.

Введение в модель

Что это такое — Флэш-изображение Gemini 2.5 Это многомодальная модель создания и редактирования изображений, созданная на базе семейства Gemini 2.5. Она предназначена для создания фотореалистичные изображения, выполнить целевые правки (интайминг, перенос стиля, замена объектов) и смешать несколько исходных изображений в единый связный вывод — с применением усовершенствованного языкового обоснования Gemini для управления композицией и семантикой.

Ключевые характеристики

  • Генерация и редактирование собственных изображений — создавайте изображения или редактируйте существующие фотографии с помощью подсказок на естественном языке. (Создать / Редактировать).
  • Слияние нескольких изображений — объединить несколько входных изображений в одну фотореалистичную сцену.
  • Постоянство характера — сохраняйте один и тот же внешний вид темы или персонажа во всех редактировании и подсказках. (Последовательность).
  • Водяные знаки SynthID — все выходы включают в себя невидимый SynthID для идентификации контента, созданного ИИ. (Водяной знак).

Технические детали

  • Архитектура и позиционирование: построен на базе семейства Gemini 2.5 Flash — разработан как с низкой задержкой Вариант «Flash», в котором размер модели/пропускная способность немного жертвуются ради гораздо более быстрого ответа на вызов и экономической эффективности, при этом сохраняется более эффективная логика, чем в более ранних уровнях Flash.
  • Форматы ввода и ограничения: принимает встроенные изображения base64 для небольших входов и загрузка файлов Через File API для больших изображений (рекомендуется для изображений размером более 20 МБ). Поддерживает распространённые типы MIME (JPEG, PNG).
  • Режимы работы: преобразование текста в изображение, редактирование изображений (интайминг/семантическое маскирование), перенос стиля, композиция из нескольких изображений и чередование ответы в формате «текст+изображение» (полезно для иллюстрированных инструкций, рецептов или смешанного контента).
  • Механизмы происхождения и безопасности: видимые водяные знаки на выходных данных ИИ, а также скрытые маркеры SynthID и уровни применения политик для ограничения явного запрещенного контента.

Контрольная производительность

API Flash-изображений Gemini 2.5 (Nano-Banana)

Ограничения и известные риски

  • Ограничения политики контента: модели обеспечивают соблюдение политик в отношении контента (например, запрещают откровенный сексуальный контент и некоторые незаконные материалы), но их соблюдение не является идеальным — в некоторых сценариях все еще возможно создание изображений публичных личностей или противоречивых символов, поэтому проверки политики необходимы, )
  • Режимы отказа: возможное дрейф идентичности при резких изменениях, эпизодическом семантическом несоответствии (когда подсказки недостаточно конкретизированы) и артефактах в очень сложных сценах или резких изменениях точки обзора.
  • Происхождение и неправильное использование: Несмотря на наличие водяных знаков и SynthID, они не предотвращают неправомерное использование — они способствуют обнаружению и установлению авторства, но не заменяют человеческую проверку в конфиденциальных рабочих процессах.

Типичные варианты использования

  • Продукт и электронная коммерция: разместить/каталогизировать продукты в образах жизни посредством слияния нескольких изображений.
  • Творческие инструменты/дизайн: быстрые итерации в дизайнерских приложениях (упоминается интеграция с Adobe Firefly).
  • Редактирование и ретушь фотографий: локализованные правки с естественного языка (удалить объекты, изменить цвет/освещение, изменить стиль).
  • Повествование / активы персонажей: сохранять последовательность персонажей по панелям и сценам.

Как позвонить Флэш-изображение Gemini 2.5 API от CometAPI

Gemini 2.5 Flash Image Цены на API в CometAPI, скидка 20% от официальной цены:

Цена$0.3120

Необходимые шаги

  • Войти в cometapi.com. Если вы еще не являетесь нашим пользователем, пожалуйста, сначала зарегистрируйтесь.
  • Получите ключ API-интерфейса для доступа к учетным данным. Нажмите «Добавить токен» в API-токене в персональном центре, получите ключ токена: sk-xxxxx и отправьте.
  • Получите URL этого сайта: https://api.cometapi.com/

Используйте метод

  1. Выберите "Gemini-2.5 Flash-Image” конечная точка для отправки запроса API и установки тела запроса. Метод запроса и тело запроса получены из нашего веб-сайта API doc. Наш веб-сайт также предоставляет тест Apifox для вашего удобства.
  2. Заменять с вашим реальным ключом CometAPI из вашей учетной записи.
  3. Введите свой вопрос или запрос в поле «Контент» — на него ответит модель.
  4. . Обработайте ответ API, чтобы получить сгенерированный ответ.

CometAPI предоставляет полностью совместимый REST API для беспроблемной миграции. Ключевые детали  API документ:

  • Конечная точка: https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent
  • Параметр модели: gemini-2.5-flash-image-preview / gemini-2.5-flash-image
  • Аутентификация: Bearer YOUR_CometAPI_API_KEY
  • Тип содержимого: application/json .

Примечание: при вызове API установите параметр «stream»: true.

curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "cat"
                },
                {
                    "inline_data": {
                        "mime_type": "image/jpeg",
						"data": "iVBORw0KGgoA Note: Base64 data here"
						}

            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "TEXT",
            "IMAGE"
        ]
    }
}'

См. также API GPT-image-1

SHARE THIS BLOG

Читать далее

500+ моделей в одном API

Скидка до 20%