Gemini 2.5 Flash Image (также известный как «Nano banana») — новейшая нативная модель Google для создания и редактирования изображений в семействе Gemini 2.5. Она ориентирована на слияние нескольких изображений, точное редактирование на естественном языке и быстрые мультимодальные рабочие процессы.
Введение в модель
Что это такое — Флэш-изображение Gemini 2.5 Это многомодальная модель создания и редактирования изображений, созданная на базе семейства Gemini 2.5. Она предназначена для создания фотореалистичные изображения, выполнить целевые правки (интайминг, перенос стиля, замена объектов) и смешать несколько исходных изображений в единый связный вывод — с применением усовершенствованного языкового обоснования Gemini для управления композицией и семантикой.
Ключевые характеристики
- Генерация и редактирование собственных изображений — создавайте изображения или редактируйте существующие фотографии с помощью подсказок на естественном языке. (Создать / Редактировать).
- Слияние нескольких изображений — объединить несколько входных изображений в одну фотореалистичную сцену.
- Постоянство характера — сохраняйте один и тот же внешний вид темы или персонажа во всех редактировании и подсказках. (Последовательность).
- Водяные знаки SynthID — все выходы включают в себя невидимый SynthID для идентификации контента, созданного ИИ. (Водяной знак).
Технические детали
- Архитектура и позиционирование: построен на базе семейства Gemini 2.5 Flash — разработан как с низкой задержкой Вариант «Flash», в котором размер модели/пропускная способность немного жертвуются ради гораздо более быстрого ответа на вызов и экономической эффективности, при этом сохраняется более эффективная логика, чем в более ранних уровнях Flash.
- Форматы ввода и ограничения: принимает встроенные изображения base64 для небольших входов и загрузка файлов Через File API для больших изображений (рекомендуется для изображений размером более 20 МБ). Поддерживает распространённые типы MIME (JPEG, PNG).
- Режимы работы: преобразование текста в изображение, редактирование изображений (интайминг/семантическое маскирование), перенос стиля, композиция из нескольких изображений и чередование ответы в формате «текст+изображение» (полезно для иллюстрированных инструкций, рецептов или смешанного контента).
- Механизмы происхождения и безопасности: видимые водяные знаки на выходных данных ИИ, а также скрытые маркеры SynthID и уровни применения политик для ограничения явного запрещенного контента.
Контрольная производительность

Ограничения и известные риски
- Ограничения политики контента: модели обеспечивают соблюдение политик в отношении контента (например, запрещают откровенный сексуальный контент и некоторые незаконные материалы), но их соблюдение не является идеальным — в некоторых сценариях все еще возможно создание изображений публичных личностей или противоречивых символов, поэтому проверки политики необходимы, )
- Режимы отказа: возможное дрейф идентичности при резких изменениях, эпизодическом семантическом несоответствии (когда подсказки недостаточно конкретизированы) и артефактах в очень сложных сценах или резких изменениях точки обзора.
- Происхождение и неправильное использование: Несмотря на наличие водяных знаков и SynthID, они не предотвращают неправомерное использование — они способствуют обнаружению и установлению авторства, но не заменяют человеческую проверку в конфиденциальных рабочих процессах.
Типичные варианты использования
- Продукт и электронная коммерция: разместить/каталогизировать продукты в образах жизни посредством слияния нескольких изображений.
- Творческие инструменты/дизайн: быстрые итерации в дизайнерских приложениях (упоминается интеграция с Adobe Firefly).
- Редактирование и ретушь фотографий: локализованные правки с естественного языка (удалить объекты, изменить цвет/освещение, изменить стиль).
- Повествование / активы персонажей: сохранять последовательность персонажей по панелям и сценам.
Как позвонить Флэш-изображение Gemini 2.5 API от CometAPI
Gemini 2.5 Flash Image Цены на API в CometAPI, скидка 20% от официальной цены:
| Цена | $0.3120 |
Необходимые шаги
- Войти в cometapi.com. Если вы еще не являетесь нашим пользователем, пожалуйста, сначала зарегистрируйтесь.
- Получите ключ API-интерфейса для доступа к учетным данным. Нажмите «Добавить токен» в API-токене в персональном центре, получите ключ токена: sk-xxxxx и отправьте.
- Получите URL этого сайта: https://api.cometapi.com/
Используйте метод
- Выберите "
Gemini-2.5 Flash-Image” конечная точка для отправки запроса API и установки тела запроса. Метод запроса и тело запроса получены из нашего веб-сайта API doc. Наш веб-сайт также предоставляет тест Apifox для вашего удобства. - Заменять с вашим реальным ключом CometAPI из вашей учетной записи.
- Введите свой вопрос или запрос в поле «Контент» — на него ответит модель.
- . Обработайте ответ API, чтобы получить сгенерированный ответ.
CometAPI предоставляет полностью совместимый REST API для беспроблемной миграции. Ключевые детали API документ:
- Конечная точка:
https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent - Параметр модели: gemini-2.5-flash-image-preview / gemini-2.5-flash-image
- Аутентификация:
Bearer YOUR_CometAPI_API_KEY - Тип содержимого:
application/json.
Примечание: при вызове API установите параметр «stream»: true.
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "cat"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
См. также API GPT-image-1



