Gemini 2.5 Flash 图像 API (Nano-Banana)

CometAPI
AnnaAug 26, 2025
Gemini 2.5 Flash 图像 API (Nano-Banana)

Gemini 2.5 Flash Image(又称 “Nano banana”)是 Google 在 Gemini 2.5 家族中的最新原生图像生成 + 编辑模型。它专注于多图融合、精确的自然语言编辑以及快速的多模态工作流。

模型简介

它是什么 — Gemini 2.5 Flash Image 是一个构建于 Gemini 2.5 家族之上的多模态图像生成与编辑模型。它旨在生成写实图像,执行定向编辑(修复填充、风格迁移、对象替换),并融合多张源图像为一个连贯输出——同时利用 Gemini 改进的语言推理来控制构图与语义。

关键特性

  • 原生图像生成与编辑 — 通过自然语言提示生成图像或编辑现有照片。(生成 / 编辑)
  • 多图融合 — 将多张输入图像合成为一个写实场景。
  • 角色一致性 — 在不同编辑与提示中保持同一主体或角色的外观一致。(一致性)
  • SynthID 水印 — 所有输出都包含用于识别 AI 生成内容的不可见 SynthID(水印)

技术细节

  • 架构与定位: 基于 Gemini 2.5 Flash 家族构建——作为一种低时延“Flash”变体,在保持相较早期 Flash 层级更强推理能力的同时,以少量模型规模/吞吐换取更快的单次调用响应与成本效率。
  • 输入格式与限制: 支持用于小型输入的内联 base64 图像,以及通过 File API 的文件上传以处理更大的图像(推荐用于 >20 MB)。支持常见 MIME 类型(JPEG、PNG)。
  • 运行模式: 文生图、图像编辑(修复填充 / 语义掩膜)、风格迁移、多图合成,以及交错的文本+图像响应(适用于图文说明、菜谱或混合内容)。
  • 来源与安全机制: 对 AI 输出添加可见水印与隐藏的 SynthID 标记,并通过策略执行层限制明确禁止的内容。

基准表现

Gemini 2.5 Flash 图像 API (Nano-Banana)

限制与已知风险

  • 内容政策约束: 模型会执行内容政策(例如禁止露骨色情内容和某些非法内容),但执行并不完美——在某些场景下仍可能生成公众人物或具有争议性的图标,因此务必进行政策检查
  • 失败模式: 在极端编辑中可能出现身份漂移,当提示不够明确时偶有语义错配;在极其复杂的场景或极端视角变化下可能出现伪影。
  • 来源与滥用: 尽管存在水印与 SynthID,它们并不能防止滥用——只能协助检测与归因,在敏感工作流中并不能替代人工审核。

典型用例

  • 产品与电商: 通过多图融合将产品/目录图置入生活化场景
  • 创意工具/设计: 在设计应用中快速迭代(提及 Adobe Firefly 集成)。
  • 照片编辑与修饰: 基于自然语言的局部化编辑(移除对象、更改颜色/光照、重塑风格)。
  • 叙事/角色资产: 在多画面与场景中保持角色一致性

如何通过 CometAPI 调用 Gemini 2.5 Flash Image API

Gemini 2.5 Flash Image 在 CometAPI 上的 API 价格,较官方价优惠 20%:

价格$0.3120

必要步骤

  • 登录 cometapi.com。如果您尚未成为我们的用户,请先注册
  • 获取该接口的访问凭证 API key。在个人中心的 API token 处点击“Add Token”,获取令牌密钥:sk-xxxxx 并提交。
  • 获取本站的 url:https://api.cometapi.com/

使用方法

  1. 选择 “Gemini-2.5 Flash-Image” 端点发送 API 请求并设置请求体。请求方法与请求体可在我们网站的 API 文档获取;我们的网站也提供 Apifox 便捷测试。
  2. 将 <YOUR_API_KEY> 替换为您账号中的实际 CometAPI 密钥。
  3. 将你的问题或请求填入 content 字段——模型将对此进行响应。
  4. 处理 API 响应以获取生成的答案。

CometAPI 提供与之完全兼容的 REST API——实现无缝迁移。关键细节参见 API 文档

  • 端点: https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent
  • 模型参数: gemini-2.5-flash-image-preview / gemini-2.5-flash-image
  • 认证: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json

注意:调用 API 时,将参数 “stream” 设为 true。

curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "cat"
                },
                {
                    "inline_data": {
                        "mime_type": "image/jpeg",
						"data": "iVBORw0KGgoA Note: Base64 data here"
						}

            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "TEXT",
            "IMAGE"
        ]
    }
}'

另见 GPT-image-1 API

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣