Gemini 2.5 フラッシュイメージ API (Nano-Banana)

CometAPI
AnnaAug 26, 2025
Gemini 2.5 フラッシュイメージ API (Nano-Banana)

Gemini 2.5 Flash Image(別名「Nano banana」)は、GoogleのGemini 2.5ファミリーにおける最新のネイティブ画像生成・編集モデルです。複数画像の融合、正確な自然言語編集、そして高速なマルチモーダルワークフローに重点を置いています。

モデルの紹介

それは何なのか— ジェミニ2.5のフラッシュイメージ Gemini 2.5ファミリーをベースに構築されたマルチモーダル画像生成・編集モデルです。 写実的な画像、実行する ターゲット編集 (インペインティング、スタイル転送、オブジェクトのスワップ)、そして 複数のソース画像をブレンドする 単一の一貫した出力に変換します。同時に、Gemini の改良された言語推論を適用して、構成とセマンティクスを制御します。

主な特徴

  • ネイティブ画像生成と編集 — 自然言語プロンプトを使用して画像を生成したり、既存の写真を編集したりできます。 (生成/編集).
  • 複数画像の融合 — 複数の入力画像を 1 つのフォトリアリスティックなシーンに結合します。
  • キャラクターの一貫性 — 編集やプロンプト全体で同じ主題またはキャラクターの外観を維持します。 (一貫性).
  • SynthID透かし — すべての出力には 目に見えないSynthID AI によって生成されたコンテンツを識別します。 (透かし).

技術的な詳細

  • アーキテクチャと配置: Gemini 2.5 Flashファミリーをベースに構築された、 低遅延 「Flash」バリアントは、モデルのサイズとスループットを少し犠牲にして、呼び出しごとの応答とコスト効率を大幅に向上させながら、以前の Flash 層よりも強力な推論機能を維持します。
  • 入力形式と制限: 受け入れる インライン base64 画像 小さな入力と ファイルのアップロード 大きな画像(20MB以上推奨)の場合は、File API経由でアップロードしてください。一般的なMIMEタイプ(JPEG、PNG)をサポートしています。
  • 動作モード: テキストから画像への変換、画像編集(インペインティング/セマンティックマスキング)、スタイル転送、複数画像合成、 インターリーブ テキスト + 画像の応答 (図解された説明、レシピ、または混合コンテンツに役立ちます)。
  • 由来と安全メカニズム: AI 出力上の目に見える透かし、さらに非表示の SynthID マーカーと、明示的に許可されていないコンテンツを制限するためのポリシー適用レイヤー。

ベンチマークパフォーマンス

Gemini 2.5 フラッシュイメージ API (Nano-Banana)

制限事項と既知のリスク

  • コンテンツ ポリシーの制約: モデルはコンテンツポリシー(例えば、露骨な性的なコンテンツや違法なコンテンツの禁止)を強制するが、強制は完璧ではない。著名人や物議を醸すアイコンの画像を生成することは、いくつかのシナリオでは依然として可能であるため、 ポリシーチェックは不可欠。 )
  • 故障モード: 可能 アイデンティティの漂流 極端な編集、時折の意味の不整合(プロンプトが十分に指定されていない場合)、非常に複雑なシーンや極端な視点の変更におけるアーティファクトなど。
  • 由来と誤用: 透かしと SynthID は存在しますが、これらは不正使用を防ぐものではありません。検出と帰属の特定には役立ちますが、機密性の高いワークフローにおける人間によるレビューの代わりにはなりません。

典型的な使用例

  • 製品とeコマース: ライフスタイルショットに商品を配置/カタログ化する 複数画像の融合により。
  • クリエイティブツール/デザイン: 高速反復 デザイン アプリ (Adobe Firefly との統合を参照)。
  • 写真編集とレタッチ: 自然言語からのローカライズされた編集 (オブジェクトの削除、色/照明の変更、スタイルの変更)。
  • ストーリーテリング / キャラクターアセット: 文字の一貫性を保つ パネルやシーンを越えて。

電話方法 ジェミニ2.5のフラッシュイメージ CometAPI からの API

Gemini 2.5 Flash Image CometAPI の API 価格、公式価格より 20% オフ:

価格$0.3120

必要な手順

  • ログインする コムタピまだユーザーでない場合は、まず登録してください
  • インターフェースのアクセス認証情報APIキーを取得します。パーソナルセンターのAPIトークンで「トークンを追加」をクリックし、トークンキー(sk-xxxxx)を取得して送信します。
  • このサイトの URL を取得します: https://api.cometapi.com/

使用方法

  1. "を選択します。Gemini-2.5 Flash-Image” エンドポイントを使用してAPIリクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは、弊社ウェブサイトのAPIドキュメントから取得できます。また、お客様の便宜を図るため、弊社ウェブサイトではApifoxテストも提供しています。
  2. 交換するアカウントの実際の CometAPI キーを使用します。
  3. コンテンツ フィールドに質問またはリクエストを入力します。モデルはこれに応答します。
  4. API 応答を処理して、生成された回答を取得します。

CometAPIは、シームレスな移行のために完全に互換性のあるREST APIを提供します。  APIドキュメント:

  • 終点: https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent
  • モデルパラメータ: gemini-2.5-flash-image-preview / gemini-2.5-flash-image
  • 認証: Bearer YOUR_CometAPI_API_KEY
  • コンテンツタイプ: application/json .

注: API を呼び出すときは、パラメータ「stream」を true に設定してください。

curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "cat"
                },
                {
                    "inline_data": {
                        "mime_type": "image/jpeg",
						"data": "iVBORw0KGgoA Note: Base64 data here"
						}

            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "TEXT",
            "IMAGE"
        ]
    }
}'

も参照してください GPT-image-1 API

もっと読む

1つのAPIで500以上のモデル

最大20%オフ