ModèlesTarificationEntreprise
500+ API de modèles IA, toutes en une seule API. Simplement avec CometAPI
API des modèles
Développeur
Démarrage rapideDocumentationTableau de bord API
Entreprise
À proposEntreprise
Ressources
Modèles d'IABlogJournal des modificationsSupport
Conditions d'utilisationPolitique de confidentialité
© 2026 CometAPI · All rights reserved
Home/Models/Google/Nano Banana 2
G

Nano Banana 2

Entrée:$0.4/M
Sortie:$2.4/M
Aperçu des capacités principales: Résolution: Jusqu'à 4K (4096×4096), comparable à Pro. Cohérence des images de référence: Jusqu'à 14 images de référence (10 objets + 4 personnages), en maintenant la cohérence du style et des personnages. Rapports d'aspect extrêmes: Nouveaux rapports 1:4, 4:1, 1:8, 8:1 ajoutés, adaptés aux images longues, aux affiches et aux bannières. Rendu de texte: Génération de texte avancée, adaptée aux infographies et aux mises en page d'affiches marketing. Amélioration de la recherche: Google Search + Image Search intégrés. Ancrage: Processus de réflexion intégré; les prompts complexes font l'objet d'un raisonnement avant la génération.
Nouveau
Usage commercial
Playground
Aperçu
Fonctionnalités
Tarification
API
Versions

Spécifications techniques de Gemini 3.1 Flash Image Preview

ÉlémentGemini 3.1 Flash Image Preview
FournisseurGoogle
Famille de modèlesGemini 3.1 (palier Flash)
Objectif principalGénération multimodale rapide avec aperçu d’image
Types d’entréeTexte, Image
Types de sortieTexte, Image (génération d’aperçu)
Fenêtre de contexteJusqu’à 1M tokens (standard du palier Flash Gemini 3.x)
Palier de latenceFaible latence, haut débit
Prise en charge du streamingOui
Appel d’outilsOui (framework d’outils de l’API Gemini)
Version3.1

Qu’est-ce que Nano Banana 2

Nano Banana 2 est le surnom populaire utilisé par la presse et la communauté des développeurs pour le nouveau modèle Gemini-3.1-Flash-Image. Google le positionne comme le moteur d’images du palier “Flash” qui apporte une fidélité visuelle quasi professionnelle à un palier de latence et de coût bien inférieur — adapté à la génération à grand volume, aux éditions itératives rapides et aux workflows produits intégrés à travers les services Google. Il hérite du raisonnement multimodal de Gemini 3.1 et ajoute des capacités centrées sur l’image (texte lisible dans les images, composition multi-images, prise en charge de rapports d’aspect étendus, 4K native).

Fonctionnalités principales

  • Génération multi‑résolution à grande vitesse : vitesse de palier Flash avec options de sorties 0.5K / 1K / 2K / 4K et nouveaux rapports d’aspect extrêmes (1:4, 4:1, 1:8, 8:1).
  • Ancrage au Web en temps réel : intègre les résultats de recherche textuels et d’images pour ancrer le contenu généré dans des informations Web actuelles lorsque “Thinking” ou l’ancrage via la recherche est activé. Utile pour des références à jour et des infographies factuelles.
  • Rendu de texte amélioré : meilleur rendu des textes courts et graphiques (polices, tailles) que les modèles Flash précédents ; reste imparfait sur les longs paragraphes/texte de petite taille.
  • Édition multi‑entrées et workflows multi‑tours : prise en charge avancée de la combinaison de plusieurs images en entrée et d’éditions itératives sur plusieurs tours.

📊 Performances de référence — Génération & édition d’images (scores Elo)

CapacitéGemini 3.1 Flash Image (Nano Banana 2)Gemini 2.5 Flash Image (Nano Banana)Gemini 3 Pro Image (Nano Banana Pro)GPT-Image 1.5Seedream 5.0 LiteGrok Imagine Image Pro
Texte vers image — Préférence globale1079.0 ± 7.01073.0 ± 5.0942.0 ± 6.01021.0 ± 5.01047.0 ± 5.0928.0 ± 8.0
Texte vers image — Qualité visuelle1140.0 ± 6.01129.0 ± 6.0929.0 ± 6.01043.0 ± 5.0975.0 ± 5.0759.0 ± 10.0
Texte vers image — Infographies (factualité)1114.0 ± 14.01074.0 ± 12.0881.0 ± 13.01102.0 ± 13.0985.0 ± 12.0890.0 ± 22.0
Édition — Générale1065.0 ± 9.01047.0 ± 9.0913.0 ± 9.01051.0 ± 10.0995.0 ± 8.0937.0 ± 9.0
Édition — Personnage1056.0 ± 7.01049.0 ± 7.0952.0 ± 7.01050.0 ± 8.01025.0 ± 7.0894.0 ± 8.0
Édition — Créative1023.0 ± 7.01031.0 ± 7.0976.0 ± 7.01004.0 ± 7.01017.0 ± 7.0938.0 ± 7.0
Édition — Objet/Environnement1029.0 ± 8.01018.0 ± 8.0945.0 ± 8.01042.0 ± 10.0976.0 ± 8.0946.0 ± 9.0
Édition — Multi‑entrées1037.0 ± 8.01016.0 ± 8.0919.0 ± 9.01056.0 ± 12.01014.0 ± 9.0N/A
Édition — Stylisation1045.0 ± 7.01031.0 ± 7.0862.0 ± 8.01045.0 ± 9.0996.0 ± 7.0984.0 ± 7.0

Points clés de ce tableau de référence :

  • Dans les catégories de génération texte‑vers‑image et d’édition d’images, Gemini 3.1 Flash Image devance systématiquement ou égale les meilleurs scores parmi les modèles du palier Flash et de nombreux modèles d’images concurrents.
  • Le modèle montre des résultats particulièrement solides dans les tests de Qualité visuelle et d’Infographies (factualité) — indiquant qu’il excelle non seulement en qualité esthétique mais aussi dans le rendu d’un contenu structurellement exact.
  • Sur l’édition Multi‑entrées, Nano Banana 2 montre également une généralisation robuste, avec des scores supérieurs à sa génération Flash précédente.

Ces évaluations sont menées via des comparaisons Elo côte à côte par des évaluateurs humains sur une suite de benchmarks diversifiée, reflétant à la fois la préférence et la fidélité sur des tâches courantes de génération/édition d’images.

Nano Banana 2 vs Nano Banana vs Nano Banana Pro

ModèlePositionnementIndicateurs représentatifs/notes
Gemini 3.1 Flash Image (Nano Banana 2)Palier Flash : vitesse + haute qualité visuelle (2K–4K)Préférence globale 1079.0 ± 7.0 ; qualité visuelle 1140 ± 6.0 (GenAI-Bench interne).
Gemini 2.5 Flash Image (Nano Banana)Première version Flash (fidélité inférieure)Légèrement inférieure en préférence/qualité visuelle par rapport à 3.1.
Gemini 3 Pro Image (Nano Banana Pro)Palier Pro : fidélité perçue supérieure pour des tâches complexes, coût/latence plus élevésCompromis différents ; certains indicateurs montrent des classements relatifs différents sur des tâches spécialisées.
GPT-Image 1.5 / autres modèles commerciauxConcurrents (ouverts/fermés)Dans les benchmarks internes de Google, GPT-Image et d’autres ont obtenu des scores inférieurs à Gemini 3.1 en qualité visuelle et préférence globale dans l’évaluation rapportée. Des comparaisons tierces indépendantes varient.

Quand choisir Flash Image Preview :

  • Aperçu d’image en temps réel dans les applications
  • Génération d’images à grande échelle sensible aux coûts
  • Assistants de conception interactifs

Comment accéder à Nano Banana 2 et l’intégrer

Étape 1 : S’inscrire pour obtenir une clé API

Connectez‑vous à cometapi.com. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous inscrire. Connectez‑vous à votre CometAPI console. Obtenez la clé API d’accès de l’interface. Cliquez sur “Add Token” au niveau du jeton API dans le centre personnel, obtenez la clé de jeton : sk-xxxxx et validez.

Étape 2 : Envoyer des requêtes à l’API Nano Banana 2

Sélectionnez le point de terminaison “gemini-3.1-flash-image-preview8” pour envoyer la requête API et définir le corps de la requête. La méthode et le corps de la requête sont obtenus à partir de la documentation API de notre site. Notre site propose également des tests Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par votre clé CometAPI réelle de votre compte. Où l’appeler :Gemini generates image

Nano Banana 2 prend en charge l’édition d’images, la génération d’images et les workflows multi‑images. Pour l’édition d’images, vous devez fournir l’URL de l’image. Pour plus de paramètres, veuillez vous référer à la documentation.

Étape 3 : Récupérer et vérifier les résultats

Traitez la réponse de l’API pour obtenir le résultat généré. Après traitement, l’API renvoie l’état de la tâche et les données de sortie. Vous pouvez télécharger directement l’image sur votre machine locale dans le playground (généralement au format PNG). Une URL d’image est générée lors du processus API ; veuillez la télécharger rapidement.

FAQ

What exactly is Nano Banana 2 and what does it do?

Nano Banana 2 is Google’s latest AI image generation and editing model, built on Gemini Flash image technology to deliver fast, high-quality visual generation and precise instruction following across text and image inputs.

How does Nano Banana 2 relate to Gemini 3.1 Flash Image?

Nano Banana 2 is essentially the consumer-facing branding for Google’s Gemini 3.1 Flash Image model, combining advanced capabilities from previous Nano Banana versions with the speed of Flash models.

What improvements does Nano Banana 2 add over earlier Nano Banana models?

Nano Banana 2 brings faster generation speed, sharper detail, better instruction fidelity, enhanced text rendering⁠/localized translation, and broader creative control while making many Pro-grade features available at base tier.

What kinds of images and resolutions can Nano Banana 2 generate?

The model supports flexible output with various aspect ratios and resolutions up to 4K, suitable for social media, ads, displays, and professional content.

Can Nano Banana 2 maintain consistency in complex compositions?

Yes — it preserves consistency across multiple subjects and objects (e.g., up to five characters and 14 objects in a single prompt workflow), helping with narrative scenes and storyboard-style tasks.

What image generation use cases is Gemini 3.1 Flash Image best suited for?

It’s well-suited for professional-grade image creation and editing, infographics, multi-image consistency, text rendering, and localized multilingual outputs, especially when workflows need precise control and repeated iterations.

Does Nano Banana 2 use real-time information or world knowledge?

Nano Banana 2 incorporates real-world knowledge and image search integration to help generate more accurate subjects, infographics, and location-aware visuals.

Can Gemini 3.1 Flash Image generate detailed text within images or diagrams?

Yes — it can generate and render clear text within images, but extremely small or dense multi-paragraph text sometimes remains challenging.

Tarification pour Nano Banana 2

Découvrez des tarifs compétitifs pour Nano Banana 2, conçus pour s'adapter à différents budgets et besoins d'utilisation. Nos formules flexibles garantissent que vous ne payez que ce que vous utilisez, ce qui facilite l'adaptation à mesure que vos besoins évoluent. Découvrez comment Nano Banana 2 peut améliorer vos projets tout en maîtrisant les coûts.

nano-banana-2(image)

variant / aliasPrice
gemini-3.1-flash-image (0.5K)≈ $0.03600
gemini-3.1-flash-image (1K)≈ $0.05360
gemini-3.1-flash-image (2K)≈ $0.08080
gemini-3.1-flash-image (4K)≈ $0.12080
gemini-3.1-flash-image-preview (0.5K)≈ $0.03600
gemini-3.1-flash-image-preview (1K)≈ $0.05360
gemini-3.1-flash-image-preview (2K)≈ $0.08080
gemini-3.1-flash-image-preview (4K)≈ $0.12080

Exemple de code et API pour Nano Banana 2

Accédez à des exemples de code complets et aux ressources API pour Nano Banana 2 afin de simplifier votre processus d'intégration. Notre documentation détaillée fournit des instructions étape par étape pour vous aider à exploiter tout le potentiel de Nano Banana 2 dans vos projets.
POST
/v1beta/models/{model}:generateContent
Python
JavaScript
Curl
from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

Python Code Example

from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

JavaScript Code Example

import fs from "fs";
import path from "path";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-3.1-flash-image-preview";

const prompt =
  "A woman leaning on a wooden railing of a traditional Chinese building. " +
  "She is wearing a blue cheongsam with pink and red floral motifs and a headdress " +
  "made of colorful flowers, including roses and lilacs. Realistic painting style, " +
  "focusing on the textural details of the clothing patterns and wooden buildings.";

const response = await fetch(`${base_url}/models/${model}:generateContent`, {
  method: "POST",
  headers: {
    "Content-Type": "application/json",
    Authorization: api_key,
  },
  body: JSON.stringify({
    contents: [
      {
        role: "user",
        parts: [{ text: prompt }],
      },
    ],
    generationConfig: {
      responseModalities: ["IMAGE"],
      imageConfig: {
        aspectRatio: "9:16",
      },
    },
  }),
});

const data = await response.json();

const outputDir = "./output";
if (!fs.existsSync(outputDir)) {
  fs.mkdirSync(outputDir, { recursive: true });
}

for (const candidate of data.candidates) {
  for (const part of candidate.content.parts) {
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageBuffer = Buffer.from(part.inlineData.data, "base64");
      const outputPath = path.join(outputDir, "gemini-3.1-flash-image-preview.png");
      fs.writeFileSync(outputPath, imageBuffer);
      console.log(`Image saved to ${outputPath}`);
    }
  }
}

Curl Code Example

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

mkdir -p ./output

curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "9:16"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
    if 'text' in part:
        print(part['text'])
    elif 'inlineData' in part:
        img = base64.b64decode(part['inlineData']['data'])
        with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
            f.write(img)
        print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"

Versions de Nano Banana 2

La raison pour laquelle Nano Banana 2 dispose de plusieurs instantanés peut inclure des facteurs potentiels tels que des variations de sortie après des mises à jour nécessitant des instantanés plus anciens pour la cohérence, offrant aux développeurs une période de transition pour l'adaptation et la migration, et différents instantanés correspondant à des points de terminaison globaux ou régionaux pour optimiser l'expérience utilisateur. Pour les différences détaillées entre les versions, veuillez consulter la documentation officielle.
ID du modèledescriptionDisponibilitéRequête
gemini-3.1-flash-imageRecommandé, pointant vers le dernier modèle✅Gemini génère une image
gemini-3.1-flash-image-previewAperçu officiel✅Gemini génère une image