API d'images Flash Gemini 2.5 (Nano-Banana)

CometAPI
AnnaSep 10, 2025
API d'images Flash Gemini 2.5 (Nano-Banana)

Gemini 2.5 Flash Image (aussi appelé « Nano Banana ») est le tout nouveau modèle de génération et d'édition d'images natives de Google, issu de la famille Gemini 2.5. Il se concentre sur la fusion multi-images, des modifications précises en langage naturel et des flux de travail multimodaux rapides.

Introduction au modèle

Qu'est-ce que c'est — Image Flash Gemini 2.5 est un modèle de génération et d'édition d'images multimodales basé sur la famille Gemini 2.5. Il est conçu pour produire images photoréalistes, effectuer modifications ciblées (retouches, transfert de style, échanges d'objets), et mélanger plusieurs images sources en une seule sortie cohérente — tout en appliquant le raisonnement linguistique amélioré de Gemini pour contrôler la composition et la sémantique.

Fonctionnalités

  • Génération et édition d'images natives — générer des images ou modifier des photos existantes via des invites en langage naturel. (Générer / Modifier).
  • Fusion multi-images — combiner plusieurs images d’entrée en une seule scène photoréaliste.
  • Cohérence des personnages — conserver la même apparence de sujet ou de personnage à travers les modifications et les invites. (Cohérence).
  • Filigrane SynthID — toutes les sorties incluent un SynthID invisible pour identifier le contenu généré par l'IA. (Filigrane).

Détails techniques

  • Architecture et positionnement : construit sur la famille Gemini 2.5 Flash — conçu comme un faible latence Variante « Flash » qui échange une petite taille de modèle/débit contre une réponse par appel beaucoup plus rapide et une efficacité des coûts tout en conservant un raisonnement plus solide que les niveaux Flash précédents.
  • Formats et limites d'entrée : accepte images base64 en ligne pour les petites entrées et téléchargements de fichiers via l'API Fichier pour les images plus grandes (recommandé pour les formats > 20 Mo). Prise en charge des types MIME courants (JPEG, PNG).
  • Modes de fonctionnement: texte en image, édition d'images (inpainting / masquage sémantique), transfert de style, composition multi-images et Entrelacé réponses texte+image (utiles pour les instructions illustrées, les recettes ou le contenu mixte).
  • Provenance et mécanismes de sécurité : filigranes visibles sur les sorties IA ainsi que des marqueurs SynthID cachés et des couches d'application des politiques pour limiter le contenu explicite non autorisé.

Performances de référence

API d'images Flash Gemini 2.5 (Nano-Banana)

Limites et risques connus

  • Contraintes de la politique de contenu : les modèles appliquent des politiques de contenu (par exemple, interdire le contenu sexuel explicite et certains contenus illicites), mais l'application n'est pas parfaite — générer des images de personnalités publiques ou d'icônes controversées peut encore être possible dans certains scénarios, donc les contrôles de politique sont essentiels. )
  • Modes de défaillance : possible dérive identitaire dans les montages extrêmes, les désalignements sémantiques occasionnels (lorsque les invites sont sous-spécifiées) et les artefacts dans les scènes très complexes ou les changements de point de vue extrêmes.
  • Provenance et abus : Bien que les filigranes et SynthID soient présents, ils n'empêchent pas les abus : ils aident à la détection et à l'attribution, mais ne remplacent pas l'examen humain dans les flux de travail sensibles.

Cas d'utilisation typiques

  • Produit et e-commerce : placer/cataloguer les produits dans des photos de style de vie via la fusion multi-images.
  • Outillage créatif / conception : itérations rapides dans les applications de conception (intégration d'Adobe Firefly citée).
  • Retouche et retouche photo : modifications localisées à partir du langage naturel (supprimer des objets, changer la couleur/l'éclairage, remodeler).
  • Atouts narratifs / personnages : garder les caractères cohérents à travers les panneaux et les scènes.

Comment appeler Image Flash Gemini 2.5 API de CometAPI

Gemini 2.5 Flash Image Tarification de l'API dans CometAPI, 20 % de réduction sur le prix officiel :

Prix$0.3120

Étapes requises

  • Se connecter à cometapi.comSi vous n'êtes pas encore notre utilisateur, veuillez d'abord vous inscrire
  • Obtenez la clé API d'accès à l'interface. Cliquez sur « Ajouter un jeton » au niveau du jeton API dans l'espace personnel, récupérez la clé : sk-xxxxx et validez.
  • Obtenez l'URL de ce site : https://api.cometapi.com/

Utiliser la méthode

  1. Sélectionnez l'option "Gemini-2.5 Flash-ImagePoint de terminaison pour envoyer la requête API et définir le corps de la requête. La méthode et le corps de la requête sont disponibles dans la documentation API de notre site web. Notre site web propose également le test Apifox pour plus de commodité.
  2. Remplacer avec votre clé CometAPI réelle de votre compte.
  3. Insérez votre question ou demande dans le champ de contenu : c'est à cela que le modèle répondra.
  4. Traitez la réponse de l'API pour obtenir la réponse générée.

CometAPI fournit une API REST entièrement compatible, pour une migration fluide. Informations clés  API doc:

  • Endpoint: https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent
  • Paramètre de modèle: aperçu de l'image flash gemini-2.5 / image flash gemini-2.5
  • Authentification: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json .

Remarque : lors de l’appel de l’API, définissez le paramètre « stream » : true.

curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "cat"
                },
                {
                    "inline_data": {
                        "mime_type": "image/jpeg",
						"data": "iVBORw0KGgoA Note: Base64 data here"
						}

            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "TEXT",
            "IMAGE"
        ]
    }
}'

Voir aussi API GPT-image-1

SHARE THIS BLOG

500+ Modèles en Une API

Jusqu'à 20% de réduction