What exactly is Nano Banana 2 and what does it do?

Nano Banana 2 es el modelo más reciente de Google para generación y edición de imágenes con IA, basado en la tecnología de imágenes Gemini Flash para ofrecer generación visual rápida y de alta calidad, y un cumplimiento preciso de instrucciones en entradas de texto e imagen.

How does Nano Banana 2 relate to Gemini 3.1 Flash Image?

Nano Banana 2 es, esencialmente, la marca orientada al consumidor del modelo Gemini 3.1 Flash Image de Google, que combina capacidades avanzadas de versiones anteriores de Nano Banana con la velocidad de los modelos Flash.

What improvements does Nano Banana 2 add over earlier Nano Banana models?

Nano Banana 2 aporta mayor velocidad de generación, detalles más nítidos, mejor fidelidad a las instrucciones, renderizado de texto mejorado/traducción localizada y un control creativo más amplio, al tiempo que pone muchas funciones de nivel Pro a disposición del nivel base.

What kinds of images and resolutions can Nano Banana 2 generate?

El modelo admite salidas flexibles con diversas relaciones de aspecto y resoluciones de hasta 4K, adecuadas para redes sociales, anuncios, pantallas y contenido profesional.

Can Nano Banana 2 maintain consistency in complex compositions?

Sí — conserva la consistencia entre múltiples sujetos y objetos (p. ej., hasta cinco personajes y 14 objetos en un flujo de trabajo con una sola instrucción), lo que ayuda en escenas narrativas y tareas de tipo storyboard.

What image generation use cases is Gemini 3.1 Flash Image best suited for?

Es idóneo para la creación y edición de imágenes de nivel profesional, infografías, consistencia entre múltiples imágenes, renderizado de texto y resultados multilingües localizados, especialmente cuando los flujos de trabajo requieren control preciso e iteraciones repetidas.

Does Nano Banana 2 use real-time information or world knowledge?

Nano Banana 2 incorpora conocimiento del mundo real e integración con búsqueda de imágenes para ayudar a generar sujetos más precisos, infografías y elementos visuales con reconocimiento de ubicación.

Can Gemini 3.1 Flash Image generate detailed text within images or diagrams?

Sí — puede generar y renderizar texto claro dentro de las imágenes, pero el texto extremadamente pequeño o denso en varios párrafos a veces sigue siendo un desafío.

API de Nano Banana 2 Asequible | text-to-image

Especificaciones técnicas de Gemini 3.1 Flash Image Preview

Elemento	Gemini 3.1 Flash Image Preview
Proveedor	Google
Familia de modelos	Gemini 3.1 (nivel Flash)
Enfoque principal	Generación multimodal rápida con vista previa de imágenes
Tipos de entrada	Texto, Imagen
Tipos de salida	Texto, Imagen (generación de vista previa)
Ventana de contexto	Hasta 1M tokens (estándar del nivel Flash de Gemini 3.x)
Nivel de latencia	Baja latencia, alto rendimiento
Compatibilidad con streaming	Sí
Invocación de herramientas	Sí (framework de herramientas de la API de Gemini)
Versión	3.1

Qué es Nano Banana 2

Nano Banana 2 es el apodo popular utilizado por la prensa y la comunidad de desarrolladores para el modelo recién lanzado Gemini-3.1-Flash-Image. Google lo posiciona como el motor de imágenes de nivel “Flash” que aporta una fidelidad visual casi Pro a un nivel de latencia y costo mucho más bajo, adecuado para generación de alto volumen, edición iterativa rápida y flujos de trabajo de producto integrados en los servicios de Google. Hereda el razonamiento multimodal de Gemini 3.1 y añade capacidades centradas en imágenes (texto legible en imágenes, composición multiimagen, compatibilidad con relaciones de aspecto amplias, 4K nativo).

Características principales

Generación de alta velocidad y multirresolución: velocidad de nivel Flash con opciones de salidas 0.5K / 1K / 2K / 4K y nuevas relaciones de aspecto extremas (1:4, 4:1, 1:8, 8:1).
Anclaje en la web en tiempo real: integra resultados de búsqueda de texto e imagen para fundamentar el contenido generado en información web actual cuando “Thinking” o el anclaje de búsqueda están habilitados. Útil para referencias actualizadas e infografías basadas en hechos.
Renderizado de texto mejorado: mejor renderizado de texto corto y gráfico (tipografías, tamaños) que en modelos Flash anteriores; aún imperfecto en párrafos largos/texto pequeño.
Edición con múltiples entradas y flujos de trabajo multiturno: sólida compatibilidad para combinar varias imágenes como entradas y para ediciones iterativas a lo largo de varias interacciones.

📊 Rendimiento en benchmarks — Generación y edición de imágenes (puntuaciones Elo)

Capacidad	Gemini 3.1 Flash Image (Nano Banana 2)	Gemini 2.5 Flash Image (Nano Banana)	Gemini 3 Pro Image (Nano Banana Pro)	GPT-Image 1.5	Seedream 5.0 Lite	Grok Imagine Image Pro
Texto a imagen — Preferencia general	1079.0 ± 7.0	1073.0 ± 5.0	942.0 ± 6.0	1021.0 ± 5.0	1047.0 ± 5.0	928.0 ± 8.0
Texto a imagen — Calidad visual	1140.0 ± 6.0	1129.0 ± 6.0	929.0 ± 6.0	1043.0 ± 5.0	975.0 ± 5.0	759.0 ± 10.0
Texto a imagen — Infografías (factualidad)	1114.0 ± 14.0	1074.0 ± 12.0	881.0 ± 13.0	1102.0 ± 13.0	985.0 ± 12.0	890.0 ± 22.0
Edición — General	1065.0 ± 9.0	1047.0 ± 9.0	913.0 ± 9.0	1051.0 ± 10.0	995.0 ± 8.0	937.0 ± 9.0
Edición — Personajes	1056.0 ± 7.0	1049.0 ± 7.0	952.0 ± 7.0	1050.0 ± 8.0	1025.0 ± 7.0	894.0 ± 8.0
Edición — Creativa	1023.0 ± 7.0	1031.0 ± 7.0	976.0 ± 7.0	1004.0 ± 7.0	1017.0 ± 7.0	938.0 ± 7.0
Edición — Objeto/Entorno	1029.0 ± 8.0	1018.0 ± 8.0	945.0 ± 8.0	1042.0 ± 10.0	976.0 ± 8.0	946.0 ± 9.0
Edición — Múltiples entradas	1037.0 ± 8.0	1016.0 ± 8.0	919.0 ± 9.0	1056.0 ± 12.0	1014.0 ± 9.0	N/A
Edición — Estilización	1045.0 ± 7.0	1031.0 ± 7.0	862.0 ± 8.0	1045.0 ± 9.0	996.0 ± 7.0	984.0 ± 7.0

Conclusiones clave de esta tabla de benchmarks:

En las categorías de generación de texto a imagen y edición de imágenes, Gemini 3.1 Flash Image lidera de forma constante o iguala las puntuaciones más altas entre los modelos de nivel Flash y muchos modelos competitivos.
El modelo muestra resultados especialmente sólidos en los benchmarks de Calidad visual e Infografías (factualidad), lo que indica que destaca no solo en calidad estética, sino también en la representación estructuralmente precisa del contenido.
En edición con múltiples entradas, Nano Banana 2 también muestra una generalización robusta, con puntuaciones superiores a su generación Flash anterior.

Estas evaluaciones se realizan mediante comparaciones humano a humano lado a lado con Elo en un conjunto de benchmarks diverso, reflejando tanto la preferencia como la fidelidad en tareas comunes de generación/edición de imágenes.

Nano Banana 2 vs Nano Banana vs Nano Banana Pro

Modelo	Posicionamiento	Benchmark representativo/notas
Gemini 3.1 Flash Image (Nano Banana 2)	Nivel Flash: velocidad + alta calidad visual (2K–4K)	Preferencia global 1079.0 ± 7.0; calidad visual 1140 ± 6.0 (GenAI-Bench interno).
Gemini 2.5 Flash Image (Nano Banana)	Lanzamiento Flash anterior (menor fidelidad)	Ligeramente menores puntuaciones de preferencia/calidad visual frente a 3.1.
Gemini 3 Pro Image (Nano Banana Pro)	Nivel Pro: mayor fidelidad percibida para tareas complejas, mayor costo/latencia	Compensaciones diferentes; algunas métricas muestran clasificaciones relativas distintas en tareas especializadas.
GPT-Image 1.5 / otros modelos comerciales	Competidores (abiertos/cerrados)	En los benchmarks internos de Google, GPT-Image y otros puntuaron por debajo de Gemini 3.1 en calidad visual y preferencia global en la evaluación reportada. Comparaciones independientes de terceros varían.

Cuándo elegir Flash Image Preview:

Vista previa de imágenes en tiempo real en aplicaciones
Generación de imágenes a gran escala sensible a costos
Asistentes de diseño interactivos

Cómo acceder e integrar Nano Banana 2

Paso 1: Regístrate para obtener la clave de API

Inicia sesión en cometapi.com. Si aún no eres usuario, regístrate primero. Inicia sesión en tu consola de CometAPI. Obtén la clave de API de credenciales de acceso de la interfaz. Haz clic en “Add Token” en el token de API en el centro personal, obtén la clave de token: sk-xxxxx y envíala.

Paso 2: Envía solicitudes a la API de `Nano Banana 2`

Selecciona el endpoint “gemini-3.1-flash-image-preview8” para enviar la solicitud a la API y configura el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API de nuestro sitio web. Nuestro sitio web también proporciona pruebas en Apifox para tu conveniencia. Reemplaza <YOUR_API_KEY> por tu clave real de CometAPI de tu cuenta. Dónde llamarlo:Generación de imágenes con Gemini

Nano Banana 2 admite edición de imágenes, generación de imágenes y flujos de trabajo con múltiples imágenes. Para la edición de imágenes, debes subir la URL de la imagen. Para más parámetros, consulta la documentación.

Paso 3: Recupera y verifica los resultados

Procesa la respuesta de la API para obtener la salida generada. Tras el procesamiento, la API responde con el estado de la tarea y los datos de salida. Puedes descargar la imagen directamente a tu máquina local en el playground (normalmente en formato PNG). Se genera una URL de imagen en el proceso de la API; descárgala a la brevedad.

Precios para Nano Banana 2

Explora precios competitivos para Nano Banana 2, diseñado para adaptarse a diversos presupuestos y necesidades de uso. Nuestros planes flexibles garantizan que solo pagues por lo que uses, facilitando el escalado a medida que crecen tus requisitos. Descubre cómo Nano Banana 2 puede mejorar tus proyectos mientras mantienes los costos manejables.

nano-banana-2（image）

variant / alias	Price
gemini-3.1-flash-image (0.5K)	≈ $0.03600
gemini-3.1-flash-image (1K)	≈ $0.05360
gemini-3.1-flash-image (2K)	≈ $0.08080
gemini-3.1-flash-image (4K)	≈ $0.12080
gemini-3.1-flash-image-preview (0.5K)	≈ $0.03600
gemini-3.1-flash-image-preview (1K)	≈ $0.05360
gemini-3.1-flash-image-preview (2K)	≈ $0.08080
gemini-3.1-flash-image-preview (4K)	≈ $0.12080

Código de ejemplo y API para Nano Banana 2

Accede a código de muestra completo y recursos de API para Nano Banana 2 para agilizar tu proceso de integración. Nuestra documentación detallada proporciona orientación paso a paso, ayudándote a aprovechar todo el potencial de Nano Banana 2 en tus proyectos.

Python
JavaScript
Curl

from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

Python Code Example

from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

JavaScript Code Example

import fs from "fs";
import path from "path";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-3.1-flash-image-preview";

const prompt =
  "A woman leaning on a wooden railing of a traditional Chinese building. " +
  "She is wearing a blue cheongsam with pink and red floral motifs and a headdress " +
  "made of colorful flowers, including roses and lilacs. Realistic painting style, " +
  "focusing on the textural details of the clothing patterns and wooden buildings.";

const response = await fetch(`${base_url}/models/${model}:generateContent`, {
  method: "POST",
  headers: {
    "Content-Type": "application/json",
    Authorization: api_key,
  },
  body: JSON.stringify({
    contents: [
      {
        role: "user",
        parts: [{ text: prompt }],
      },
    ],
    generationConfig: {
      responseModalities: ["IMAGE"],
      imageConfig: {
        aspectRatio: "9:16",
      },
    },
  }),
});

const data = await response.json();

const outputDir = "./output";
if (!fs.existsSync(outputDir)) {
  fs.mkdirSync(outputDir, { recursive: true });
}

for (const candidate of data.candidates) {
  for (const part of candidate.content.parts) {
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageBuffer = Buffer.from(part.inlineData.data, "base64");
      const outputPath = path.join(outputDir, "gemini-3.1-flash-image-preview.png");
      fs.writeFileSync(outputPath, imageBuffer);
      console.log(`Image saved to ${outputPath}`);
    }
  }
}

Curl Code Example

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

mkdir -p ./output

curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "9:16"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
    if 'text' in part:
        print(part['text'])
    elif 'inlineData' in part:
        img = base64.b64decode(part['inlineData']['data'])
        with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
            f.write(img)
        print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"

Versiones de Nano Banana 2

La razón por la cual Nano Banana 2 tiene múltiples instantáneas puede incluir factores potenciales como variaciones en la salida tras actualizaciones que requieren instantáneas anteriores para mantener la coherencia, ofrecer a los desarrolladores un período de transición para adaptación y migración, y diferentes instantáneas que corresponden a endpoints globales o regionales para optimizar la experiencia del usuario. Para conocer las diferencias detalladas entre versiones, consulte la documentación oficial.

ID del modelo	Descripción	Disponibilidad	Solicitud
gemini-3.1-flash-image	Recomendado, apunta al modelo más reciente	✅	Gemini genera imágenes
gemini-3.1-flash-image-preview	Vista previa oficial	✅	Gemini genera imágenes