Home/Models/Google/Nano Banana Pro
G

Nano Banana Pro

Entrada:$1.5616/M
Salida:$9.3696/M
Nano Banana Pro es un modelo de IA para asistencia de propósito general en flujos de trabajo centrados en texto. Es adecuado para indicaciones de estilo instruccional para generar, transformar y analizar contenido con estructura controlable. Los usos típicos incluyen asistentes de chat, resumen de documentos, preguntas y respuestas basadas en conocimiento y automatización de flujos de trabajo. Los detalles técnicos públicos son limitados; la integración se alinea con patrones comunes de asistentes de IA, como salidas estructuradas, indicaciones con recuperación aumentada y llamadas a herramientas o funciones.
Nuevo
Uso comercial
Playground
Resumen
Características
Precios
API
Versiones

Funciones básicas

  • Texto → Imagen: generación completa guiada por prompts con una fuerte adhesión al prompt.
  • Imagen → Imagen (ediciones): ediciones finas y precisas con mantenimiento de la consistencia del sujeto/personaje a través de múltiples ediciones.
  • Resolución máxima de salida: hasta 4K (los ejemplos y los tamaños exactos de píxeles compatibles dependen de la relación de aspecto; la API ofrece preajustes de 1K/2K/4K)
  • Planificación iterativa y autocorrección: una canalización interna de “múltiples etapas” que detecta y corrige errores visuales comunes (perspectiva, texto, geometría fina).
  • Renderizado avanzado de texto dentro de la imagen: texto multilingüe claro y legible (desde subtítulos cortos hasta párrafos largos), adecuado para pósteres, mockups e infografías.
  • 5 personajes y fidelidad para hasta 14 objetos/imágenes de referencia en un solo flujo de trabajo.
  • Marca de agua / procedencia: todas las imágenes generadas incluyen una marca de agua SynthID; el modelo incorpora metadatos C2PA para la procedencia en algunas integraciones de productos.

Versiones y nombres de Gemini 3 Pro Image

  • gemini-3-pro-image-preview
  • gemini-3-pro-image

Detalles técnicos

Arquitectura

  • Linaje / backbone: se cree que Nano Banana Pro está construido sobre la evolución de la pila de imágenes Gemini de Google, específicamente la nueva arquitectura Gemini 3 Pro Image / GEMPIX 2 (un marco multimodal de imagen + texto de mayor capacidad). Esto supone una evolución desde Gemini 2.5 Flash Image (el “nano-banana” original) hacia un modelo de imagen nativamente multimodal con capacidades ampliadas de razonamiento visión-lenguaje.
  • Comportamiento del modelo: multimodalidad nativa (imagen + texto + conocimiento del mundo), canalizaciones explícitas para fusión de múltiples imágenes y un planificador interno por etapas que refina las salidas en varias pasadas en lugar de producir una única muestra estática. Los primeros informes indican un razonamiento geométrico/óptico más sólido (vidrio, refracción) frente a versiones anteriores.
  • Pensamiento / refinamiento interno: el modelo utiliza internamente un proceso visible de “pensamiento” para refinar la composición (la API documenta este comportamiento y señala que esos pasos internos no se cobran como tokens finales de imagen).
  • Grounding y herramientas: admite Search grounding (puede incorporar datos web en la generación de diagramas/infografías). También admite instrucciones del sistema para un control más determinista.

Parámetros clave de la API:

  • thinking_level (low / high) para equilibrar latencia frente a profundidad de razonamiento;
  • media_resolution (low/medium/high) para controlar los tokens de OCR/lectura de detalle de la imagen;
  • generationConfig.imageConfig para controlar la relación de aspecto/resolución en las salidas de imagen.

Límites de imagen:

  • Modalidades de entrada compatibles: texto e imágenes (el modelo no acepta audio ni video como entradas para generación de imágenes).
  • Máximo de imágenes por prompt: 14 (para la versión preliminar de Gemini 3 Pro Image).
  • Tamaño máximo de imagen (carga): 7 MB por imagen de entrada.
  • Relaciones de aspecto compatibles: 1:1, 3:2, 16:9, 9:16, 21:9, etc.

Imágenes/tokens de salida: límites altos, con compatibilidad para 4K/4096 px.

Rendimiento en benchmarks

Resumen breve: los benchmarks públicos/iniciales disponibles hasta ahora son en su mayoría cualitativos y guiados por la comunidad, pero informan de manera consistente mejoras sustanciales en resolución, reducción de artefactos y fidelidad física frente al nano-banana original (Gemini 2.5 Flash Image). Algunos “desafíos” concretos han mostrado claras mejoras visuales, pero todavía no hay tablas públicas estandarizadas con métricas numéricas de Google comparando v1 → v2 en métricas estándar de generación de imágenes.

  • Pruebas cualitativas de la comunidad: bordes más limpios, microdetalles más nítidos, colores más fieles y una mejor adhesión al prompt (menos objetos alucinados, personajes más consistentes). Entre las pruebas informales populares se incluyen la llamada “Wine Glass Test” y “Glass Burger Challenge”, donde GEMPIX2 (Nano Banana Pro) maneja la transparencia y la refracción notablemente mejor que versiones anteriores.
  • Manejo de texto: Nano Banana Pro muestra una mejora visible en tipografía y colocación de texto dentro de las imágenes (una debilidad persistente en muchos modelos de imagen). Las comparaciones de la comunidad indican menos glifos renderizados de forma incorrecta.
  • Rendimiento / UX: mayor velocidad de iteración y una UX que realiza refinamiento en múltiples etapas en el backend para que los usuarios obtengan resultados de primera pasada más fiables (reduciendo la necesidad de rehacer manualmente).

Limitaciones y riesgos

  • Filtros de contenido y detección: las plataformas que integran el modelo (por ejemplo, Whisk/aplicaciones de terceros) pueden habilitar una detección estricta de celebridades o parecidos y bloquear ciertas salidas, lo que afecta a los flujos creativos que dependen de parecidos realistas con celebridades.
  • Alucinación / casos límite de razonamiento: aunque ha mejorado, el modelo aún puede producir artefactos físicamente irreales, especialmente con texto simbólico denso dentro de imágenes o diagramas muy técnicos, aunque NB2 parece reducir estos errores frente a versiones anteriores.
  • Seguridad y uso indebido: los modelos generativos de imágenes pueden utilizarse para crear contenido problemático o dañino. Google aplica restricciones, filtros de contenido y la marca de agua SynthID para ayudar con la procedencia; aun así, se han producido usos indebidos (incluida una controversia de alto perfil relacionada con una imagen generada por Nano Banana en un contexto políticamente sensible).

Cómo se compara Nano Banana Pro con otros modelos

  • Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — fuerte integración móvil, fusión de múltiples imágenes, autocorrección iterativa, 2K nativo/reescalado a 4K, e integración estrecha en aplicaciones de Google (Search, Photos, Workspace/Gemini). Ideal para flujos de trabajo que necesitan ediciones fiables, continuidad e integración con servicios de Google.
  • Midjourney — destaca en salidas artísticas estilizadas e ingeniería de prompts impulsada por la comunidad; normalmente no está orientado a la fusión fotorrealista de múltiples imágenes ni a canalizaciones profundas de edición multimodal.
  • Stable Diffusion / pesos abiertos — totalmente abierto, altamente personalizable y desplegable localmente; su ecosistema de checkpoints y ajuste fino es una ventaja decisiva para investigación y uso sin conexión. Tiene menos integración móvil de “un clic” y menos coherencia consistente en edición de múltiples imágenes lista para usar que Nano Banana Pro.
  • Seedream 4.0 (ByteDance) — recientemente posicionado explícitamente como competidor de Nano Banana, enfatizando renderizado ultrarrápido, salida 2K y compatibilidad con muchas imágenes de referencia (hasta seis). Se presenta como una alternativa profesional/para creadores.

(Estas comparaciones son de alto nivel; elige la mejor opción según tu flujo de trabajo: apertura/personalización → Stable Diffusion; arte estilizado → Midjourney; edición móvil integrada y consistente con iteración agresiva → Nano Banana Pro/familia Gemini 3 Pro Image.)

Casos de uso reales

  • Edición de fotos móvil y filtros creativos (integraciones con Google Photos: reestilización, fusión de fondos, recomposición de retratos).
  • Activos de marketing y publicidad — generación rápida de conceptos, personajes de marca consistentes en múltiples fotogramas/ángulos.
  • Arte conceptual y storyboard — la fusión de múltiples imágenes ayuda a mantener la continuidad de personajes entre paneles.
  • E-commerce / mockups de producto — genera tomas consistentes del producto en distintos contextos/condiciones de iluminación.
  • Prototipado rápido para activos AR/VR — salidas 2K/4K de alta calidad que pueden reescalarse para usos inmersivos.
  • Cómo acceder a la API de gemini-3-pro-image (Nano Banana Pro)

Pasos necesarios

  • Inicia sesión en cometapi.com. Si todavía no eres usuario, regístrate primero.
  • Obtén la credencial de acceso, la clave API de la interfaz. Haz clic en “Add Token” en la sección de token API del centro personal, obtén la clave del token: sk-xxxxx y envíala.
  • Obtén la URL de este sitio: https://api.cometapi.com/

Método de uso

  1. Selecciona el endpoint “gemini-3-pro-image” para enviar la solicitud a la API y configura el cuerpo de la solicitud. El método de solicitud y el cuerpo de la solicitud se obtienen de la documentación de la API de nuestro sitio web. Nuestro sitio web también proporciona pruebas con Apifox para tu comodidad.
  2. Sustituye <YOUR_API_KEY> por tu clave real de CometAPI de tu cuenta.
  3. Inserta tu pregunta o solicitud en el campo content; esto es a lo que responderá el modelo.
  4. Procesa la respuesta de la API para obtener la respuesta generada.

CometAPI proporciona una API REST totalmente compatible, para una migración sin problemas. Detalles clave:

  • Base URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
  • Nombres de modelo: gemini-3-pro-image
  • Autenticación: encabezado Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json .

Preguntas Frecuentes

Can Gemini 3 Pro Image generate 4K resolution images?

Sí, Nano Banana Pro (Gemini 3 Pro Image) admite salida nativa de hasta resolución 4K con relaciones de aspecto que incluyen 1:1, 3:2, 16:9, 9:16 y 21:9. También admite preajustes de 1K y 2K mediante el parámetro imageConfig.

How does Nano Banana Pro handle text rendering inside images?

Nano Banana Pro ofrece renderizado avanzado de texto dentro de las imágenes con compatibilidad clara y legible para texto en varios idiomas, desde subtítulos cortos hasta párrafos largos. Esto lo hace ideal para pósteres, infografías, maquetas de UI y materiales de marketing.

Can I edit images conversationally with Gemini 3 Pro Image?

Sí, Nano Banana Pro admite edición conversacional de varios turnos. Simplemente solicita cambios como 'Haz que el fondo sea un atardecer' y el modelo mantiene el contexto visual mediante Thought Signatures entre turnos.

What makes Nano Banana Pro different from FLUX 2 Pro or Midjourney?

Nano Banana Pro destaca por su autocorrección iterativa, la preservación consistente de personajes a lo largo de múltiples ediciones y la estrecha integración con el ecosistema de Google. Puede manejar hasta 14 imágenes de referencia para flujos de trabajo complejos de fusión de múltiples imágenes.

Does Nano Banana Pro use Google Search for grounded image generation?

Sí, Nano Banana Pro puede usar la fundamentación con Search para verificar hechos antes de generar imágenes. Por ejemplo, puede obtener datos meteorológicos actuales para crear una infografía precisa del clima de Tokio.

How many reference images can Nano Banana Pro process in one request?

Nano Banana Pro admite hasta 14 imágenes de entrada por prompt con un máximo de 7 MB por imagen. Mantiene la consistencia de sujetos y personajes en hasta 5 personajes en escenarios complejos de fusión de múltiples imágenes.

Características para Nano Banana Pro

Explora las características clave de Nano Banana Pro, diseñado para mejorar el rendimiento y la usabilidad. Descubre cómo estas capacidades pueden beneficiar tus proyectos y mejorar la experiencia del usuario.

Precios para Nano Banana Pro

Explora precios competitivos para Nano Banana Pro, diseñado para adaptarse a diversos presupuestos y necesidades de uso. Nuestros planes flexibles garantizan que solo pagues por lo que uses, facilitando el escalado a medida que crecen tus requisitos. Descubre cómo Nano Banana Pro puede mejorar tus proyectos mientras mantienes los costos manejables.

nano-banana-pro(image)

variant / aliasPrice
gemini-3-pro-image (1K/2K)≈ $0.10720
gemini-3-pro-image (4K)≈ $0.19200
gemini-3-pro-image-preview (1K/2K)≈ $0.10720
gemini-3-pro-image-preview (4K)≈ $0.19200
nano-banana-pro-all$0.09600

Código de ejemplo y API para Nano Banana Pro

Accede a código de muestra completo y recursos de API para Nano Banana Pro para agilizar tu proceso de integración. Nuestra documentación detallada proporciona orientación paso a paso, ayudándote a aprovechar todo el potencial de Nano Banana Pro en tus proyectos.
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

Versiones de Nano Banana Pro

La razón por la cual Nano Banana Pro tiene múltiples instantáneas puede incluir factores potenciales como variaciones en la salida tras actualizaciones que requieren instantáneas anteriores para mantener la coherencia, ofrecer a los desarrolladores un período de transición para adaptación y migración, y diferentes instantáneas que corresponden a endpoints globales o regionales para optimizar la experiencia del usuario. Para conocer las diferencias detalladas entre versiones, consulte la documentación oficial.
ID del modeloDescripciónDisponibilidadSolicitud
nano-banana-pro-allLa tecnología utilizada es no oficial y la generación es inestable, etc.; formato Chat✅formato Chat
gemini-3-pro-imageRecomendado; apunta al modelo más reciente✅Gemini genera imágenes
gemini-3-pro-image-previewVista previa oficial✅Gemini genera imágenes

Más modelos