De Google Nano Banana Pro (ID oficial del modelo) gemini-3-pro-image-preview) es la variante de generación y edición de imágenes del Gemini 3 Pro. Es un modelo de imagen profesional para la etapa de previsualización que añade salida 2K/4K y composición multiimagen de alta fidelidad (hasta 14 imágenes de referencia, coherencia de carácter para hasta la gente 5), una representación de texto en imágenes más potente y una base de búsqueda fundamentada en la veracidad del mundo real.
Caracteristicas basicas
- Texto → ImagenGeneración totalmente guiada por avisos con estricto apego a los mismos.
- **Imagen → Imagen (editada)**Ediciones precisas y específicas que mantienen la coherencia del tema/personaje a lo largo de las distintas ediciones.
- Resolución máxima de salida: hasta 4K (Los ejemplos y los tamaños de píxeles exactos admitidos dependen de la relación de aspecto; la API expone preajustes de 1K/2K/4K)
- Planificación iterativa y autocorrección: un proceso interno “multietapa” que detecta y corrige errores visuales comunes (perspectiva, texto, geometría fina).
- Renderizado avanzado de texto en imágenesTexto multilingüe claro y legible (desde breves leyendas hasta párrafos largos) adecuado para carteles, maquetas e infografías.
- 5 caracteres y fidelidad hasta 14 objetos/imágenes de referencia en un único flujo de trabajo.
- Marca de agua / procedencia: Todas las imágenes generadas incluyen una marca de agua SynthID; el modelo incorpora metadatos C2PA para la procedencia en algunas integraciones de productos.
Versiones de imagen y nomenclatura del Gemini 3 Pro
gemini-3-pro-image-previewgemini-3-pro-image
Detalles técnicos
Arquitectura
- Linaje / columna vertebralNano Banana Pro se basará en la pila de imágenes Gemini de Google, en constante evolución; específicamente, en la nueva Imagen del Gemini 3 Pro / GEMPIX 2 arquitectura (un marco de trabajo multimodal de imagen y texto de mayor capacidad). Eso es una evolución de Imagen Flash de Gemini 2.5 (el “nano-banana” original) en un modelo de imagen multimodal nativo con capacidades de razonamiento de lenguaje visual ampliadas.
- Comportamiento modeloMultimodalidad nativa (imagen + texto + conocimiento del entorno), flujos de trabajo explícitos para la fusión de múltiples imágenes y un planificador interno por etapas que refina los resultados en múltiples pasadas en lugar de generar una única muestra estática. Los primeros informes indican una mayor capacidad de razonamiento geométrico/óptico (vidrio, refracción) en comparación con versiones anteriores.
- Pensamiento / refinamiento internoEl modelo utiliza un proceso de “pensamiento” visible internamente para refinar la composición (la API documenta este comportamiento y señala que esos pasos internos no se cobran como tokens de imagen finales).
- Conexión a tierra y herramientas: Apoya Búsqueda de puesta a tierra (Permite incorporar datos web en la generación de diagramas e infografías). También admite instrucciones del sistema para un control más determinista.
Parámetros clave de la API:
thinking_level(baja / alta) para intercambiar latencia por profundidad de razonamiento;media_resolution(bajo/medio/alto) para controlar los tokens de lectura de detalles/OCR de imágenes;generationConfig.imageConfigpara controlar la relación de aspecto/resolución en las salidas de imagen.
Límites de imagen:
- Modalidades de entrada admitidas: Texto e imágenes (el modelo no acepta audio ni vídeo como entradas para la generación de imágenes).
- Número máximo de imágenes por solicitud: 14 (para la vista previa de la imagen del Gemini 3 Pro).
- Tamaño máximo de imagen (carga): 7 MB por imagen de entrada.
- Relaciones de aspecto admitidas: 1:1, 3:2, 16:9, 9:16, 21:9, etc.
Imágenes/tokens de salida: límites altos, con soporte para 4K/4096px.
Rendimiento de referencia
Breve resumen: Las primeras evaluaciones comparativas públicas hasta la fecha son principalmente cualitativas y basadas en la comunidad, pero informan consistentemente de mejoras sustanciales en resolución, reducción de artefactos y fidelidad física en comparación con la nanobanana original (Gemini 2.5 Flash Image). Algunos desafíos específicos han mostrado claras mejoras visuales, pero aún no existen tablas de evaluación comparativa numéricas estandarizadas (públicas) de Google que comparen la versión 1 con la versión 2 según las métricas estándar de generación de imágenes.
- Pruebas comunitarias cualitativasBordes más definidos, microdetalles más nítidos, colores más fieles y una reproducción más precisa (menos efectos visuales distorsionados, personajes más consistentes). Entre las pruebas informales más populares se encuentran la llamada «Prueba de la Copa de Vino» y el «Reto de la Hamburguesa de Cristal», donde GEMPIX2 (Nano Banana Pro) gestiona la transparencia y la refracción notablemente mejor que las versiones anteriores.
- Manejo de textoNano Banana Pro muestra una tipografía y una colocación de texto visiblemente mejoradas dentro de las imágenes (una debilidad persistente en muchos modelos de imagen). Las comparaciones de la comunidad indican una menor cantidad de glifos renderizados distorsionados.
- Rendimiento / Experiencia de usuario: Mayor velocidad de iteración y una experiencia de usuario que realiza un refinamiento en varias etapas en el backend para que los usuarios vean resultados más fiables en la primera pasada (reduciendo las repeticiones manuales).
Limitaciones y riesgos
- Filtros y detección de contenidoLas plataformas que integran el modelo (por ejemplo, Whisk/aplicaciones de terceros) pueden habilitar la detección estricta de celebridades o de su semejanza y bloquear ciertas salidas, lo que afecta los flujos de trabajo creativos que dependen de semejanzas realistas de celebridades.
- Casos límite de alucinaciones/razonamiento: aunque mejorado, el modelo aún puede producir artefactos físicamente poco realistas, especialmente con texto simbólico denso dentro de imágenes o diagramas muy técnicos; si bien NB2 parece reducir estos errores en comparación con versiones anteriores.
- Seguridad y mal uso: Los modelos generativos de imágenes pueden utilizarse para crear contenido problemático o dañino. Google aplica restricciones, filtros de contenido y la marca de agua SynthID para ayudar a rastrear la procedencia; sin embargo, se han producido abusos (una controversia de gran repercusión relacionada con una imagen generada por Nano Banana en un contexto políticamente delicado).
Cómo se compara Nano Banana Pro con otros modelos
- Nano Banana Pro (Imagen GEMPIX 2 / Gemini 3 Pro) — Fuerte integración móvil, fusión de múltiples imágenes, autocorrección iterativa, reescalado nativo a 2K/4K, y perfecta integración con las aplicaciones de Google (Búsqueda, Fotos, Workspace/Gemini). Ideal para flujos de trabajo que requieren ediciones fiables, continuidad e integración con los servicios de Google.
- Midjourney — Sobresale en producciones artísticas estilizadas y en la ingeniería de prompts impulsada por la comunidad; no suele estar dirigido a la fusión de múltiples imágenes con precisión fotográfica ni a flujos de trabajo de edición multimodal profundos.
- Difusión estable / pesos abiertos — Totalmente abierto, altamente personalizable y alojable localmente; su ecosistema de puntos de control y ajustes precisos supone una ventaja decisiva para la investigación y el uso sin conexión. Ofrece una integración móvil menos intuitiva y una coherencia de edición de múltiples imágenes menos consistente de serie que Nano Banana Pro.
- Seedream 4.0 (ByteDance) — Recientemente se ha posicionado explícitamente como competidor de Nano Banana, haciendo hincapié en el renderizado ultrarrápido, la salida 2K y la compatibilidad con numerosas imágenes de referencia (hasta seis). Se presenta como una alternativa para profesionales y creadores.
(Estas comparaciones son de alto nivel; elija la herramienta que mejor se adapte a su flujo de trabajo: apertura/personalización → Stable Diffusion; arte estilizado → Midjourney; edición móvil integrada y consistente con iteración agresiva → Nano Banana Pro/ familia de imágenes Gemini 3 Pro).
Casos de uso en el mundo real.
- Edición de fotos móviles y filtros creativos (Integraciones de Google Photos: rediseño, fusión de fondos, recomposición de retratos).
- activos de marketing y publicidad — Generación rápida de conceptos, personajes de marca consistentes en múltiples encuadres/ángulos.
- Arte conceptual y guion gráfico — La fusión de múltiples imágenes ayuda a mantener la continuidad de los personajes a través de las viñetas.
- Maquetas de productos/comercio electrónico — Generar fotografías de producto consistentes en diferentes contextos/condiciones de iluminación.
- Prototipado rápido para recursos de RA/RV — Salidas 2K/4K de alta calidad que se pueden reescalar para usos inmersivos.
Cómo llamar a gemini-3-pro-image(Nano Banana Pro) API
Precios de Nano Banana API en CometAPI, con un 20 % de descuento sobre el precio oficial:
| Precio | $0.19200 |
Pasos requeridos
- Inicia sesión en cometapi.comSi aún no eres nuestro usuario, por favor regístrate primero.
- Obtenga la clave API de credenciales de acceso de la interfaz. Haga clic en "Agregar token" en el token API del centro personal, obtenga la clave del token: sk-xxxxx y envíe.
- Obtenga la URL de este sitio: https://api.cometapi.com/
Método de uso
- Seleccione la opción "
gemini-3-pro-imagePunto final para enviar la solicitud de API y configurar el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API de nuestro sitio web. Nuestro sitio web también ofrece la prueba de Apifox para su comodidad. - Reemplazar con su clave CometAPI real de su cuenta.
- Inserte su pregunta o solicitud en el campo de contenido: esto es lo que responderá el modelo.
- . Procesa la respuesta de la API para obtener la respuesta generada.
CometAPI proporciona una API REST totalmente compatible para una migración sin problemas. Detalles clave:
- URL base: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
- Nombres de modelos:
gemini-3-pro-image - Autenticación:
Bearer YOUR_CometAPI_API_KEYencabezamiento - Tipo de contenido:
application/json.
Vea también API de imágenes Flash de Gemini 2.5 (Nano-Banana)



