Cómo dar indicaciones a Nano banana Pro de la mejor manera

CometAPI
AnnaNov 25, 2025
Cómo dar indicaciones a Nano banana Pro de la mejor manera

Google lanzó Nano Banana Pro (el modelo Gemini 3 Pro Image) el 20 de noviembre de 2025. Es un modelo de generación y edición de imágenes de alta fidelidad que mejora al Nano Banana original con un renderizado de texto mucho mejor, un conocimiento del mundo más profundo y compatibilidad para combinar muchas imágenes de referencia (hasta 14). Este artículo cubre qué es, en qué se diferencia de Nano Banana, técnicas prácticas de prompt para lograr los mejores resultados, plantillas de prompts de alto rendimiento para servidor (con código y aplicaciones), consejos de integración y orientación sobre seguridad/ética.

El servicio oficial Nano Banana Pro de Google está actualmente muy congestionado, especialmente para los usuarios gratuitos, que solo pueden generar tres generaciones de imágenes de baja resolución. La buena noticia es que CometAPI ha integrado completamente la API de Gemini 3 Pro Image (Nano Banana Pro), y aquí puedes usarla de forma económica y sin restricciones.

¿Qué es Nano Banana Pro?

Nano Banana Pro es el modelo profesional de generación y edición de imágenes de Google, basado en Gemini 3 Pro Image. Está diseñado para trabajos visuales de alta precisión — infografías, maquetas, ediciones fotográficas complejas, renderizado robusto de texto multilingüe dentro de las imágenes y resultados con calidad de estudio de hasta 4K. Google lo posiciona como el modelo de imágenes en “modo de razonamiento” para usuarios que necesitan precisión, fidelidad del texto y comprensión contextual al crear o editar imágenes.

Capacidades clave de un vistazo

  • Renderizado de texto superior dentro de las imágenes (texto multilingüe legible, cadenas largas).
  • Mezcla de múltiples imágenes: combina muchas imágenes fuente (los informes mencionan hasta 14).
  • Consistencia de sujeto/personaje: mantiene el parecido entre imágenes (hasta 5 personas mencionadas en las notas de lanzamiento).
  • Salidas de alta resolución y controles de estudio: ángulo de cámara, iluminación, corrección de color, ediciones locales, exportación 2K/4K.
  • Integraciones: disponible a través de la app Gemini, Google AI Studio, CometAPI (para desarrolladores/empresas) y alianzas (p. ej., integraciones con Adobe mencionadas en informes tempranos).

¿Cómo se compara Nano Banana Pro con Nano Banana?

¿Cuál es la diferencia técnica?

  • Modo y compensaciones: Nano Banana (Flash) está optimizado para la velocidad y la iteración (ideal para ideación). Nano Banana Pro ejecuta un proceso de “razonamiento” para refinar composición y lógica, produciendo menos resultados pero de mayor calidad, más adecuados para producción.
  • Calidad del texto: Pro mejora drásticamente el renderizado de cadenas largas, párrafos y subtítulos multilingües, una debilidad conocida de muchos modelos de imagen antes de este lanzamiento.
  • Fusión de referencias: Pro admite composiciones con más imágenes (hasta 14 referencias) y mejor consistencia de personajes/personas en las ediciones. Nano Banana Flash normalmente usaba menos referencias.
  • Anclaje en conocimiento: Pro tiene mejor acceso al conocimiento del mundo y puede producir diagramas o infografías anotadas más verosímiles.
  • Controles de edición: las ediciones locales, cambios de cámara, transformaciones de iluminación y flujos de trabajo de edición en múltiples pasos son más sólidos en Pro.

¿Qué cambió en la canalización de prompt → resultado?

Los modelos de imagen tradicionales siguen una canalización de prompt → ruido → denoise. Nano Banana Pro añade una fase de razonamiento/“pensamiento” (expuesta a los usuarios como una selección de modo en la interfaz y utilizada implícitamente en llamadas de API de mayor fidelidad). Eso significa que el modelo puede:

  • Planificar el diseño y la tipografía para imágenes con texto incrustado.
  • Hacer cumplir restricciones fácticas cuando se requieren diagramas o visuales etiquetados (p. ej., mapas o visuales técnicos).
  • Mantener la identidad y consistencia de personajes a lo largo de múltiples fotogramas generados o fuentes mezcladas.

En la práctica, esto implica prompts más largos y estructurados que indiquen: (1) qué se debe representar, (2) restricciones y etiquetas fácticas, (3) instrucciones de composición y cámara/iluminación, y (4) el contenido de texto deseado y su ubicación si lo hay. Si solo das una frase corta, aún obtendrás buenos resultados, pero perderás los beneficios de la fase de planificación.

Implicaciones prácticas para creadores

  • Usa Flash (Nano Banana) para conceptualización rápida, guionizado y borradores para redes sociales.
  • Usa Pro cuando necesites texto legible en la imagen, infografías precisas, recursos publicitarios o renders finales de alta resolución que puedan ir a imprenta o campañas de pago.

¿Cómo crear prompts para Nano Banana Pro para obtener los mejores resultados?

Como Nano Banana Pro prioriza la precisión y el control, tus prompts deben ser explícitos pero estructurados. Aprovecha las fortalezas del modelo: instrucciones contextuales ricas, restricciones para el texto y solicitudes de apariencia consistente de personajes.

Anatomía de un prompt de alta calidad para Nano Banana Pro

Una estructura de prompt eficaz y repetible se ve así:

  1. Intención / Entregable: ¿Qué recurso exacto quieres? (p. ej., “Un póster 2K para un festival de jazz”)
  2. Sujeto y composición: Quién/qué aparece en cuadro, su pose, el ángulo de cámara y la composición (p. ej., “retrato 3/4, plano medio, sujeto centrado, espacio negativo a la derecha”).
  3. Parámetros de estilo: Foto vs. ilustración, detalles de lente/cámara, estado de ánimo, paleta de color, artistas de referencia si se requiere.
  4. Especificaciones de texto y tipografía (si aplica): Redacción exacta, idioma, estilo de fuente (p. ej., “Titular: ‘Autumn Jazz — 15 de oct.’, usar sans serif condensada en negrita, blanco sobre oscuro”).
  5. Restricciones y seguridad: Guías de marca, restricciones fácticas para infografías (p. ej., “No mostrar el rostro de una persona real distinta a los recursos proporcionados”).
  6. Especificaciones de salida y ediciones: Resolución, relación de aspecto y ediciones locales (p. ej., “Salida 2048×2048 PNG, ajustar iluminación en el rostro del sujeto +2 pasos”).

Resumen corto de plantilla (rellena los tokens):

. Subject: . Composition: . Style: . Text: . Constraints: . Output: .

La claridad del prompt importa — especialmente para texto en la imagen

Si tu imagen necesita texto, especifica:

  • los caracteres/frases exactas (no pidas “un pie de foto”),
  • el idioma y cualquier diacrítico,
  • la familia tipográfica o señales de estilo (p. ej., “condensed sans, mayúsculas, kerning -1”),
  • la ubicación explícita (p. ej., “franja inferior del 10%, alineado a la izquierda”).

El renderizado de texto de Nano Banana Pro es más fuerte que el de modelos previos, pero aún se beneficia de instrucciones estrictas y “de máquina” para tipografía.

¿Cómo empezar a usar Nano Banana Pro?

A continuación se muestran pasos fundamentados y técnicas prácticas para obtener resultados fiables y de alta calidad.

Paso 0 — Elige el modo correcto

Usa la selección del modelo Nano Banana Pro en Gemini/CometAPI / AI Studio (“modo de razonamiento” / gemini-3-pro-image o gemini-3-pro-image-preview según la interfaz). Para experimentar puedes cambiar al modelo no Pro para iteraciones más rápidas y luego finalizar con Pro.

Paso 1 — Empieza por la intención, no solo por la apariencia (H3)

Escribe 1–2 frases de intención: para qué es esta imagen, quién es la audiencia y qué sensación debe transmitir. Ejemplo:

Intent: A poster for a climate-tech webinar aimed at corporate sustainability managers — modern, credible, minimal, with clear multilingual headline space.

Paso 2 — Aporta estructura: composición, punto focal y escala (H3)

Sé explícito sobre el diseño y la interacción entre texto e imagen. Especifica vista de cámara, punto focal y relación de aspecto si necesitas un formato no estándar. Ejemplo:

Composition: centered product on white studio surface, three-quarter lighting, soft shadow; left column for 40% width headline and bullet list.

Paso 3 — Usa anclas de estilo precisas (H3)

En lugar de adjetivos vagos (“cool” / “nice”), usa estilos de referencia: “aspecto de película Kodak Portra 400”, “infografía vectorial plana de 2 colores” o “render 3D isométrico de producto, luz de contra cinematográfica”. Las anclas reducen la ambigüedad.

Paso 4 — Proporciona el texto exactamente como quieres que se renderice (H3)

Dado que Nano Banana Pro es especialmente sólido al renderizar texto, incluye las cadenas exactas y el estilo tipográfico deseado:

Render the headline: "SUSTAINABLE FUTURES" in bold condensed sans, all caps, 48 pt, kerning -5%, color #0B3D91.

Paso 5 — Proporciona recursos y máscaras para ediciones

Para image-to-image o ediciones locales, sube imágenes fuente limpias y máscaras claras donde quieras cambios — asígnales etiquetas: mask_replace_logo.png con instrucciones replace. Nano Banana Pro admite ediciones y mezcla multiimagen; ofrecer entradas estructuradas mejora la predictibilidad.

Paso 6 — Solicita la traza de pensamiento del modelo cuando sea relevante (H3)

Cuando necesites que el modelo “razone” sobre decisiones de diseño o de traducción (p. ej., diferencias de longitud de texto localizadas), pide una breve descripción de su enfoque:

Explain: Prioritize legibility when translating to Spanish and German; if headline overflows, reduce font size by up to 12% and increase leading.

¿Cuáles son trucos y plantillas avanzados de prompting?

Encadenamiento de estilo visual “few-shot”

Proporciona 2–3 ejemplos breves de referencias de estilo (ya sea como descripciones de texto o imágenes subidas) para sesgar el modelo hacia una estética consistente en un conjunto de recursos.

Plantilla

Style examples: 1) "Polaroid, high-contrast vintage", 2) "Minimalist flat icons", 3) "HDR cinematic". Use #2 for this infographic, preserve flat iconography and two-tone palette.

Prompts de “transformación con restricciones” para ediciones

Si estás editando una foto existente, usa instrucciones de edición precisas:

Edit: replace sky with dusk gradient (orange→indigo), keep subject exposure constant, add soft rim light, increase saturation of jacket by 10%. Preserve EXIF camera metadata.

La precisión en las instrucciones de edición reduce el número de iteraciones para obtener un recurso listo para producción.

El patrón “Infografía con etiquetas fácticas” — para gráficos, diagramas y mapas

Por qué funciona: debes proporcionar etiquetas y restricciones explícitas para que el modelo pueda renderizar texto y relaciones posicionales precisas.

Plantilla

Create an infographic showing solar panel energy flow:
- Top: title "Solar Energy Flow"
- Left: sun icon with arrow to panel labeled "Insolation (kWh/m²)"
- Middle: solar panel illustration with callouts for "PV cells", "Inverter"
- Right: house icon labeled "Consumption (kWh/day)"
- Color palette: cool blues/greens, flat icons, legible labels, use metric units.

El patrón “Mezcla multiimagen / consistencia de personajes”

Por qué funciona: indica al modelo que deseas apariencias consistentes a través de múltiples referencias y proporciona atributos de los personajes.

Plantilla

Blend three reference photos into a single scene: character A (brown hair, scar on left eyebrow, worn leather jacket), character B (short curly hair, glasses). Keep consistent facial features across all deliverables; place both characters at table, mid-shot, warm tungsten lighting.

Consejos avanzados — modos de fallo comunes y soluciones

Problema: las superposiciones de texto se ven mal

Soluciones: Proporciona cadenas exactas, especifica la familia y el tamaño de la fuente, pide al modelo que “renderice el texto exactamente” e incluye instrucciones de respaldo (p. ej., “si el titular se desborda, reducir por igual un 10%”). Usa máscaras para las áreas de texto al hacer ediciones de imagen.

Problema: inconsistencia de personajes

Soluciones: Proporciona un conjunto claro de imágenes de referencia, usa IDs o tokens de sujeto cuando estén disponibles y añade anclas descriptivas precisas (“longitud de cabello, lunar, pendiente”) en lugar de descriptores vagos.

Problema: artefactos inesperados al hacer zoom

Soluciones: Solicita un muestreo interno más alto (si la API expone controles de muestreo/guía), pide 2–3 variaciones y elige la mejor, o renderiza a mayores dimensiones en píxeles y reduce en postproducción.

Problema: demasiadas restricciones contradictorias

Soluciones: Prioriza: nombra un único objetivo principal (p. ej., legibilidad > ultrafotorrealismo) y permite que el modelo optimice para ello.

Conclusión

Nano Banana Pro es una mejora generacional para tareas que requieren una combinación de fidelidad del texto, diseño razonado y controles de edición de estudio. Ya sea que estés generando imágenes hero de campaña, produciendo infografías de alta legibilidad o realizando inpainting y edición fotográfica matizada, el nuevo modelo reduce la brecha entre un brief creativo y recursos listos para producción. La clave del éxito es el prompting estructurado, la iteración progresiva y la integración de procedencia y versionado en tu pipeline de recursos.

Los desarrolladores pueden acceder a la API de Gemini 3 Pro Image (Nano Banana Pro) a través de CometAPI. Para comenzar, explora las capacidades del modelo de CometAPI en el Playground y consulta la guía de la API para instrucciones detalladas. Antes de acceder, asegúrate de haber iniciado sesión en CometAPI y de haber obtenido la clave de API. CometAPI ofrece un precio muy inferior al oficial para ayudarte a integrar.

¿Listo para empezar?→ Regístrate en CometAPI hoy ¡

Si quieres conocer más consejos, guías y noticias sobre IA, síguenos en VK, X y Discord!

Accede a Modelos de Primera Calidad a Bajo Costo

Leer Más