Especificaciones técnicas de Gemini 3.1 Flash Image Preview
| Elemento | Gemini 3.1 Flash Image Preview |
|---|---|
| Proveedor | |
| Familia de modelos | Gemini 3.1 (nivel Flash) |
| Enfoque principal | Generación multimodal rápida con vista previa de imagen |
| Tipos de entrada | Texto, imagen |
| Tipos de salida | Texto, imagen (generación de vista previa) |
| Ventana de contexto | Hasta 1M tokens (estándar del nivel Flash de Gemini 3.x) |
| Nivel de latencia | Baja latencia, alto rendimiento |
| Compatibilidad con streaming | Sí |
| Llamadas a herramientas | Sí (framework de herramientas de la API de Gemini) |
| Versión | 3.1 |
¿Qué es Nano Banana 2?
Nano Banana 2 es el apodo popular usado por la prensa y la comunidad de desarrolladores para el recién lanzado modelo Gemini-3.1-Flash-Image. Google lo posiciona como el motor de imágenes del nivel “Flash” que ofrece una fidelidad visual casi de nivel Pro con mucha menor latencia y costo, adecuado para generación a gran escala, edición iterativa rápida y flujos de trabajo de producto integrados en los servicios de Google. Hereda el razonamiento multimodal de Gemini 3.1 y añade capacidades centradas en imagen (texto legible en imágenes, composición multiimagen, compatibilidad con relaciones de aspecto amplias, 4K nativo).
Características principales
- Generación de alta velocidad y multirresolución: Velocidad de nivel Flash con opciones de salida 0.5K / 1K / 2K / 4K y nuevas relaciones de aspecto extremas (1:4, 4:1, 1:8, 8:1).
- Anclaje web en tiempo real: Integra resultados de búsqueda de texto e imagen para anclar el contenido generado en información actual de la web cuando se habilita “Thinking” o el anclaje de búsqueda. Útil para referencias actualizadas e infografías factuales.
- Renderizado de texto mejorado: Mejor renderizado de texto corto y texto gráfico (fuentes, tamaños) que en modelos Flash anteriores; aún imperfecto en párrafos largos/texto muy pequeño.
- Edición multientrada y flujos multivueltas: Sólida compatibilidad para combinar varias imágenes como entradas y realizar ediciones iterativas a lo largo de varias vueltas.
📊 Rendimiento en benchmarks — Generación y edición de imágenes (puntuaciones Elo)
| Capacidad | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| Texto a imagen — Preferencia general | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| Texto a imagen — Calidad visual | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| Texto a imagen — Infografías (factualidad) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| Edición — General | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| Edición — Personajes | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| Edición — Creativa | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| Edición — Objeto/Entorno | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| Edición — Entrada múltiple | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| Edición — Estilización | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
Conclusiones clave de esta tabla de benchmarks:
- En las categorías de generación de texto a imagen y edición de imágenes, Gemini 3.1 Flash Image lidera de forma consistente o iguala las puntuaciones más altas entre los modelos de nivel Flash y muchos modelos de imagen competitivos.
- El modelo muestra resultados especialmente sólidos en los benchmarks de Calidad visual e Infografías (factualidad), lo que indica que destaca no solo en calidad estética, sino también en renderizar contenido estructuralmente preciso.
- En edición con entrada múltiple, Nano Banana 2 también muestra una generalización robusta, con puntuaciones superiores a su generación Flash anterior.
Estas evaluaciones se realizan mediante comparaciones Elo lado a lado por humanos en un conjunto diverso de benchmarks, reflejando tanto la preferencia como la fidelidad en tareas comunes de generación/edición de imágenes.
Nano Banana 2 vs Nano Banana vs Nano Banana Pro
| Modelo | Posicionamiento | Benchmark representativo/notas |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | Nivel Flash: velocidad + alta calidad visual (2K–4K) | Preferencia general 1079.0 ± 7.0; calidad visual 1140 ± 6.0 (GenAI-Bench interno). |
| Gemini 2.5 Flash Image (Nano Banana) | Versión Flash anterior (menor fidelidad) | Ligeramente menores puntuaciones de preferencia/calidad visual frente a 3.1. |
| Gemini 3 Pro Image (Nano Banana Pro) | Nivel Pro: mayor fidelidad percibida en tareas complejas, mayor costo/latencia | Compromisos diferentes; algunas métricas muestran clasificaciones relativas distintas en tareas especializadas. |
| GPT-Image 1.5 / otros modelos comerciales | Competidores (abiertos/cerrados) | En benchmarks internos de Google, GPT-Image y otros quedaron por debajo de Gemini 3.1 en calidad visual y preferencia general en la evaluación reportada. Comparaciones independientes de terceros varían. |
Cuándo elegir Flash Image Preview:
- Vista previa de imagen en tiempo real en aplicaciones
- Generación de imágenes a gran escala sensible a los costos
- Asistentes de diseño interactivos
Cómo acceder e integrar Nano Banana 2
Paso 1: Regístrate para obtener la clave de API
Inicia sesión en cometapi.com. Si aún no eres usuario, regístrate primero. Inicia sesión en tu Consola de CometAPI. Obtén la credencial de acceso (API key) de la interfaz. Haz clic en “Add Token” en el token de API del centro personal, obtén la clave de token: sk-xxxxx y envíala.
Paso 2: Envía solicitudes a la API de Nano Banana 2
Selecciona el endpoint “gemini-3.1-flash-image-preview8” para enviar la solicitud de API y configura el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API de nuestro sitio web. Nuestro sitio web también ofrece pruebas en Apifox para tu comodidad. Reemplaza <YOUR_API_KEY> por tu clave de CometAPI real de tu cuenta. Dónde invocarlo: Gemini genera imagen
Nano Banana 2 admite edición de imágenes, generación de imágenes y flujos de trabajo con múltiples imágenes. Para la edición de imágenes, debes proporcionar la URL de la imagen. Para más parámetros, consulta la documentación.
Paso 3: Recupera y verifica los resultados
Procesa la respuesta de la API para obtener el resultado generado. Tras el procesamiento, la API devuelve el estado de la tarea y los datos de salida. Puedes descargar directamente la imagen en tu equipo desde el playground (normalmente en formato PNG). En el proceso de la API se genera una URL de imagen; descárgala a la brevedad.



