Especificaciones técnicas de Gemini 3.1 Flash Image Preview
| Elemento | Gemini 3.1 Flash Image Preview |
|---|---|
| Proveedor | |
| Familia de modelos | Gemini 3.1 (nivel Flash) |
| Enfoque principal | Generación multimodal rápida con vista previa |
| Tipos de entrada | Texto, Imagen |
| Tipos de salida | Texto, Imagen (generación de vista previa) |
| Ventana de contexto | Hasta 1M tokens (estándar del nivel Flash de Gemini 3.x) |
| Nivel de latencia | Baja latencia, alto rendimiento |
| Soporte de streaming | Sí |
| Llamada a herramientas | Sí (framework de herramientas de la API de Gemini) |
| Versión | 3.1 |
Qué es Nano Banana 2
Nano Banana 2 es el apodo popular utilizado por la prensa y la comunidad de desarrolladores para el modelo recién lanzado Gemini-3.1-Flash-Image. Google lo posiciona como el motor de imágenes del nivel “Flash” que ofrece una fidelidad visual casi profesional a un nivel de latencia y costo mucho más bajos, adecuado para generación de alto volumen, edición iterativa rápida y flujos de trabajo de producto integrados en servicios de Google. Hereda el razonamiento multimodal de Gemini 3.1 y añade capacidades centradas en imágenes (texto legible en imágenes, composición multiimagen, soporte de relaciones de aspecto amplias, 4K nativo).
Características principales
- Generación de alta velocidad y multirresolución: Velocidad del nivel Flash con opciones de salida 0.5K / 1K / 2K / 4K y nuevas relaciones de aspecto extremas (1:4, 4:1, 1:8, 8:1).
- Aterrizaje web en tiempo real: Integra resultados de búsqueda de texto e imagen para fundamentar el contenido generado en información web actual cuando “Thinking” o el aterrizaje de búsqueda está habilitado. Útil para referencias actualizadas e infografías fácticas.
- Renderizado de texto mejorado: Mejor renderizado de textos cortos y gráficos (fuentes, tamaños) que los modelos Flash anteriores; aún imperfecto en párrafos largos/texto pequeño.
- Edición multi-entrada y flujos multiconversación: Sólido soporte para combinar varias imágenes como entradas y para ediciones iterativas a lo largo de varias interacciones.
📊 Rendimiento en benchmarks — Generación y edición de imágenes (puntuaciones Elo)
| Capacidad | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| Texto a imagen — Preferencia global | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| Texto a imagen — Calidad visual | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| Texto a imagen — Infografías (factualidad) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| Edición — General | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| Edición — Personaje | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| Edición — Creativa | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| Edición — Objeto/Entorno | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| Edición — Entrada múltiple | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| Edición — Estilización | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
Conclusiones clave de esta tabla de benchmarks:
- En las categorías de generación de texto a imagen y edición de imágenes, Gemini 3.1 Flash Image lidera o iguala consistentemente las puntuaciones más altas entre el nivel Flash y muchos modelos de imagen competitivos.
- El modelo muestra resultados especialmente sólidos en los benchmarks de Calidad visual e Infografías (factualidad), lo que indica que destaca no solo en calidad estética sino también en la representación exacta y estructurada del contenido.
- En edición con entrada múltiple, Nano Banana 2 también muestra una generalización robusta, con puntuaciones superiores a su generación Flash anterior.
Estas evaluaciones se realizan mediante comparaciones Elo lado a lado por humanos en un conjunto diverso de benchmarks, reflejando tanto la preferencia como la fidelidad en tareas comunes de generación/edición de imágenes.
Nano Banana 2 vs Nano Banana vs Nano Banana Pro
| Modelo | Posicionamiento | Benchmark representativo/notas |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | Nivel Flash: velocidad + alta calidad visual (2K–4K) | Preferencia global 1079.0 ± 7.0; calidad visual 1140 ± 6.0 (GenAI-Bench interno). |
| Gemini 2.5 Flash Image (Nano Banana) | Publicación Flash anterior (menor fidelidad) | Puntuaciones de preferencia/calidad ligeramente inferiores frente a 3.1. |
| Gemini 3 Pro Image (Nano Banana Pro) | Nivel Pro: mayor fidelidad percibida para tareas complejas, mayor costo/latencia | Diferentes compensaciones; algunas métricas muestran clasificaciones relativas distintas en tareas de especialidad. |
| GPT-Image 1.5 / otros modelos comerciales | Competidores (abiertos/cerrados) | En benchmarks internos de Google, GPT-Image y otros obtuvieron puntuaciones inferiores a Gemini 3.1 en calidad visual y preferencia global en la evaluación reportada. Comparaciones independientes de terceros varían. |
Cuándo elegir Flash Image Preview:
- Previsualización de imágenes en tiempo real en apps
- Generación de imágenes a gran escala sensible al coste
- Asistentes de diseño interactivos
Cómo acceder e integrar Nano Banana 2
Paso 1: Regístrate para obtener la clave de API
Inicia sesión en cometapi.com. Si aún no eres nuestro usuario, regístrate primero. Inicia sesión en tu Consola de CometAPI. Obtén la clave de API de acceso a la interfaz. Haz clic en “Add Token” en el API token del centro personal, obtén la clave del token: sk-xxxxx y envíala.
Paso 2: Envía solicitudes a la API de Nano Banana 2
Selecciona el endpoint “gemini-3.1-flash-image-preview8” para enviar la solicitud de API y configura el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API de nuestro sitio web. Nuestro sitio también ofrece pruebas en Apifox para tu comodidad. Reemplaza <YOUR_API_KEY> con tu clave real de CometAPI de tu cuenta. Dónde llamarlo: Gemini genera imágenes
Nano Banana 2 admite edición de imágenes, generación de imágenes y flujos de trabajo con múltiples imágenes. Para la edición de imágenes, debes proporcionar la URL de la imagen. Para más parámetros, consulta la documentación.
Paso 3: Recupera y verifica los resultados
Procesa la respuesta de la API para obtener el resultado generado. Tras el procesamiento, la API responde con el estado de la tarea y los datos de salida. Puedes descargar directamente la imagen a tu máquina local en el playground (normalmente en formato PNG). Se genera una URL de imagen en el proceso de la API; descárgala lo antes posible.