Especificaciones técnicas de Gemini 3.5 Flash
| Elemento | Gemini 3.5 Flash |
|---|---|
| Proveedor | |
| Familia del modelo | Gemini 3.5 |
| ID oficial del modelo | gemini-3.5-flash |
| Tipos de entrada | Texto, imagen, video, audio, PDF |
| Tipos de salida | Texto |
| Ventana de contexto | 1 millón de tokens |
| Máximo de tokens de salida | ~65K tokens de salida |
| Fortalezas principales | Flujos de trabajo basados en agentes, programación, razonamiento multimodal |
| Compatibilidad con herramientas | Llamadas a funciones, ejecución de código, fundamentación con búsquedas, salidas estructuradas, contexto de URL, búsqueda de archivos |
| Compatibilidad para el razonamiento | Niveles ajustables de pensamiento/razonamiento |
| Marco de seguridad | Google Frontier Safety Framework |
¿Qué es Gemini 3.5 Flash?
Google Gemini 3.5 Flash es el modelo insignia de razonamiento multimodal de alta velocidad de Google, optimizado para ejecución basada en agentes, programación y flujos de trabajo de largo alcance. Amplía la serie Gemini Flash con capacidades de razonamiento y de ingeniería de software sustancialmente más sólidas, manteniendo características de inferencia de baja latencia.
A diferencia de los modelos Flash anteriores, centrados principalmente en la inferencia ligera, Gemini 3.5 Flash está diseñado para agentes de IA persistentes, sistemas de programación de varios pasos y canalizaciones de automatización empresarial. Google lo posiciona como su modelo del nivel Flash con mayor capacidad de agentes hasta la fecha.
Características principales de Gemini 3.5 Flash
- Compatibilidad con contexto largo de 1M tokens: Maneja repositorios extremadamente grandes, documentación extensa, PDFs, transcripciones y flujos de trabajo de múltiples sesiones en un solo contexto de prompt.
- Ejecución sólida basada en agentes: Optimizado para flujos de trabajo autónomos de varios pasos, orquestación de herramientas, tareas de terminal y agentes de IA de larga ejecución.
- Rendimiento avanzado en programación: Supera a Gemini 3.1 Pro en varios benchmarks de programación y de agentes, incluidos Terminal-Bench y MCP Atlas.
- Razonamiento multimodal nativo: Acepta texto, imágenes, audio, video y PDFs para tareas de razonamiento unificado.
- Herramientas de nivel de producción: Admite salidas estructuradas, llamadas a funciones, ejecución de código, anclaje mediante Google Search y Maps y búsqueda de archivos.
- Modos de razonamiento/pensamiento configurables: Los desarrolladores pueden ajustar la latencia frente a la profundidad de razonamiento mediante controles de nivel de pensamiento.
Rendimiento en benchmarks de Gemini 3.5 Flash
Los resultados de benchmarks reportados por Google sitúan a Gemini 3.5 Flash entre los modelos de nivel Flash con mayor capacidad de agentes disponibles actualmente:
| Benchmark | Gemini 3.5 Flash |
|---|---|
| Terminal-Bench 2.1 | 76.2% |
| GDPval-AA | 1656 Elo |
| MCP Atlas | 83.6% |
| CharXiv Reasoning | 84.2% |
Estas puntuaciones indican importantes avances en ejecución autónoma, razonamiento multimodal y fiabilidad en ingeniería de software en comparación con variantes anteriores de Gemini Flash.
Gemini 3.5 Flash frente a otros modelos
| Capacidad | Gemini 3.5 Flash | Gemini 3.1 Pro | Claude Sonnet 4 |
|---|---|---|---|
| Ventana de contexto | 1M tokens | Gran contexto | Gran contexto |
| Flujos de trabajo basados en agentes | Excelente | Sólido | Sólido |
| Rendimiento en programación | Muy sólido | Sólido | Excelente |
| Velocidad de inferencia | Latencia Flash optimizada | Más lento | Moderada |
| Entradas multimodales | Multimodal nativo | Multimodal nativo | Visión + texto |
| Ecosistema de herramientas | Amplio conjunto de herramientas de Google | Amplio | Sólido conjunto de herramientas de API |
Diferencias clave
- vs Gemini 3.1 Pro: Gemini 3.5 Flash ofrece mejor programación y ejecución autónoma de tareas, manteniendo una inferencia significativamente más rápida.
- vs Claude Sonnet 4: Claude a menudo sigue siendo más fuerte en razonamiento matizado de formato largo y calidad de redacción, mientras que Gemini 3.5 Flash enfatiza la velocidad, la ejecución basada en agentes y la integración con el ecosistema de Google.
- vs modelos de razonamiento de la serie GPT: Gemini 3.5 Flash es particularmente competitivo en flujos de trabajo multimodales basados en agentes y orquestación de contextos grandes, especialmente para casos de uso de automatización empresarial.
Limitaciones conocidas de Gemini 3.5 Flash
- Actualmente no admite salidas nativas de generación de imágenes o audio.
- Las API de conversación en vivo no están disponibles en este nivel de modelo.
- Los benchmarks de la comunidad muestran un rendimiento mixto en ciertas tareas de evaluación especializadas, especialmente en flujos de trabajo de nicho con alta carga de visión
Cómo acceder a la API de Gemini 3.5 Flash
Paso 1: Obtener acceso a la API
Inicia sesión en cometAPI. Si aún no eres usuario, regístrate primero. Inicia sesión en tu Consola de CometAPI. Obtén la clave de API de credenciales de acceso de la interfaz. Haz clic en “Add Token” en el token de la API en el centro personal, obtén la clave del token: sk-xxxxx y envía.

Paso 2: Enviar solicitudes a la API de Gemini 3.5 Flash
Selecciona el endpoint “` gemini-3.5-flash” para enviar la solicitud a la API y configura el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API en nuestro sitio web. Nuestro sitio web también proporciona pruebas en Apifox para tu comodidad. Reemplaza <YOUR_API_KEY> con tu clave real de CometAPI de tu cuenta. La URL base es Gemini Generating Content
Inserta tu pregunta o solicitud en el campo content—esto es a lo que responderá el modelo. Procesa la respuesta de la API para obtener la respuesta generada.
Paso 3: Procesar las respuestas
La API devuelve respuestas candidatas estructuradas que incluyen texto generado, citas, metadatos de seguridad y salidas opcionales de herramientas.