Especificaciones técnicas de Gemini 3.5 Flash
| Elemento | Gemini 3.5 Flash |
|---|---|
| Proveedor | |
| Familia de modelos | Gemini 3.5 |
| ID de modelo oficial | gemini-3.5-flash |
| Tipos de entrada | Texto, imagen, video, audio, PDF |
| Tipos de salida | Texto |
| Ventana de contexto | 1 millón de tokens |
| Máximo de tokens de salida | ~65K tokens de salida |
| Puntos fuertes principales | Flujos de trabajo agentivos, programación, razonamiento multimodal |
| Compatibilidad con herramientas | Llamada de funciones, ejecución de código, grounding de búsqueda, salidas estructuradas, contexto por URL, búsqueda de archivos |
| Soporte para el razonamiento | Niveles de pensamiento/razonamiento ajustables |
| Marco de seguridad | Google Frontier Safety Framework |
¿Qué es Gemini 3.5 Flash?
Google Gemini 3.5 Flash es el modelo insignia de alta velocidad para razonamiento multimodal de Google, optimizado para la ejecución agentiva, la programación y los flujos de trabajo de largo horizonte. Amplía la serie Gemini Flash con capacidades de razonamiento e ingeniería de software sustancialmente más sólidas, manteniendo características de inferencia de baja latencia.
A diferencia de los modelos Flash anteriores, centrados principalmente en la inferencia ligera, Gemini 3.5 Flash está diseñado para agentes de IA persistentes, sistemas de programación de múltiples pasos y pipelines de automatización empresarial. Google lo posiciona como su modelo agentivo de nivel Flash más potente hasta la fecha.
Características principales de Gemini 3.5 Flash
- 1M token long-context support: Gestiona repositorios extremadamente grandes, documentación extensa, PDFs, transcripciones y flujos de trabajo multisessión en un único contexto de prompt.
- Ejecución agentiva sólida: Optimizado para flujos de trabajo autónomos de múltiples pasos, orquestación de herramientas, tareas de terminal y agentes de IA de larga ejecución.
- Rendimiento avanzado en programación: Supera a Gemini 3.1 Pro en varios benchmarks de programación y agentivos, incluidos Terminal-Bench y MCP Atlas.
- Razonamiento multimodal nativo: Acepta texto, imágenes, audio, video y PDFs para tareas de razonamiento unificadas.
- Herramientas de nivel producción: Admite salidas estructuradas, llamada de funciones, ejecución de código, grounding con Google Search y Maps, y búsqueda de archivos.
- Modos de razonamiento/pensamiento configurables: Los desarrolladores pueden ajustar la latencia frente a la profundidad de razonamiento mediante controles de nivel de pensamiento.
Rendimiento en benchmarks de Gemini 3.5 Flash
Los resultados de benchmarks reportados por Google sitúan a Gemini 3.5 Flash entre los modelos agentivos de nivel Flash más potentes disponibles actualmente:
| Benchmark | Gemini 3.5 Flash |
|---|---|
| Terminal-Bench 2.1 | 76.2% |
| GDPval-AA | 1656 Elo |
| MCP Atlas | 83.6% |
| CharXiv Reasoning | 84.2% |
Estas puntuaciones indican importantes avances en ejecución autónoma, razonamiento multimodal y fiabilidad en ingeniería de software frente a variantes anteriores de Gemini Flash.
Gemini 3.5 Flash frente a otros modelos
| Capacidad | Gemini 3.5 Flash | Gemini 3.1 Pro | Claude Sonnet 4 |
|---|---|---|---|
| Ventana de contexto | 1M tokens | Contexto amplio | Contexto amplio |
| Flujos de trabajo agentivos | Excelente | Sólido | Sólido |
| Rendimiento en programación | Muy sólido | Sólido | Excelente |
| Velocidad de inferencia | Latencia de Flash optimizada | Más lenta | Moderada |
| Entradas multimodales | Multimodal nativo | Multimodal nativo | Visión + texto |
| Ecosistema de herramientas | Amplias herramientas de Google | Extenso | Conjunto de herramientas de API sólido |
Diferencias clave
- vs Gemini 3.1 Pro: Gemini 3.5 Flash ofrece mejor programación y ejecución autónoma de tareas, manteniendo una inferencia significativamente más rápida.
- vs Claude Sonnet 4: Claude suele ser más fuerte en razonamiento matizado de formato largo y calidad de escritura, mientras que Gemini 3.5 Flash enfatiza la velocidad, la ejecución agentiva y la integración con el ecosistema de Google.
- vs modelos de razonamiento de la serie GPT: Gemini 3.5 Flash es especialmente competitivo en flujos de trabajo agentivos multimodales y orquestación de gran contexto, especialmente para casos de uso de automatización empresarial.
Limitaciones conocidas de Gemini 3.5 Flash
- Actualmente no admite salidas nativas de generación de imágenes ni de audio.
- Las API de conversación en vivo no están admitidas en este nivel de modelo.
- Los benchmarks de la comunidad muestran un rendimiento mixto en ciertas tareas de evaluación especializadas, especialmente en flujos de trabajo de nicho muy centrados en visión.
Cómo acceder a la API de Gemini 3.5 Flash
Paso 1: Obtener acceso a la API
Inicie sesión en cometAPI. Si aún no es usuario, regístrese primero. Inicie sesión en su consola de CometAPI. Obtenga la credencial de acceso API key de la interfaz. Haga clic en “Add Token” en el token de API del centro personal, obtenga la clave del token: sk-xxxxx y envíe.

Paso 2: Enviar solicitudes a la API de Gemini 3.5 Flash
Seleccione el “` gemini-3.5-flash” endpoint para enviar la solicitud a la API y establezca el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de la API de nuestro sitio web. Nuestro sitio también proporciona pruebas en Apifox para su conveniencia. Reemplace <YOUR_API_KEY> por su clave real de CometAPI de su cuenta. base url es Gemini Generating Content
Inserte su pregunta o solicitud en el campo content —esto es a lo que responderá el modelo—. Procese la respuesta de la API para obtener la respuesta generada.
Paso 3: Procesar las respuestas
La API devuelve respuestas de candidatos estructuradas, incluidas texto generado, citas, metadatos de seguridad y salidas opcionales de herramientas.