Especificações técnicas do Gemini 3.5 Flash
| Item | Gemini 3.5 Flash |
|---|---|
| Fornecedor | |
| Família do modelo | Gemini 3.5 |
| ID oficial do modelo | gemini-3.5-flash |
| Tipos de entrada | Texto, imagem, vídeo, áudio, PDF |
| Tipos de saída | Texto |
| Janela de contexto | 1 milhão de tokens |
| Máximo de tokens de saída | ~65K tokens de saída |
| Principais pontos fortes | Fluxos de trabalho orientados a agentes, programação, raciocínio multimodal |
| Suporte a ferramentas | Chamadas de função, execução de código, fundamentação por pesquisa, saídas estruturadas, contexto de URL, pesquisa de arquivos |
| Suporte ao raciocínio | Níveis de raciocínio ajustáveis |
| Framework de segurança | Google Frontier Safety Framework |
O que é o Gemini 3.5 Flash?
O Google Gemini 3.5 Flash é o principal modelo multimodal de alto desempenho da Google, otimizado para execução orientada a agentes, programação e fluxos de trabalho de longo prazo. Ele estende a série Gemini Flash com capacidades substancialmente mais fortes de raciocínio e engenharia de software, mantendo características de inferência de baixa latência.
Ao contrário dos modelos Flash anteriores, focados principalmente em inferência leve, o Gemini 3.5 Flash foi projetado para agentes de IA persistentes, sistemas de programação de múltiplas etapas e pipelines de automação corporativa. A Google o posiciona como seu modelo mais forte do nível Flash orientado a agentes até o momento.
Principais recursos do Gemini 3.5 Flash
- Suporte a contexto longo de 1M tokens: lida com repositórios extremamente grandes, documentação extensa, PDFs, transcrições e fluxos de trabalho multissessão em um único contexto de prompt.
- Execução orientada a agentes robusta: otimizado para fluxos de trabalho autônomos de múltiplas etapas, orquestração de ferramentas, tarefas de terminal e agentes de IA de longa execução.
- Desempenho avançado em programação: supera o Gemini 3.1 Pro em diversos benchmarks de programação e agentivos, incluindo Terminal-Bench e MCP Atlas.
- Raciocínio multimodal nativo: aceita texto, imagens, áudio, vídeo e PDFs para tarefas de raciocínio unificado.
- Ferramentas em nível de produção: oferece suporte a saídas estruturadas, chamadas de função, execução de código, fundamentação com Google Search e Google Maps e pesquisa de arquivos.
- Modos de raciocínio configuráveis: os desenvolvedores podem ajustar a latência versus a profundidade de raciocínio usando controles de nível de pensamento.
Desempenho em benchmarks do Gemini 3.5 Flash
Resultados de benchmark reportados pela Google posicionam o Gemini 3.5 Flash entre os modelos mais fortes do nível Flash orientado a agentes atualmente disponíveis:
| Benchmark | Gemini 3.5 Flash |
|---|---|
| Terminal-Bench 2.1 | 76.2% |
| GDPval-AA | 1656 Elo |
| MCP Atlas | 83.6% |
| CharXiv Reasoning | 84.2% |
Essas pontuações indicam ganhos significativos em execução autônoma, raciocínio multimodal e confiabilidade em engenharia de software em comparação com variantes anteriores do Gemini Flash.
Gemini 3.5 Flash vs outros modelos
| Capacidade | Gemini 3.5 Flash | Gemini 3.1 Pro | Claude Sonnet 4 |
|---|---|---|---|
| Janela de contexto | 1M tokens | Contexto amplo | Contexto amplo |
| Fluxos de trabalho orientados a agentes | Excelente | Forte | Forte |
| Desempenho em programação | Muito forte | Forte | Excelente |
| Velocidade de inferência | Latência Flash otimizada | Mais lento | Moderada |
| Entradas multimodais | Multimodal nativo | Multimodal nativo | Visão + texto |
| Ecossistema de ferramentas | Ferramentas Google abrangentes | Abrangente | Ferramentas de API robustas |
Principais diferenças
- vs Gemini 3.1 Pro: o Gemini 3.5 Flash oferece melhor programação e execução autônoma de tarefas, mantendo inferência significativamente mais rápida.
- vs Claude Sonnet 4: o Claude frequentemente se mantém mais forte em raciocínio nuançado de longo formato e qualidade de escrita, enquanto o Gemini 3.5 Flash enfatiza velocidade, execução por agentes e integração ao ecossistema Google.
- vs modelos de raciocínio da série GPT: o Gemini 3.5 Flash é particularmente competitivo em fluxos de trabalho de agentes multimodais e orquestração de contexto amplo, especialmente para casos de uso de automação corporativa.
Limitações conhecidas do Gemini 3.5 Flash
- Atualmente não oferece suporte nativo para geração de imagens ou áudio como saída.
- APIs de conversação em tempo real não são compatíveis neste nível de modelo.
- Benchmarks da comunidade mostram desempenho misto em certas tarefas de avaliação especializadas, especialmente fluxos de trabalho de nicho com forte dependência de visão.
Como acessar a API do Gemini 3.5 Flash
Etapa 1: Obter acesso à API
Faça login no cometAPI. Se você ainda não é nosso usuário, registre-se primeiro. Acesse seu console do CometAPI. Obtenha a chave de API de credencial de acesso da interface. Clique em “Add Token” no token de API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.

Etapa 2: Enviar solicitações para a API do Gemini 3.5 Flash
Selecione o endpoint “` gemini-3.5-flash” para enviar a solicitação de API e defina o corpo da solicitação. O método e o corpo da solicitação são obtidos na documentação de API do nosso site. Nosso site também fornece teste no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave CometAPI real da sua conta. A URL base é Gemini Generating Content
Insira sua pergunta ou solicitação no campo content — é a isso que o modelo responderá. Processe a resposta da API para obter a resposta gerada.
Etapa 3: Processar respostas
A API retorna respostas de candidatos estruturadas, incluindo texto gerado, citações, metadados de segurança e saídas de ferramentas opcionais.