Especificações técnicas do Gemini 3.5 Flash
| Item | Gemini 3.5 Flash |
|---|---|
| Provider | |
| Model family | Gemini 3.5 |
| Official model ID | gemini-3.5-flash |
| Input types | Texto, imagem, vídeo, áudio, PDF |
| Output types | Texto |
| Context window | 1 milhão de tokens |
| Max output tokens | ~65K tokens de saída |
| Primary strengths | Fluxos de trabalho orientados a agentes, programação, raciocínio multimodal |
| Tool support | Chamada de funções, execução de código, fundamentação via pesquisa, saídas estruturadas, contexto de URL, busca de arquivos |
| Thinking support | Níveis de pensamento/raciocínio ajustáveis |
| Safety framework | Google Frontier Safety Framework |
O que é o Gemini 3.5 Flash?
Google Gemini 3.5 Flash é o modelo de raciocínio multimodal de alta velocidade carro-chefe do Google, otimizado para execução orientada a agentes, programação e fluxos de trabalho de longo horizonte. Ele estende a série Gemini Flash com capacidades substancialmente mais fortes de raciocínio e engenharia de software, mantendo características de inferência de baixa latência.
Ao contrário dos modelos Flash anteriores, focados principalmente em inferência leve, o Gemini 3.5 Flash foi projetado para agentes de IA persistentes, sistemas de programação em múltiplas etapas e pipelines de automação corporativa. O Google o posiciona como seu modelo mais forte orientado a agentes na camada Flash até o momento.
Principais recursos do Gemini 3.5 Flash
- Suporte a contexto longo de 1M tokens: Lida com repositórios extremamente grandes, documentação extensa, PDFs, transcrições e fluxos de trabalho multi-sessão em um único contexto de prompt.
- Execução orientada a agentes robusta: Otimizado para fluxos de trabalho autônomos em múltiplas etapas, orquestração de ferramentas, tarefas de terminal e agentes de IA de longa execução.
- Desempenho avançado em programação: Supera o Gemini 3.1 Pro em vários benchmarks de programação e agentic, incluindo Terminal-Bench e MCP Atlas.
- Raciocínio multimodal nativo: Aceita texto, imagens, áudio, vídeo e PDFs para tarefas de raciocínio unificado.
- Ferramentas em nível de produção: Suporta saídas estruturadas, chamada de funções, execução de código, grounding com Google Search e Maps e busca de arquivos.
- Modos de raciocínio/pensamento configuráveis: Desenvolvedores podem ajustar a latência versus a profundidade de raciocínio usando controles de nível de pensamento.
Desempenho em benchmarks do Gemini 3.5 Flash
Resultados de benchmarks reportados pelo Google posicionam o Gemini 3.5 Flash entre os modelos mais fortes na camada Flash orientada a agentes atualmente disponíveis:
| Benchmark | Gemini 3.5 Flash |
|---|---|
| Terminal-Bench 2.1 | 76.2% |
| GDPval-AA | 1656 Elo |
| MCP Atlas | 83.6% |
| CharXiv Reasoning | 84.2% |
Essas pontuações indicam ganhos significativos em execução autônoma, raciocínio multimodal e confiabilidade em engenharia de software em comparação com variantes anteriores do Gemini Flash.
Gemini 3.5 Flash vs. outros modelos
| Capacidade | Gemini 3.5 Flash | Gemini 3.1 Pro | Claude Sonnet 4 |
|---|---|---|---|
| Context window | 1M tokens | Large-context | Large-context |
| Agentic workflows | Excelente | Forte | Forte |
| Coding performance | Muito forte | Forte | Excelente |
| Inference speed | Latência otimizada do Flash | Mais lenta | Moderada |
| Multimodal inputs | Multimodal nativo | Multimodal nativo | Visão + texto |
| Tool ecosystem | Ferramentas Google extensas | Extenso | Ferramentas de API robustas |
Principais diferenças
- vs Gemini 3.1 Pro: Gemini 3.5 Flash oferece melhor programação e execução autônoma de tarefas, mantendo inferência significativamente mais rápida.
- vs Claude Sonnet 4: Claude costuma ser mais forte em raciocínio sutil de textos longos e qualidade de escrita, enquanto o Gemini 3.5 Flash enfatiza velocidade, execução por agentes e integração ao ecossistema Google.
- vs GPT-series reasoning models: Gemini 3.5 Flash é particularmente competitivo em fluxos de trabalho multimodais com agentes e orquestração de grande contexto, especialmente para casos de uso de automação corporativa.
Limitações conhecidas do Gemini 3.5 Flash
- Atualmente não suporta saídas nativas de geração de imagem ou áudio.
- APIs de conversa ao vivo não são suportadas neste nível de modelo.
- Benchmarks da comunidade mostram desempenho misto em algumas tarefas de avaliação especializadas, especialmente fluxos de trabalho de nicho fortemente baseados em visão.
Como acessar a API do Gemini 3.5 Flash
Etapa 1: Obter acesso à API
Faça login no cometAPI. Se você ainda não é nosso usuário, registre-se primeiro. Entre no seu CometAPI console. Obtenha a chave de API de credenciais de acesso da interface. Clique em “Add Token” no token de API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.

Etapa 2: Enviar solicitações para a API do Gemini 3.5 Flash
Selecione o endpoint “` gemini-3.5-flash” para enviar a solicitação de API e defina o corpo da solicitação. O método e o corpo da solicitação são obtidos na documentação de API do nosso site. Nosso site também oferece teste no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave real do CometAPI da sua conta. A URL base é Gemini Generating Content
Insira sua pergunta ou solicitação no campo content — é isso que o modelo responderá. Processe a resposta da API para obter a resposta gerada.
Etapa 3: Processar respostas
A API retorna respostas candidatas estruturadas, incluindo texto gerado, citações, metadados de segurança e saídas opcionais de ferramentas.