Especificações técnicas — Gemini 3.1 Pro
| Item | gemini-3-pro (resumo público) |
|---|---|
| Provedor | |
| ID canônico do modelo | gemini-3-pro (prévia pública) |
| Tipos de entrada | Texto, Imagem, Vídeo, Áudio, PDF |
| Tipos de saída | Texto (linguagem natural, saídas estruturadas, payloads de chamadas de função) |
| Limite de tokens de entrada (contexto) | 1,048,576 tokens |
| Limite de tokens de saída | 65,536 tokens |
| Chamadas de função/uso de ferramentas | Suportado (chamadas de função, saídas estruturadas, integrações com ferramentas) |
| Multimodalidade | Suporte multimodal completo (imagens, vídeo, áudio, documentos) |
| Execução de código e fluxos baseados em agentes | Suportado (modo agente, assistência a código, orquestração de ferramentas) |
| Data de corte do conhecimento | janeiro de 2025 |
O que é o Gemini 3.1 Pro?
Gemini 3.1 Pro é o carro-chefe público da família Gemini 3 do Google, posicionado como um modelo multimodal de raciocínio de última geração com ferramentas avançadas para agentes e desenvolvedores. O modelo enfatiza o tratamento de contexto de alta capacidade (entradas acima de 1M tokens), amplo suporte a mídias (imagens, vídeo, áudio, PDF) e integrações profundas para uso de ferramentas, chamadas de função e fluxos de trabalho centrados em código (p. ex., Gemini Code Assist e modos de agente).
Gemini 3 Pro é apresentado pelo Google como otimizado tanto para experiências interativas de desenvolvedores (codificação de baixa latência e fluxos de trabalho de agentes) quanto para compreensão multimodal de alta fidelidade (interpretação e raciocínio em entradas de mídia mista).
Principais recursos do Gemini 3.1 Pro
Gemini-3.1 Pro (em sua Prévia) introduz os seguintes recursos:
Integração multimodal
Processa entradas em:
- Linguagem natural
- Imagens
- Fala/áudio
- Vídeo
com uma representação unificada de tokens para raciocínio entre modalidades.
Janela de contexto estendida
Uma capacidade de contexto excepcionalmente grande, de até ~1 milhão de tokens, permite lidar com:
- Documentos longos
- Síntese de múltiplos documentos
- Bases de código e transcrições.
Isso supera muitos modelos concorrentes, que normalmente oferecem suporte a ~32 K–262 K tokens.
Escalonamento com Mixture-of-Experts (MoE) esparso
O roteamento MoE esparso permite escalar a capacidade interna do modelo sem custos de computação proporcionais, melhorando o raciocínio em escala.
Raciocínio/planejamento avançados
Inovações como treinamento com cadeia de raciocínio, aprendizado por reforço com feedback humano e benchmarks especializados o tornam forte em tarefas lógicas e matemáticas.
Benchmarks supostos:
AIME 2025: 100% (com execução de código)
SWE-Bench Verified: 83.9%
ARC-AGI-2: 71.8%
LiveCodeBench Pro: 2844 Elo
Terminal-Bench 2.0: 63.5%
MMMLU: 93.6%
Casos de uso empresariais representativos
- Pipelines de mídia de ponta a ponta: ingerir vídeo, transcrição e imagens para produzir, em escala, resumos sincronizados, metadados e insights estruturados.
- Geração e revisão de código em larga escala: uso em IDEs e pipelines de CI para gerar código automaticamente, refatorar projetos com múltiplos arquivos e produzir sugestões de testes em grandes bases de código.
- Automação baseada em agentes: coordenar agentes com múltiplas ferramentas que interagem com serviços de nuvem, sistemas de orquestração e APIs internas usando chamadas de função estruturadas.
- Pesquisa e produção de conteúdo: redigir conteúdo de fôlego (relatórios, livros) que combine texto e multimídia incorporada, preservando as referências cruzadas internas.
Como acessar a API do Gemini 3.1 Pro
Etapa 1: Inscreva-se para obter a chave de API
Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Acesse seu console do CometAPI. Obtenha a chave de API da credencial de acesso da interface. Clique em “Add Token” no token de API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.
Etapa 2: Envie solicitações para a API do Gemini 3.1 Pro
Selecione o endpoint “gemini-3.1-pro” para enviar a solicitação de API e definir o corpo da solicitação. O método de solicitação e o corpo da solicitação são obtidos na documentação da API em nosso site. Nosso site também fornece teste no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave CometAPI real da sua conta. A URL base é Geração de conteúdo do Gemini e Chat.
Insira sua pergunta ou solicitação no campo content — é a isso que o modelo responderá. Processe a resposta da API para obter a resposta gerada.
Etapa 3: Recuperar e verificar os resultados
Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.
Veja também API do Gemini 3 Pro