ModelosPreçosEmpresarial
500+ APIs de Modelos de IA, Tudo em Uma API. Apenas na CometAPI
API de Modelos
Desenvolvedor
Início RápidoDocumentaçãoPainel de API
Empresa
Sobre nósEmpresarial
Recursos
Modelos de IABlogRegistro de AlteraçõesSuporte
Termos de ServiçoPolítica de Privacidade
© 2026 CometAPI · All rights reserved
Home/Models/xAI/Grok 4 Fast
X

Grok 4 Fast

Entrada:$0.16/M
Saída:$0.4/M
Contexto:2M
Saída Máxima:30K
Grok 4 Fast é um novo modelo de inteligência artificial lançado pela xAI, que integra capacidades de inferência e de não inferência em uma única arquitetura. Este modelo possui uma janela de contexto de 2 milhões de tokens e foi projetado para aplicações de alto rendimento, como pesquisa e programação. O modelo oferece duas versões: Grok-4-Fast-Reasoning e Grok-4-Fast-Non-Reasoning, otimizadas para diferentes tarefas.
Novo
Uso comercial
Playground
Visão Geral
Recursos
Preços
API
Versões

Principais recursos (lista rápida)

  • Duas variantes de modelo: grok-4-fast-reasoning e grok-4-fast-non-reasoning (ajustáveis para profundidade vs. velocidade).
  • Janela de contexto muito grande: até 2.000.000 de tokens, permitindo documentos extremamente longos / transcrições de várias horas / fluxos de trabalho com vários documentos.
  • Foco em eficiência de tokens / custo: a xAI relata ~40% menos tokens de raciocínio em média em comparação com o Grok-4 e uma alegada ~98% de redução no custo para atingir o mesmo desempenho de benchmark (nas métricas relatadas pela xAI).
  • Integração nativa de ferramentas / navegação: treinado de ponta a ponta com RL de uso de ferramentas para navegação na web/X, execução de código e comportamentos de busca agêntica.
  • Multimodal e function calling: oferece suporte a imagens e saídas estruturadas; function calling e formatos de resposta estruturados são compatíveis na API.

Detalhes técnicos

Arquitetura de raciocínio unificada: o Grok-4-Fast usa uma única base de pesos de modelo que pode ser direcionada para comportamento de raciocínio (longa cadeia de pensamento) ou sem raciocínio (respostas rápidas) por meio de prompts de sistema ou seleção de variante, em vez de disponibilizar dois modelos de backbone totalmente separados. Isso reduz a latência de alternância e o custo de tokens para cargas de trabalho mistas.

Aprendizado por reforço para densidade de inteligência: a xAI relata o uso de aprendizado por reforço em larga escala focado em densidade de inteligência (maximizar o desempenho por token), que é a base para os ganhos declarados de eficiência de tokens.

Condicionamento por ferramentas e busca agêntica: o Grok-4-Fast foi treinado e avaliado em tarefas que exigem invocação de ferramentas (navegação na web, busca no X, execução de código). O modelo é apresentado como habilidoso em escolher quando chamar ferramentas e como integrar evidências de navegação nas respostas.

Desempenho em benchmarks

Melhorias no BrowseComp (44,9% pass\@1 vs 43,0% para o Grok-4), SimpleQA (95,0% vs 94,0%) e grandes ganhos em certos cenários de navegação/busca em língua chinesa. A xAI também relata uma classificação de topo na Search Arena da LMArena para uma variante grok-4-fast-search.

Casos de uso típicos e recomendados

  • Busca e recuperação de alto throughput — agentes de busca que precisam de raciocínio web multi-hop rápido.
  • Assistentes e bots agênticos — agentes que combinam navegação, execução de código e chamadas assíncronas de ferramentas (quando permitido).
  • Implantações de produção sensíveis a custo — serviços que exigem muitas chamadas e desejam melhor economia de token para utilidade em comparação com um modelo base mais pesado.
  • Experimentação para desenvolvedores — prototipagem de fluxos multimodais ou aumentados pela web que dependem de consultas rápidas e repetidas.
  • Como acessar a API do Grok 4 fast

Etapa 1: Cadastre-se para obter uma chave de API

Faça login em cometapi.com. Se você ainda não for nosso usuário, registre-se primeiro. Entre no seu console do CometAPI. Obtenha a credencial de acesso, a chave de API da interface. Clique em “Add Token” na seção de token de API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.

Etapa 2: Envie solicitações para a API do Grok 4 fast

Selecione o endpoint “\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\” para enviar a solicitação de API e defina o corpo da solicitação. O método de solicitação e o corpo da solicitação podem ser obtidos na documentação da API em nosso site. Nosso site também fornece teste no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave real do CometAPI da sua conta. A base url está no formato Chat (https://api.cometapi.com/v1/chat/completions).

Insira sua pergunta ou solicitação no campo content — é a isso que o modelo responderá. Processe a resposta da API para obter a resposta gerada.

Etapa 3: Recupere e verifique os resultados

Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.

Recursos para Grok 4 Fast

Explore os principais recursos do Grok 4 Fast, projetado para aprimorar o desempenho e a usabilidade. Descubra como essas capacidades podem beneficiar seus projetos e melhorar a experiência do usuário.

Preços para Grok 4 Fast

Explore preços competitivos para Grok 4 Fast, projetado para atender diversos orçamentos e necessidades de uso. Nossos planos flexíveis garantem que você pague apenas pelo que usar, facilitando o dimensionamento conforme suas necessidades crescem. Descubra como Grok 4 Fast pode aprimorar seus projetos mantendo os custos gerenciáveis.
Preço do Comet (USD / M Tokens)Preço Oficial (USD / M Tokens)Desconto
Entrada:$0.16/M
Saída:$0.4/M
Entrada:$0.2/M
Saída:$0.5/M
-20%

Código de exemplo e API para Grok 4 Fast

Acesse código de exemplo abrangente e recursos de API para Grok 4 Fast para otimizar seu processo de integração. Nossa documentação detalhada fornece orientação passo a passo, ajudando você a aproveitar todo o potencial do Grok 4 Fast em seus projetos.
POST
/v1/chat/completions

Versões do Grok 4 Fast

O motivo pelo qual Grok 4 Fast possui múltiplas versões instantâneas pode incluir fatores como variações na saída após atualizações que exigem versões antigas para consistência, fornecendo aos desenvolvedores um período de transição para adaptação e migração, e diferentes versões correspondentes a endpoints globais ou regionais para otimizar a experiência do usuário. Para diferenças detalhadas entre versões, consulte a documentação oficial.

Nomes públicos anunciados pela xAI: grok-4-fast-reasoning e grok-4-fast-non-reasoning. Cada variante informa o mesmo limite de contexto de 2M tokens. A plataforma também continua a hospedar o carro-chefe anterior Grok-4 (por exemplo, variantes grok-4-0709 usadas anteriormente).

Mais modelos

C

Claude Opus 4.7

Entrada:$3/M
Saída:$15/M
O modelo mais inteligente para agentes e programação
A

Claude Sonnet 4.6

Entrada:$2.4/M
Saída:$12/M
Claude Sonnet 4.6 é o nosso modelo Sonnet mais capaz até agora. É uma atualização completa das capacidades do modelo em programação, uso do computador, raciocínio de longo contexto, planejamento de agentes, trabalho de conhecimento e design. Sonnet 4.6 também apresenta uma janela de contexto de 1M tokens em beta.
O

GPT-5.4 nano

Entrada:$0.16/M
Saída:$1/M
O GPT-5.4 nano foi projetado para tarefas em que a velocidade e o custo são os que mais importam, como classificação, extração de dados, ranqueamento e subagentes.
O

GPT-5.4 mini

Entrada:$0.6/M
Saída:$3.6/M
GPT-5.4 mini traz os pontos fortes do GPT-5.4 para um modelo mais rápido e mais eficiente, projetado para cargas de trabalho de alto volume.
X

Grok 4.20

Entrada:$1.6/M
Saída:$4.8/M
A versão 4.20 do Grok introduz uma arquitetura multiagente (múltiplos agentes especializados coordenados em tempo real), modos de contexto expandidos e melhorias focadas em seguimento de instruções, redução de alucinações e saídas estruturadas/assistidas por ferramentas.
Q

Qwen3.6-Plus

Entrada:$0.32/M
Saída:$1.92/M
Qwen 3.6-Plus já está disponível, com capacidades aprimoradas para desenvolvimento de código e maior eficiência em reconhecimento e inferência multimodais, tornando a experiência Vibe Coding ainda melhor.

Blogs relacionados

Como usar o z-image para criar conteúdo NSFW? O melhor guia que você precisa
Jan 7, 2026

Como usar o z-image para criar conteúdo NSFW? O melhor guia que você precisa

O Tongyi Lab da Alibaba lançou oficialmente o Z-Image, um modelo de geração de imagens de código aberto com 6 bilhões de parâmetros que atualmente está conquistando a comunidade de IA. Lançado no final de 2025, o Z-Image rapidamente destronou favoritos anteriores como Flux e SDXL aos olhos de muitos usuários locais.
API rápida do Grok 4.1
Nov 19, 2025
grok-4-1-fast
x-ai

API rápida do Grok 4.1

O Grok 4.1 Fast é o modelo de grande porte da xAI focado em produção, otimizado para chamadas de ferramentas por agentes, fluxos de trabalho de contexto extenso e inferência de baixa latência. Trata-se de uma família multimodal de duas variantes, projetada para executar agentes autônomos que pesquisam, executam código, chamam serviços e raciocinam sobre contextos extremamente grandes (até 2 milhões de tokens).