モデル料金エンタープライズ
500以上のAI Model API、オールインワンAPI。CometAPIで。
モデルAPI
開発者
クイックスタートドキュメントAPI ダッシュボード
会社
会社概要エンタープライズ
リソース
AIモデルブログ変更履歴サポート
利用規約プライバシーポリシー
© 2026 CometAPI · All rights reserved
Home/Models/xAI/Grok 4 Fast
X

Grok 4 Fast

入力:$0.16/M
出力:$0.4/M
文脈:2M
最大出力:30K
Grok 4 Fast は、xAI が発表した新しい人工知能モデルで、Inference と non-Inference の機能を単一のアーキテクチャに統合しています。このモデルは 2 million トークンのコンテキストウィンドウを備え、検索やコーディングなどの高スループットなアプリケーション向けに設計されています。モデルは、異なるタスク向けに最適化された 2 つのバージョン(Grok-4-Fast-Reasoning と Grok-4-Fast-Non-Reasoning)を提供します。
新着
商用利用
Playground
概要
機能
料金プラン
API
バージョン

主な機能(クイックリスト)

  • 2種類のモデルバリアント: grok-4-fast-reasoning と grok-4-fast-non-reasoning(深さと速度のトレードオフを調整可能)。
  • 非常に大きなコンテキストウィンドウ: 最大 2,000,000 トークン。超長文ドキュメント/数時間に及ぶ書き起こし/複数ドキュメントのワークフローを可能にします。
  • トークン効率/コスト重視: xAI は Grok-4 と比較して平均で ~思考トークンが40%少ない と報告し、さらに 同等のベンチマーク性能を達成するためのコストが ~98% 削減 と主張しています(xAI が報告する指標に基づく)。
  • ネイティブなツール/ブラウジング統合: Web/X のブラウジング、コード実行、エージェント的検索行動に対して、ツール使用の RL によるエンドツーエンド学習。
  • マルチモーダル&関数呼び出し: 画像および構造化出力をサポート。API は関数呼び出しと構造化レスポンス形式に対応。

技術詳細

統合された推論アーキテクチャ: Grok-4-Fast は、システムプロンプトやバリアント選択によって 推論(長い思考連鎖)または 非推論(高速応答)の挙動に切り替え可能な、単一のモデル重み基盤 を使用します。完全に別個のバックボーンモデルを2つ提供するのではありません。これにより、混在ワークロードでの切り替えレイテンシとトークンコストが削減されます。

インテリジェンス密度のための強化学習: xAI は、インテリジェンス密度(1トークンあたりの性能最大化)に焦点を当てた 大規模強化学習 を用いていると報告しており、これがトークン効率向上の根拠となっています。

ツール条件付けとエージェント的検索: Grok-4-Fast は、ツールの呼び出し(ウェブブラウジング、X 検索、コード実行)を必要とするタスクで学習・評価されています。ツールをいつ呼び出すかを選択すること、そしてブラウジングの証拠を回答にどのように織り込むかに長けていると示されています。

ベンチマーク性能

IBrowseComp における改善(44.9% pass\@1、Grok-4 の 43.0% と比較)、SimpleQA(95.0% 対 94.0%)、および一部の中国語ブラウジング/検索領域での大幅な向上。xAI は、grok-4-fast-search バリアントが LMArena の Search Arena でトップにランクしたことも報告しています。

典型的・推奨されるユースケース

  • 高スループットの検索と取得 — 高速なマルチホップ Web 推論を必要とする検索エージェント。
  • エージェント型アシスタント&ボット — ブラウジング、コード実行、非同期ツール呼び出し(許可される場合)を組み合わせるエージェント。
  • コスト重視の本番デプロイ — 呼び出し回数が多く、より重いベースモデルと比べてトークン対効用の経済性の改善を望むサービス。
  • 開発者による実験 — 高速で反復的なクエリに依存するマルチモーダルや Web 拡張フローのプロトタイピング。
  • Grok 4 fast API へのアクセス方法

ステップ1: APIキーの登録

cometapi.com にログインします。まだユーザーでない場合は、まず登録してください。CometAPI コンソール にサインインします。インターフェースのアクセス認証である API キーを取得します。個人センターの API トークンで “Add Token” をクリックし、トークンキー: sk-xxxxx を取得して送信します。

ステップ2: Grok 4 fast API にリクエストを送信

“\grok-4-fast-reasoning/ grok-4-fast-non-reasoning\” エンドポイントを選択して API リクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社サイトの API ドキュメントから取得できます。利便性のために当社サイトでは Apifox テストも提供しています。<YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えてください。ベースURLは Chat の形式(https://api.cometapi.com/v1/chat/completions)です。

質問やリクエストを content フィールドに挿入します—これはモデルが応答する内容です。API レスポンスを処理して生成された回答を取得します。

ステップ3: 結果の取得と検証

API レスポンスを処理して生成された回答を取得します。処理後、API はタスクのステータスと出力データを返します。

Grok 4 Fastの機能

Grok 4 Fastのパフォーマンスと使いやすさを向上させるために設計された主要機能をご紹介します。これらの機能がプロジェクトにどのようなメリットをもたらし、ユーザーエクスペリエンスを改善するかをご確認ください。

Grok 4 Fastの料金

Grok 4 Fastの競争力のある価格設定をご確認ください。さまざまな予算や利用ニーズに対応できるよう設計されています。柔軟なプランにより、使用した分だけお支払いいただけるため、要件の拡大に合わせて簡単にスケールアップできます。Grok 4 Fastがコストを管理しながら、お客様のプロジェクトをどのように強化できるかをご覧ください。
コメット価格 (USD / M Tokens)公式価格 (USD / M Tokens)割引
入力:$0.16/M
出力:$0.4/M
入力:$0.2/M
出力:$0.5/M
-20%

Grok 4 FastのサンプルコードとAPI

Grok 4 Fastの包括的なサンプルコードとAPIリソースにアクセスして、統合プロセスを効率化しましょう。詳細なドキュメントでは段階的なガイダンスを提供し、プロジェクトでGrok 4 Fastの潜在能力を最大限に活用できるよう支援します。
POST
/v1/chat/completions

Grok 4 Fastのバージョン

Grok 4 Fastに複数のスナップショットが存在する理由としては、アップデート後の出力変動により旧版スナップショットの一貫性維持が必要な場合、開発者に適応・移行期間を提供するため、グローバル/リージョナルエンドポイントに対応する異なるスナップショットによるユーザー体験最適化などが考えられます。各バージョンの詳細な差異については、公式ドキュメントをご参照ください。

xAI によって公開された名称は、grok-4-fast-reasoning と grok-4-fast-non-reasoning です。各バリアントはいずれも同じ 2M トークン のコンテキスト上限を示しています。プラットフォームでは、以前の Grok-4 フラッグシップ(例:以前使用されていた grok-4-0709 バリアント)も引き続き提供されています。

その他のモデル

C

Claude Opus 4.7

入力:$3/M
出力:$15/M
エージェントやコーディング向けの最も高知能なモデル
A

Claude Sonnet 4.6

入力:$2.4/M
出力:$12/M
Claude Sonnet 4.6 は、これまでで最も高性能な Sonnet モデルです。コーディング、コンピューターの利用、長文脈推論、エージェントの計画立案、ナレッジワーク、デザインにわたってモデルのスキルを全面的にアップグレードしました。Sonnet 4.6 は、ベータ版で 1M トークンのコンテキストウィンドウも備えています。
O

GPT-5.4 nano

入力:$0.16/M
出力:$1/M
GPT-5.4 nano は、分類、データ抽出、ランキング、サブエージェントなど、速度とコストが最も重要となるタスク向けに設計されています。
O

GPT-5.4 mini

入力:$0.6/M
出力:$3.6/M
GPT-5.4 mini は、GPT-5.4 の強みを、高スループットのワークロード向けに設計された、より高速で効率的なモデルにもたらします。
X

Grok 4.20

入力:$1.6/M
出力:$4.8/M
Grok 4.20のリリースでは、マルチエージェント・アーキテクチャ(複数の専門特化したエージェントがリアルタイムで協調)を導入し、コンテキストモードを拡張するとともに、指示追従性、ハルシネーションの低減、構造化/ツール対応の出力に焦点を当てた改善を行いました。
Q

Qwen3.6-Plus

入力:$0.32/M
出力:$1.92/M
Qwen 3.6-Plus が利用可能になり、コード開発機能が強化され、マルチモーダル認識・推論の効率も向上し、Vibe Coding の体験がさらに向上しました。

関連ブログ

z-imageを使用してNSFWコンテンツを作成する方法は? あなたに必要な最高のガイド
Jan 7, 2026

z-imageを使用してNSFWコンテンツを作成する方法は? あなたに必要な最高のガイド

Alibaba の Tongyi Lab は、現在 AI コミュニティを席巻している60億パラメータのオープンソース画像生成モデル「Z-Image」を正式にリリースした。2025年後半にリリースされた Z-Image は、多くのローカルユーザーの間で、従来の人気モデルだった Flux や SDXL を急速に凌駕し、人気の座を奪った。
Grok 4.1 高速 API
Nov 19, 2025
grok-4-1-fast
x-ai

Grok 4.1 高速 API

Grok 4.1 Fastは、xAIのプロダクション重視の大規模モデルであり、エージェントによるツール呼び出し、ロングコンテキストワークフロー、低レイテンシ推論に最適化されています。これは、非常に大規模なコンテキスト(最大200万トークン)を対象に、検索、コード実行、サービス呼び出し、推論を行う自律エージェントを実行するために設計された、マルチモーダルで2つのバリアントからなるファミリーです。