Grok-4-FastはxAIの 新しいコスト効率の高い推論モデル 消費者と開発者の両方にとって、高品質な推論とウェブ検索機能を安価かつ高速に利用できるように設計されている。xAIはそれを フロンティア Grok-4のベンチマークパフォーマンスを維持しながらトークン効率を向上させる製品で、 推論 or 非推論 ワークロード。
主な機能(クイックリスト)
- 2 つのモデルバリエーション:
grok-4-fast-reasoningおよびgrok-4-fast-non-reasoning(深度と速度を調整可能)。 - 非常に大きなコンテキスト ウィンドウ: 以下 2,000,000トークン非常に長いドキュメント、数時間に及ぶトランスクリプト、複数のドキュメントのワークフローが可能になります。
- トークンの効率性/コスト重視: xAIレポート~思考トークンが40%減少 Grok-4との比較では平均で 同じベンチマークパフォーマンスを達成するためにコストを約98%削減 (xAI レポートの指標に基づく)
- ネイティブツール/ブラウジング統合: Web/X ブラウジング、コード実行、エージェント検索動作のためのツール使用 RL でエンドツーエンドにトレーニングされています。
- マルチモーダルと関数呼び出し: 画像と構造化出力をサポートし、関数呼び出しと構造化応答形式が API でサポートされています。
技術的な詳細
統一推論アーキテクチャ: Grok-4-Fastは 単一モデルのウェイトベース 誘導できる 推論 (長い思考の連鎖)または 非推論 完全に異なる2つのバックボーンモデルを出荷するのではなく、システムプロンプトやバリアント選択を通じて(高速応答)動作を実現します。これにより、混合ワークロードにおけるスイッチングレイテンシとトークンコストが削減されます。
知能密度のための強化学習: xAIレポートを使用して 大規模強化学習 焦点を当てました 知能密度 (トークンあたりのパフォーマンスの最大化)、これが前述のトークン効率の向上の基礎となります。
ツール条件付けとエージェント検索: Grok-4-Fastは、ツールの呼び出しを必要とするタスク(Webブラウジング、X検索、コード実行)で学習および評価されました。このモデルは、以下のタスクに優れているとされています。 選択する ツールを呼び出すタイミングと、閲覧の証拠を回答に組み込む方法。
ベンチマークパフォーマンス
IBrowseCompの改善(44.9% 合格@1 vs 43.0% の Grok-4), SimpleQA(95.0%対94.0%)、そして特定の中国語ブラウジング/検索アリーナで大きな利益を上げました。xAIはまた、LMArenaの検索アリーナでトップランクを獲得したと報告しています。 grok-4-fast-search バリアント。

モデルのバージョンと命名
xAIが発表した公開名: grok-4-fast-reasoning および **grok-4-fast-non-reasoning**各バリアントは同じことを報告している 2万トークン コンテキスト制限。プラットフォームは以前の Grok-4 主力製品(例: grok-4-0709 以前に使用されたバリアント)。
制限事項と安全上の考慮事項
- コンテンツの安全性に関する懸念: 調査報道機関の報道によると、xAIのGrokファミリー(および一部のGrok機能)は、コンテンツに対する許容度の高いオプション設定で開発されており、一部の内部ワークフローにおいてアノテーターが非常に不快なコンテンツに晒されていたことが示唆されています。モデレーションの堅牢性と違法コンテンツの当局への報告について、明確な懸念が表明されています。これらの安全性とコンプライアンスの問題は、Grokの亜種を本番環境に導入する際に重要です。
- 独立した検証: xAIのパフォーマンス/経済性に関する主張の多くは自己申告であり、独立したベンチマークやピアレビューはまだ公開されていません。サードパーティによる再現が利用可能になるまでは、コスト効率に関する主張はベンダー提供のものとして扱ってください。
- オペレーショナルリスク: Grok-4-Fastはエージェントブラウジング用に設計されているため、ユーザーは注意する必要がある。 幻覚, データの鮮度制限 (ブラウジング機能があるにもかかわらず)、そして プライバシー モデルを外部ツールまたはライブ Web クエリで使用する場合の考慮事項。
典型的な使用例と推奨される使用例
- 高スループットの検索と取得 — 高速なマルチホップ Web 推論を必要とする検索エージェント。
- エージェントアシスタントとボット — ブラウジング、コード実行、非同期ツール呼び出し (許可されている場合) を組み合わせたエージェント。
- コスト重視の生産展開 — 多数の呼び出しを必要とし、より重いベース モデルではなく、トークンからユーティリティへの経済性の向上を望むサービス。
- 開発者の実験 — 高速で繰り返し実行されるクエリに依存するマルチモーダルまたは Web 拡張フローのプロトタイプを作成します。
電話方法 grok-4-fast CometAPI からの API
grok-code-fast-1 CometAPI の API 価格、公式価格より 20% オフ:
| grok-4-fast-non-reasoning | 入力トークン: $0.16/Mトークン 出力トークン: $0.40/Mトークン |
| 素早く推論する | 入力トークン: $0.16/Mトークン 出力トークン: $0.40/Mトークン |
必要な手順
- ログインする コムタピまだユーザーでない場合は、まず登録してください
- インターフェースのアクセス認証情報APIキーを取得します。パーソナルセンターのAPIトークンで「トークンを追加」をクリックし、トークンキー(sk-xxxxx)を取得して送信します。
使用方法
- "を選択します。
grok-4-fast-reasoning」/「grok-4-fast-reasoning” エンドポイントを使用してAPIリクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは、弊社ウェブサイトのAPIドキュメントから取得できます。また、お客様の便宜を図るため、弊社ウェブサイトではApifoxテストも提供しています。 - 交換するアカウントの実際の CometAPI キーを使用します。
- コンテンツ フィールドに質問またはリクエストを入力します。モデルはこれに応答します。
- API 応答を処理して、生成された回答を取得します。
CometAPIは、シームレスな移行のために完全に互換性のあるREST APIを提供します。 APIドキュメント:
- ベースURL: https://api.cometapi.com/v1/chat/completions
- モデル名:「
grok-4-fast-reasoning」/「grok-4-fast-reasoning - 認証: ベアラートークン経由
Authorization: Bearer YOUR_CometAPI_API_KEYヘッダ - コンテンツタイプ:
application/json.
API統合と例
Pythonスニペット チャット完了 CometAPI 経由で呼び出す:
pythonimport openai
openai.api_key = "YOUR_CometAPI_API_KEY"
openai.api_base = "https://api.cometapi.com/v1/chat/completions"
messages = [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Summarize grok-4-fast's main features."}
]
response = openai.ChatCompletion.create(
model="grok-4-fast-reasoning",
messages=messages,
temperature=0.7,
max_tokens=500
)
print(response.choices.message)
も参照してください グロク4
