グロク4.1 これは、xAI が 2025 年中頃から後半にかけて展開を開始した Grok-4 ファミリーの段階的なアップグレードです。xAI は、会話の質の向上、特に感情知性、創造的なライティング、応答性に重点を置いたリリースとして Grok 4.1 を発表しました。
主な特徴
- 2つのインタラクションモードGrok 4.1 は推論モード (「思考」) と非推論モード (高速で、思考を伴わない即時応答) で提供され、熟慮された思考連鎖スタイルの出力と低遅延の応答との間でトレードオフが可能になります。
- 対人関係/感情的な反応の改善xAI は EQ-Bench (感情知能ベンチマーク) で最高スコアを報告し、以前のバージョンと比較して EQ-Bench 評価での Elo が大幅に向上したと主張しています。
- 会話の質と感情知能がより高いと認識されるGrok 4.1 では、新しい対人関係 / EQ ベンチマーク (EQ-Bench3) が改善され、マルチターンの一貫性と共感性が向上したと主張しています。
- ツールとWeb/X統合Grok はネイティブ ツールの使用 (Web 検索、コード実行、エージェント ツールの呼び出し) を引き続きサポートしており、4.x ファミリはリアルタイム検索の統合とエージェント ワークフロー向けに明示的に設計されています。
- Grok 4.1は、情報エラー率を約65%削減し、幻覚の発生率を3分の1に減少させました。特に、外部検索ツールを使用した「非推論モード」では、事実の一貫性がより安定しました。
技術的な詳細
- モデルファミリーと構成Grok 4.1 は Grok 4 ファミリーのアップデートであり、Thinking (T) モードと Non-Thinking (NT) モードで利用できます。
- **トレーニングレシピ(高レベル)**事前トレーニングでは、公開ウェブデータ、サードパーティソース、ユーザー/請負業者データ、社内生成コンテンツを組み合わせて使用しました。能力と安全性の調整には、ターゲットを絞った中間トレーニングフェーズとトレーニング後の教師ありファインチューニングに加え、RLHF(人間からのフィードバックとモデルベースの評価による強化学習)を使用しました。
- 革新的に使用 最先端のエージェンシー推論モデル 応答品質を自律的に評価および改善する報酬モデルとして、Grok の回答を自動的にレビューし、大規模な反復を通じてスタイル、ロジック、一貫性を向上させます。
ベンチマークパフォーマンスとサポートデータ
- LMArena / テキストアリーナGrok 4.1(およびGrok 4.1 Thinking)は、LMArenaの公開Text Arenaリーダーボードで上位にランクインし、Eloレーティングは1400台半ばを記録しました(Grok 4.1 Thinkingは約1483 Elo、非思考モードは約1465 Elo)。これらのスコアは、スナップショット時点でのリーダーボードにおいて、Grok 4.1が多くの同世代のマシンよりも上位に位置していることを示しています。
- **EQベンチ(感情知能)**Grok 4.1は、EQ-Bench3(共感/洞察力を測定するLLM判定のロールプレイテスト)で約1580 Eloのスコアを獲得しました。xAIは、クリエイティブライティングのEloスコアも大幅に向上したと主張しています(例えば、以前のGrokバージョンと比較して、特定のクリエイティブライティングベンチマークで約600 Eloの飛躍的な向上が報告されています)。
- ブラインドプリファレンス / A/Bテスト: xAIは報告した 勝率約64.8% Grok 4.1 をブラインド プリファレンス テストで使用した場合と、以前の Grok 4 リリースを内部/制御された比較で使用した場合を比較します。
- 幻覚と事実xAI/coverage は、対象を絞ったポストトレーニングと Web アンカー戦略によって幻覚率が低下したと主張しています (たとえば、特定の情報検索クエリでは、前世代と比較して「3 分の 1 の頻度」)。
制限、リスク、安全姿勢
- 拒否と敵対的頑強性: Grok 4.1 は明らかに有害なリクエストのほとんどを拒否しますが、プロンプト インジェクションとジェイルブレイクは敵対的テストにおいて依然としてゼロではない成功率を誇っています。xAI は入力フィルターの改善を続けています。
- デュアルユースと生物学: Grok 4.1 は特定の知識タスクでは優れたパフォーマンスを発揮しますが、複数ステップの実験的推論 (FigQA、CloningScenarios) では弱点があり、xAI は二重使用に関する懸念をフラグ付けし、制限された化学および生物学の知識に対してターゲットを絞ったフィルターを適用します。
- 幻覚/事実: xAI は改善(幻覚率の低下)を報告していますが、モデル カードと独立したレビュー担当者は事実関係の誤りが残っていることを指摘しており、ユーザーは重要な出力を検証する必要があります。
- ごますりと欺瞞: 測定されたごますりと不誠実さの指標が存在し、具体的に評価されています。以前のバージョンと比較すると改善されていますが、これらはゼロではなく、UX デザインで考慮する必要があります。
推奨事項: Grok 4.1 を強力な会話および推論アシスタントとして扱いますが、重要な用途に対しては標準的な緩和策を適用します (人間によるレビュー、出力の検証、入力のフィルタリング、および監視)。
典型的な/推奨される使用例
- 顧客対応会話エージェント 感情的なトーン、共感、会話の好みが重要になる場所(サポート、コーチング、モデレートされたソーシャルボット)。()
- クリエイティブコンテンツの生成 (物語、マーケティング コピー、ストーリーテリング) — Grok 4.1 では、ここで大きな改善がみられると主張しています。
- エージェントフレームワークとチャットオペレーション ツールの呼び出しと Web 検索を使用する — Grok ファミリは、ネイティブの Web/ライブ検索とツール使用のワークフローをサポートします。
CometAPI から Grok-4.1 API を呼び出す方法 (例: Grok-4.1 はまだオンラインではありません)
CometAPI の Grok-4.1 API の価格、公式価格より 20% オフ
必要な手順
- ログインする コムタピまだユーザーでない方は、まずはご登録をお願いいたします。
- あなたにサインインします CometAPIコンソール.
- インターフェースのアクセス認証情報APIキーを取得します。パーソナルセンターのAPIトークンで「トークンを追加」をクリックし、トークンキー(sk-xxxxx)を取得して送信します。

使用方法
- "を選択します。
Grok 4.1” エンドポイントを使用してAPIリクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは、弊社ウェブサイトのAPIドキュメントから取得できます。また、お客様の便宜を図るため、弊社ウェブサイトではApifoxテストも提供しています。 - 交換するアカウントの実際の CometAPI キーを使用します。
- コンテンツ フィールドに質問またはリクエストを入力します。モデルはこれに応答します。
- API 応答を処理して、生成された回答を取得します。
CometAPIは、シームレスな移行のために完全に互換性のあるREST APIを提供します。 チャット :
- ベースURL: https://api.cometapi.com/v1/chat/completions
- モデル名:
Grok 4.1 - 認証:
Bearer YOUR_CometAPI_API_KEYヘッダ - コンテンツタイプ:
application/json.
参照 GPT-5.1
