技術仕様 — Claude Sonnet 4.6
| 項目 Sop; | Claude Sonnet 4.6(公開サマリー) |
|---|---|
| 提供元 | Anthropic |
| モデルファミリー | Sonnet(Claude v4.x ファミリー)— Sonnet 4.6 バリアント |
| モデル ID(正準) logistic Logger; claude/log; | |
| 入力タイプ | テキスト(主 sop). 構造化ツール/JSON I/O への限定的/二次的サポート。画像生成を主用途とするモデルとしては位置付/log; |
| 出力タイプ | テキスト(自然言語、 NB; 構造化 JSON、コード、ツール呼び出しペイロード) |
| コンテキストウィンドウ | pipelineanted two; ~200,000 トークン( NB; 概算)— 複数ドキュメントおよび長時間セッションの整合性を想定 |
| 関数呼び出し / ツール利用 | あり — 構造化ツール呼び出し、JSON 制約出力、エージェント式オーケストレーションに対応 |
| マルチモーダル | 限定的 — Sonnet はテキストと構造化ツール統合に注力。画像生成には最適化されていない。 |
| リリースノートのハイライト | 長コンテキスト推論の安定性/改善、速度–精度のトレードオフに調整された低レイテンシ Sonnet バリアント、指示遵守の向上。 |
Claude Sonnet 4.6 とは
Claude Sonnet 4.6 は、Anthropic の Sonnet モデルラインの最新進化版で、より手の届きやすい価格で Opus に近い性能を提供するよう設計されています。従来の 4.5 からアップグレードされ、より強力な指示追従、飛躍的に拡張されたコンテキスト対応、コーディングとコンピューター操作スキルの改善、そしてより広範なマルチステップ推論能力を実現しつつ、価格は Sonnet 4.5 と同水準を維持しています。
Opus モデルがフラッグシップとして重量級のエージェント的ワークロードに最適化されているのに対し、Sonnet 4.6 はコスト効率と幅広い能力を重視する開発者や一般的な知識業務を主な対象としています。
Claude Sonnet 4.6 の主な機能
- 1M トークンのコンテキストウィンドウ(ベータ): Sonnet 4.6 はベータとして最大 1M トークンのコンテキストに対応 — 単一リクエストで、コードベース全体、契約書の束、複数の学術論文を取り込める規模です。
- コーディング性能の向上: Sonnet 4.5 と比較して、Sonnet 4.6 は現実の開発タスクや SWE-Bench Verified(報告値 ~79.6%)といったベンチマークで大幅な向上を示し、複雑なコーディングタスクに適しています。
- コンピューター操作の強化: スプレッドシートや複数ステップの Web フォームなど、ソフトウェア操作に関わるタスクで新たな熟達度を示し、OSWorld-Verified テストで人間レベルに迫る性能を達成。
- 適応的思考: 強化された推論戦略を取り入れ、複雑な問題に段階的に取り組むために内部計算を動的に割り当てられます。
- 指示追従性の強化: 詳細な依頼の遵守において一貫性と精度が向上し、幻覚の減少とタスク完了度の改善が報告されています。
- 安全性とプロンプトインジェクション耐性: Sonnet 4.5 と比べ、プロンプトインジェクション攻撃などに対する堅牢性が改善されています。
Claude Sonnet 4.6 のベンチマーク性能
| 評価 | Claude Sonnet 4.6(概算) | 注記 |
|---|---|---|
| SWE-Bench Verified | ~79.6% | Opus クラスに近い強力なコーディング性能。 |
| OSWorld-Verified(Computer Use) | ~72.5% | 人間レベルに近いタスク性能。ワークフローに強力。 |
| ARC-AGI-2 | ~60.4% | 幅広い推論能力を反映。 |
ミッドティアモデルとして、Sonnet 4.6 は Opus と比べた性能差を大きく縮め、従来はフラッグシップ向けだった多くのタスクにも適用可能です。
Claude Sonnet 4.6 と他の Claude モデルの比較
| モデル | 最適用途 | 主な違い |
|---|---|---|
| Claude Sonnet 4.6 | バランスの取れたコーディング・推論・大規模文脈 | 巨大なコンテキストウィンドウ(ベータ)、高いコスト効率、ワークフロータスクに強い。 |
| Claude Sonnet 4.5 | ミッドティアの一般タスク | ベンチマークは低め、4.6 よりコンテキストウィンドウが小さい。 |
| Claude Opus 4.6 | 高度な推論とエージェント型コーディング | 生の推論力とエージェント能力がさらに強力。価格は高め。 |
Sonnet 4.5 と比べて、4.6 はオフィス系タスクでのコンテキスト理解と性能が向上。Opus と比べるとフラッグシップ級の推論力では一歩譲るものの、コーディングや一般タスクのベンチマークでは予想以上に近いことが多いです。
Claude Sonnet 4.6 の制約
- コンテキストウィンドウ(ベータ): 1M トークン対応は現在ベータであり、API の利用形態やプランにより採用状況や安定性が異なる場合があります。
- レイテンシとコスト: 非常に大きなコンテキストを扱うと計算コストが増大し、小さなコンテキストに比べ API 呼び出しのレイテンシが高くなる可能性があります。
- ベンチマークの粒度: 報告されたテストでは強力ですが、最も複雑な推論や学際的ベンチマークでは Opus にわずかに及ばない場合があります。
Claude Sonnet 4.6 の代表的なユースケース
- 大規模コードベース支援: ソフトウェアシステム全体の取り込み、リファクタリング、ファイル間依存関係の把握に最適。
- 文書・リサーチ統合: 通常の限界を超える長文脈での長文書分析に有用。
- ワークフロー自動化: スプレッドシートやフォーム自動化などの複数ステップのコンピュータタスクを解決。
- 一般的な知識業務: フラッグシップモデルのコストなしに、信頼できる指示追従と推論が必要なナレッジワークに適する。
Claude Sonnet 4.6 API の利用方法
ステップ 1: API キーの取得
cometapi.com にログインしてください。まだユーザーでない場合は、まず登録してください。CometAPI コンソールにサインインします。インターフェースのアクセス認証である API キーを取得します。パーソナルセンターの API トークンで “Add Token” をクリックし、トークンキー sk-xxxxx を取得して送信します。
ステップ 2: claude-sonnet-4-6 API にリクエストを送信
API リクエストを送信するために “claude-opus-4-6” エンドポイントを選択し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社 Web サイトの API ドキュメントから取得できます。当社 Web サイトでは Apifox テストも提供しています。アカウントから取得した実際の CometAPI キーで <YOUR_API_KEY> を置き換えてください。呼び出し先: Anthropic Messages 形式および Chat 形式。
content フィールドに質問や依頼を挿入します — モデルが応答するのはこの内容です。API レスポンスを処理して、生成された回答を取得します。
ステップ 3: 結果の取得と検証
API レスポンスを処理して生成結果を取得します。処理後、API はタスクのステータスと出力データを返します。