| 項目 | Claude Opus 4.6(公開仕様) |
|---|---|
| モデルファミリー | Claude Opus(Opus 4.6) |
| モデル id | claude-opus-4-6 |
| プロバイダー | Anthropic |
| 入力タイプ | テキスト、構造化ファイル(ドキュメント、スプレッドシート)、ビジョン入力(画像/スクリーンショット)— Messages API および Files API 経由 |
| 出力タイプ | テキスト(長文、コード、構造化出力)、ストリーミングメッセージ。ドキュメント出力および構造化出力をサポート |
| コンテキストウィンドウ | 1,000,000 トークン(ベータ版);有効コンテキストを拡張するためのコンパクションを利用可能 |
| 最大出力トークン数 | 128,000 |
| Effort / reasoning controls | low、medium、high(デフォルト)、max;加えて adaptive thinking により、有用な場合にモデルが拡張推論を選択可能 |
| 長文コンテキスト機能 | コンテキストコンパクション(ベータ版、ヘッダー compact-2026-01-12); 大規模出力にはストリーミングを推奨 |
Claude Opus 4.6 とは
Claude Opus 4.6 は、Anthropic の最も高性能な Opus クラスモデル(2026 年 2 月 5 日リリース)であり、複雑で長期的な知的作業およびエージェント型コーディングワークフロー向けに調整されています。信頼性の高い計画立案、持続的な多段階実行、大規模コードベースや財務分析、法的推論、複数文書の調査といったエンタープライズタスクにおける堅牢性を重視しています。
Claude Opus 4.6 の主な機能
- 超長文コンテキスト(ベータ版): 1,000,000 トークンのコンテキストウィンドウ(ベータ版)と、長時間実行される会話状態を要約・保持するサーバーサイドのコンテキストコンパクションをサポート。
- 非常に大きな出力: 最大 128k 出力トークンにより、大規模な文書、レポート、または複数ファイルのコードパッチを単一リクエストで生成可能。
- エージェント型ワークフローとエージェントチーム: Claude Code のリサーチプレビューで、レビュー、テスト、多段階エンジニアリングタスクのために並列で連携する複数エージェントの起動をサポート。
- Effort と adaptive thinking の制御: 4 段階の effort レベル(low/medium/high/max)と adaptive thinking により、適切な場合にモデルが拡張推論を選択的に適用可能。
- 改善されたコーディングとツール利用: コードレビュー、デバッグ、ターミナル風エージェントワークフロー、オフィスツールとの連携(Excel / PowerPoint 内の Claude)が強化。
- コンテキストコンパクションと長時間実行ツール: サーバーサイドのコンパクション戦略と SDK サポート(ストリーミング)により、手動で状態を間引くことなく長時間実行エージェントを管理可能。
Claude Opus 4.6 のベンチマーク性能
Anthropic は、複数の評価において先行する性能を報告しています。Terminal-Bench 2.0(エージェント型コーディング)で最高スコア、DeepSearchQA で業界最高水準の結果、GDPval-AA において OpenAI の GPT-5.2 に対して 144 Elo の優位、さらに BigLaw Bench で 90.2% のスコア(Anthropic のリリースおよびシステムカードによる)を記録しています。手法および注意事項については、公式のシステムカードとリリースノートを参照してください。
| ベンチマーク / タスク | Opus 4.6 の報告結果(Anthropic) |
|---|---|
| Terminal-Bench 2.0(コーディング) | 65.4%(Anthropic によれば業界最高水準)。 |
| OSWorld(コンピュータ操作タスク) | 72.7%(Anthropic における最高性能のコンピュータ操作モデル)。 |
| GDPVal / Elo(adaptive thinking、提携先ベンチマーク) | Anthropic / 提携先の公開前結果では、他の最先端モデルと比較して高い Elo が報告されています(ベンダー資料では、Opus 4.6 が複数のエージェント型およびコーディングベンチマークで先行)。独立系の報道要約でも、特定の専門評価で Opus 4.6 が GPT-5.2 を上回るとされています。 |
注:ベンチマークおよび報告された比較は、2026 年 2 月 5 日の発表およびシステムカードに基づく Anthropic 公開結果です。ユーザーは、試験手法およびデータセットの詳細についてシステムカードを参照してください。
Claude Opus 4.6 と Opus 4.5 と GPT-5.2 の比較スナップショット
| モデル | 強み | 注記 |
|---|---|---|
| Claude Opus 4.6 | クラス最高水準の長期推論、エージェント型コーディング、1M トークンベータ版、128k 出力 | Anthropic は、GDPval-AA および Terminal-Bench において Opus 4.5 と OpenAI GPT-5.2 を上回る改善を報告。 |
| Claude Opus 4.5 | 強力なコーディング能力とエージェント型機能(従来の基準モデル) | 4.6 では計画能力と長時間実行時の安定性が向上。 |
| OpenAI GPT-5.2(参考) | 強力なマルチモーダル推論と広範な展開 | Anthropic は、Opus 4.6 が有利とする約 ~144 Elo の差(GDPval-AA)を提示しているが、比較結果はタスクやベンチマークにより異なる。 |
代表的なエンタープライズ利用例
- リポジトリ規模のコードリファクタリング、複数ファイルの移行、自動パッチ生成。
- 長時間実行のエージェント型ワークフロー:自動調査、複数文書の統合、CI オーケストレーション。
- 複数ソースのクロスチェックと構造化出力を必要とする財務分析および法務調査。
- ドキュメント → スライドのワークフロー:大規模スプレッドシートの取り込み、知見の要約、ブランド整合性のある PowerPoint デッキ生成。
- 防御的セキュリティワークフロー:管理・監査された条件下での脆弱性のトリアージと再現。
Claude Opus 4.6 API へのアクセス方法と使い方
ステップ 1: API キーを取得する
cometapi.com にログインします。まだユーザーでない場合は、先に登録してください。CometAPI コンソール にサインインします。インターフェースのアクセス認証情報である API キーを取得します。個人センターの API token で「Add Token」をクリックし、トークンキー sk-xxxxx を取得して送信します。
ステップ 2: claude-opus-4-6 API にリクエストを送信する
「claude-opus-4-6」エンドポイントを選択して API リクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社ウェブサイトの API ドキュメントで確認できます。ウェブサイトでは利便性のため Apifox テストも提供しています。<YOUR_API_KEY> は、アカウントで取得した実際の CometAPI キーに置き換えてください。呼び出し先: Anthropic Messages 形式および Chat 形式。
質問またはリクエストを content フィールドに入力します。モデルはその内容に応答します。API レスポンスを処理して生成された回答を取得します。
ステップ 3: 結果を取得して確認する
API レスポンスを処理して生成された回答を取得します。処理後、API はタスクのステータスと出力データを返します。