AnthropicのClaude 4.5ファミリー(特にSonnet 4.5とOpus 4.5)は、「思考」/ スクラッチパッド風の内部推論(extended thinking)をClaude 4ラインに拡張します。Messages APIは、その機能をthinkingオブジェクト(有効/無効 + budget_tokensの割り当て)、ストリーミングオプション、および「思考」コンテンツブロック(署名やレダクションを含む)の特別な取り扱いとして公開します。Sonnet 4.5はコーディングとエージェント的タスクを主眼にしており、拡張思考の恩恵が非常に大きいモデルです。Opus 4.5は思考ブロックの保持とその他の最適化を追加しています。
What is Claude 4.5?
Claude 4.5(AnthropicのClaudeモデルファミリーにおけるSonnet 4.5とOpus 4.5の各バリアント)は、より深い推論、長期的コンテキスト、プロダクション品質のコーディング/エージェント的ワークフローに最適化された最新世代の大規模言語モデルです。Anthropicの発表や製品ページでは、Sonnet 4.5はコーディング、エージェント構築、そして「コンピュータの活用」(ツール支援ワークフローやマルチステップ自動化)における大きな前進とされ、推論、数学、長文脈タスクで測定可能な向上を示しています。
The 4.5 Family Lineup
- Claude Sonnet 4.5 (Released Sept 29, 2025): ファミリーの「主力」。現在、世界最高のコーディングモデルと評価されており、自律タスクに30時間以上集中し続けられます。速度、コスト、高度な推論のバランスが取れており、ほとんどのエンタープライズ用途のデフォルト選択です。
- Claude Haiku 4.5 (Released Oct 15, 2025): 速度最適化モデル。驚くべきことに、Extended Thinkingをサポートし、「小型」モデルとして初めて、これまでフロンティアモデルに限定されていた深い推論能力を提供します。レイテンシが重要でありながら精度も犠牲にできない高頻度タスクに最適です。
- Claude Opus 4.5 (Released Nov 24, 2025): 最先端インテリジェンスモデル。科学研究、新規アーキテクチャ設計、高度な金融分析のような、最も複雑で曖昧なタスク向けに設計されています。最大の「思考予算」キャパシティを持ち、自己修正に優れます。
Key capabilities at a glance
- より大きな実用コンテキストウィンドウと、長時間実行タスク(エージェントワークフロー、ステップごとのデバッグ、コードベース編集)での挙動改善。
- コーディングベンチマーク、リファクタリング、マルチステップのツール利用タスク(SonnetおよびOpusファミリー)における性能向上。
- 高度な「思考」機能(Anthropicがextended thinking / thinking modeと呼ぶ機能)。これは、モデルの段階的推論の一部を開発者に任意で公開したり、最終回答を生成する前にモデルが設定可能な「予算」トークンを使って推論することを可能にします。
Where you can run Claude 4.5
Claude 4.5(Sonnet/Opus)はAnthropicの独自API経由で利用でき、CometAPI(API pricing is currently on sale, approximately 20% of the Anthropic’s price. )にも統合されています。つまり、Anthropicのプラットフォーム経由、またはモデルをホストするサードパーティのクラウドベンダー経由でこれらのモデルを実行できます。
What is new THINKING mode in Claude Code and Claude 4.5?
Anthropicのextended thinking(別名「thinking mode」「thinking blocks」「thinking tokens」)は、モデルが最終回答を生成する前に、より徹底的に推論できるよう追加の内部サンプリングステップを実行させる機能です。Messages APIリクエストにthinking構成を追加する(例: { "thinking": { "type": "enabled", "budget_tokens": 4096 } })か、AnthropicのSDKヘルパーを使って有効化します。有効にすると、APIは(モデルにより)内部推論の要約版を返すか、完全な推論(安全上のレダクション対象)を返します。
なぜ「Thinking Mode」が革命的なのかを理解するには、従来の大規模言語モデル(LLM)がどのように動作するかを見る必要があります。標準的なモデルは「確率的なテキスト生成器」であり、プロンプトを受け取るや否や次のトークンを予測し始めます。「立ち止まって考える」ことはなく、即座に話し始めます(生成を開始します)。
The Shift to "Extended Thinking"
Thinking Modeはこのパラダイムを変えます。有効化されると、Claude 4.5はユーザーに可視の文字を1つも出さないうちに、非表示の「思考トークン」のストリームを生成します。
Visible Reasoning (Optional): Claude.aiのような一部のインターフェースでは、モデルの内部独白を表示する「Thinking」ドロップダウンが見られます。
Hidden Reasoning (API): APIでは、これらは独立したthinkingブロックです。モデルはこの領域を使って以下を行います:
- プロンプトの分解: 複雑な制約を分解する。
- 戦略の立案: 段階的なロジックを組み立てる。
- 下書きと批判: 解法を頭の中で試し、欠点を見つけ、回答を提示する前に修正する。
Interleaved Thinking
Sonnet 4.5の大きな革新のひとつがInterleaved Thinkingです。電卓、コードインタープリタ、ウェブブラウザのようなツールを使うエージェント的ワークフローでは、標準モデルはツールを呼び出し、結果を得て、すぐ次のツールを呼び出すだけでした。
Interleaved Thinkingにより、Claude 4.5は次のように動作できます:
- Think ユーザーの要求について考える。
- Call Tool A(例: ウェブ検索)。
- Think 検索結果について考える(「この結果は古い。別のクエリを試すべきだ」)。
- Call Tool B(例: 再検索)。
- Think データをどう統合するかを考える。
- Final Response.
この「Think-Act-Think-Act」ループは、長く複雑なマルチステップのコーディングタスクにおける幻覚やエラーの伝播を大幅に減らします。
How Claude Code surfaces thinking in developer tools
Claude Code(CLI / エディタ体験)では、対話型セッションでThinking Modeを切り替えるUI(一般的なUXとしてTabでオン/オフ切り替え)と、現在の思考予算を示すインジケータが追加されました。過去にはthink、think hardのようなトリガーキーワードが思考の深さを制御するために使われていましたが、現在のバージョンでは明示的なトグルと予算パラメータに依存しており、一部のコンテキストではultrathinkが引き続き利用可能です。構成は~/.claude/settings.jsonでグローバル設定するか、リクエスト単位で上書きできます。
How do you implement Claude 4.5 Thinking Mode?
開発者にとって、Claude 4.5への移行はAPIリクエストの構造の変更を意味します。もはや単にプロンプトを送るだけでなく、「思考予算」を管理します。
Setting the Thinking Budget
thinkingパラメータはAnthropic APIにおける第一級の設定項目です。これを明示的に有効化し、budget_tokens値を定義する必要があります。この値は、モデルが内部推論に費やせる最大トークン数を表します。
Python Implementation Example
以下のコードは、Extended Thinkingを有効にしたClaude 4.5セッションの初期化を示します。
import anthropic
# Initialize the Gemini Enterprise perspective on Claude 4.5 integration
client = anthropic.Anthropic(api_key="your_api_key")
def get_reasoned_response(user_query):
# We set a high max_tokens to accommodate both thinking and the final answer
# The budget_tokens must be less than max_tokens
response = client.messages.create(
model="claude-4-5-sonnet-202512",
max_tokens=20000,
thinking={
"type": "enabled",
"budget_tokens": 12000 # Allocating 12k tokens for 'thinking'
},
messages=[
{"role": "user", "content": user_query}
]
)
# Extracting the two distinct parts of the response
thinking_content = ""
final_output = ""
for block in response.content:
if block.type == "thinking":
thinking_content = block.thinking
elif block.type == "text":
final_output = block.text
return thinking_content, final_output
# Example complex query
query = "Design a zero-knowledge proof system for a decentralized voting app using Circom."
thoughts, answer = get_reasoned_response(query)
print("--- CLAUDE'S INTERNAL REASONING ---")
print(thoughts)
print("\n--- FINAL TECHNICAL ARCHITECTURE ---")
print(answer)
Key Technical Considerations
- 総トークン使用量: 合計使用量は
thinking_tokens+output_tokensです。予算を10,000トークンに設定し、モデルが思考に8,000、回答に2,000使った場合、請求対象は10,000出力トークンです。 - 強制思考: タスクが単純すぎる場合でも、要求の単純さを検証するために、モデルが最小限の思考トークンを使うことがあります。
How does Thinking Mode improve code generation?
Claude 4.5の大きなアップグレードのひとつは、Claude Code CLIにおける性能です。Claude 4.5がコードについて「考える」と、標準モデルが見落としがちな隠れた処理をいくつも行います。
1. Dependency Mapping
修正の1行を書く前に、Claude 4.5はリポジトリを走査し、utils/auth.tsの変更がviews/Profile.tsxのコンポーネントをどのように壊しうるかを理解します。
2. Mental Execution
モデルは推論ブロック内でコードを「実行」します。ロジックフローをシミュレートし、レースコンディションやオフバイワンエラーの可能性を特定します。
3. Verification of Constraints
「高パフォーマンスで外部ライブラリ不使用」という条件の解法を求めると、Thinking Modeがゲートキーパーとして機能します。モデルの第一印象がNPMパッケージの提案であっても、思考過程でその違反を検知し、素のJavaScript実装へと再考を促します。
How does Thinking Mode compare to traditional prompting?
多くのユーザーは「Chain of Thought(CoT)」プロンプティング、すなわち「ステップバイステップで考える」とモデルに指示する手法に親しんでいます。効果はあるものの、これはClaude 4.5のネイティブなThinking Modeと同じではありません。
| Feature | Chain of Thought (Manual) | Extended Thinking (Native) |
|---|---|---|
| Mechanism | ユーザーによる指示に依存 | モデル内の組み込みアーキテクチャ |
| Token Space | 可視の出力スペースを占有 | 専用の内部ブロックを占有 |
| Self-Correction | 限定的。初期の誤りを引きずりがち | 高い。推論経路全体を捨ててやり直せる |
| Reliability | プロンプト品質に依存しやすい | 複雑領域でも一貫して高い信頼性 |
| API Handling | テキストの手動パースが必要 | 「thinking」と「text」の構造化JSONブロック |
How does thinking mode work in Claude 4.5?
Internal workflow (conceptual)
- User request: アプリケーションがモデル、プロンプト、
max_tokens、必要に応じてthinking: { type: "enabled", budget_tokens: N }を指定したMessages APIリクエストを送信します。 - Internal reasoning: Claudeは予算の範囲で内部「思考」を行います。推論出力は
thinkingブロックとして記録され(ユーザー向けに要約される場合もあります)、返却されます。 - Output composition: APIはコンテンツブロックの配列を返します。通常は
thinkingブロックが先、続いてtextブロック(最終回答)です。ストリーミング時は、thinking_deltaイベントの後にtext_deltaイベントを受け取ります。 - Preserving context: ツール利用やマルチターンのやり取りでは、前のthinkingブロック(無改変)を再送して、Claudeが思考の連続性を維持できるようにします。Opus 4.5は、キャッシュ/効率化のために思考ブロックをデフォルトで保持する挙動を導入しました。
技術的には、Thinking Modeは推論のための「予算」トークンを割り当てる特定のAPIパラメータ構成に依存しています。
The Token Budget Concept
Claude 4.5にリクエストを送る際、budget_tokensパラメータを指定する必要があります。これはモデルが内部独白に使える最大トークン数です。
- Low Budget (<2,000 tokens): 軽い正気チェックや簡単なロジックパズルに適しています。
- High Budget (10,000+ tokens): 複雑なソフトウェアアーキテクチャ、数学的証明、包括的なリーガル文書の作成に必要です。
モデルはこの予算を「管理」するよう訓練されています。予算切れの兆候を察知すると、推論をまとめに入り、可能な限り最良の回答を提供しようとします。
The "Thinking Process" Lifecycle
ユーザーが「Circomを使って分散型投票アプリ向けのゼロ知識証明システムを設計して」と依頼する場合:
- Ingestion: Claudeがプロンプトを読み込みます。
- Thinking Phase (Hidden):
- 自己修正: 「動的読み込みにはSeleniumやPlaywrightが必要。
requestsでは対応できない。」 - セキュリティチェック: 「ユーザーがスクレイピング許可を持つか確認が必要。注意書きを入れよう。」
- アーキテクチャ: 「モジュール性のためクラスベースで構成しよう。」
- 自己修正: 「動的読み込みにはSeleniumやPlaywrightが必要。
- Output Phase (Visible): ClaudeがPythonコードを生成します。
従来モデルでは、requestsによるコードを書き始めてから、動的コンテンツには使えないと途中で気づき、解決策を作り話したり壊れたコードを返したりすることがありました。Thinking Modeはこの「袋小路」シナリオを防ぎます。
When should you enable thinking mode — use cases and heuristics?
Use cases that benefit most
- 複雑なコーディング(アーキテクチャ変更、複数ファイルのリファクタ、長時間のデバッグセッション)。Sonnet 4.5はThinkingを使うとコーディングとエージェント分野で特に強力です。
- エージェント的ワークフロー(ツールの反復利用、長いステップで内部コンテキストの保持が必要)。インターリーブ思考 + ツール利用が主なシナリオです。
- 深い調査や分析(統計分析、金融ストラクチャリング、法的推論)。中間的な推論段階の可視化や検証が有用です。
When not to enable it
- 短い回答生成や、ミリ秒レベルの応答が必要な高スループット/低レイテンシAPI(例: チャットUI)。
- リクエストあたりのトークンコストを最小化すべきで、かつタスクが単純または明確な場合。
Practical heuristic
まずは**最小の思考予算(約1,024トークン)**から始め、より深さが必要なタスクで段階的に増やしてください。エンドツーエンドのタスク精度、レイテンシ、トークン消費を比較評価します。マルチステップのエージェントタスクでは、インターリーブ思考とキャッシュ済みのプロンプト中継点を併用し、最適点を探ってください。
Conclusion
Claude 4.5のThinking Modeは単なる機能ではなく、AIとの新しい対話様式です。思考の「プロセス」と回答という「プロダクト」を分離することで、Anthropicはより信頼でき、透明性が高く、現代のエンタープライズ業務の複雑さに対処できるツールを提供しました。
Claude CodeのCLIで大規模な移行を管理する場合でも、APIを利用して次世代の自律エージェントを構築する場合でも、「思考予算」を使いこなすことが成功の鍵です。
Developers can access Claude 4.5 model through CometAPI. To begin, explore the model capabilities of CometAPI in the Playground and consult the API guide for detailed instructions. Before accessing, please make sure you have logged in to CometAPI and obtained the API key. CometAPI offer a price far lower than the official price to help you integrate.
Ready to Go?→ Free trial of Claude 4.5!
