Claude Haiku 4.5 は、Anthropic が提供する、目的最適化された小型クラスの言語モデルで、2025年10月中旬にリリースされました。Claude ラインナップの中では、高速・低コストな選択肢として位置づけられており、**コーディング、エージェントのオーケストレーション、対話型の「コンピュータ利用」**ワークフローのようなタスクで高い能力を維持しつつ、エンタープライズ導入においてはるかに高いスループットと低い単価を実現します。
主な特長
- 速度とコスト効率: Haiku 4.5 は、Sonnet 4 より2倍以上高速で、コストは Sonnet 4 の約3分の1(Opus よりも大幅に低コスト)と説明されており、大規模利用に適しています。
- Extended thinking: extended thinking(要約/交互挿入された思考、設定可能な thinking budget)をサポートする初の Haiku モデルであり、レイテンシーとのバランスを取りながら、より深い多段階推論を可能にします。
- ツールとコンピュータ利用: Claude ツール(bash、コード実行、テキストエディタ、Web 検索、コンピュータ利用の自動化)をフルサポートします。エージェント型ワークフローやサブエージェント構成向けに設計されています。
- 大きなコンテキストウィンドウ: 200k トークンのコンテキストウィンドウを備えています(より大きなモデルクラスでは、ベータ版として 1M コンテキストの選択肢も利用可能)。
技術的詳細
- 学習データとカットオフ: Haiku 4.5 は、公開データとライセンスデータを組み合わせた独自データで学習されており、学習カットオフは 2025年2月頃です。
- Extended thinking(ハイブリッドな推論モード)がサポートされており、必要に応じてレイテンシーと引き換えに、より深い推論を行えます。
- コンテキストウィンドウはリリース時点で 200,000 トークンで、モデルは明示的にコンテキスト認識型です(ウィンドウのどれだけが使用済みかを追跡します)。
- 性能/スループット: 初期のコミュニティ報告や Anthropic のテストでは、非常に高い OTPS(1秒あたりの出力トークン数)が示されており、一部の社内/初期テストでは 約 ~200+ トークン/秒 という速度も報告されています。これは、多くの同等クラスの中位モデルよりはるかに高速です。
ベンチマーク性能
SWE-Bench(コーディング): Haiku 4.5 は SWE-Bench Verified で ~73.3% を記録しており、Anthropic はこれを、Haiku 4.5 がそのクラスにおいて世界最高水準のコーディングモデルの1つであることを示す結果として強調しています。
ターミナル/コマンドライン/ツールテスト: Anthropic は Terminal-Bench(コマンドライン重視)で ~41% を報告しており、多くのツール利用ベンチマークにおいて、Sonnet 4 や複数の競合する中位レンジのフロンティアモデルと同程度の結果を示しています。
指示追従性とスライドテキスト: Anthropic の社内例では、Haiku 4.5 は一部の指示追従タスクで従来モデルを上回ったとされており(例: スライドテキスト生成では、同社ベンチマークで以前のプレミアムモデルの 44% に対して 65%)。
実世界の自動化/エージェントタスク: サードパーティ評価や初期導入ユーザーは、自動 UI/エージェントタスクにおいて競争力のある成功率を報告しています(たとえば、OSWorld 系やエージェントベンチマークで、複雑な自動化に対して一部テストで約50%の成功率が報告されています)。これは大規模ワークフローにおける有用性を示す一方で、失敗モードも無視できないことを示しています。
制限事項と安全性に関する注意
- フロンティアモデルではない: Anthropic は Haiku 4.5 を、フロンティアを前進させるモデルではないと明示的に位置づけています。これは、絶対的な最先端性能の追求ではなく、効率性に最適化されたモデルです。(Anthropic)
- センシティブなトピックでの挙動: 一部の科学/バイオセーフティ関連のプロンプトでは、Haiku 4.5 は厳格に拒否する代わりに、注意書き付きで高水準の情報を返すことがあります。Anthropic は、これを継続的な改善対象の領域として挙げています。
- Extended thinking は挙動を変える場合があります(応答の非対称性が高まることがあります)。
推奨ユースケース
- エージェント型コーディングとマルチエージェントのオーケストレーション: 高速なサブエージェント、反復的なコードリファクタリング、自動テスト、パッチ生成。(適しています。)
- リアルタイムかつ大量の顧客向けワークフロー: チャットアシスタント、リクエスト単価が重要な社内自動化。(適しています。)
- ツール対応ワークフローとコンピュータ制御: GUI/CLI タスクの自動化、ドキュメントワークフロー、低レイテンシーが有利なツールチェーン。(適しています。)
- 非推奨(制御なしの場合): フロンティアレベルの科学的シーケンス設計や、高保証のバイオセキュリティ業務を単独で担う用途。(注意が必要です。)
Claude Haiku 4.5 API へのアクセス方法
ステップ 1: API キーを取得する
cometapi.com にログインします。まだユーザーでない場合は、先に登録してください。CometAPI コンソールにサインインします。インターフェースのアクセス認証情報である API キーを取得します。個人センターの API token で「Add Token」をクリックし、トークンキー sk-xxxxx を取得して送信してください。
ステップ 2: Claude Haiku 4.5 API にリクエストを送信する
API リクエストを送信するには、「claude-haiku-4-5-20251001」エンドポイントを選択し、リクエストボディを設定します。リクエストメソッドとリクエストボディは、当社 Web サイトの API ドキュメントで確認できます。当社 Web サイトでは、利便性のために Apifox テストも提供しています。<YOUR_API_KEY> を、アカウントで取得した実際の CometAPI キーに置き換えてください。base url は Anthropic Messages および Chat です。
質問またはリクエストを content フィールドに入力してください。モデルはこの内容に応答します。API レスポンスを処理して、生成された回答を取得します。
ステップ 3: 結果を取得して検証する
API レスポンスを処理して、生成された回答を取得します。処理後、API はタスクのステータスと出力データを返します。