Claude Haiku 4.5는 Anthropic이 2025년 10월 중순 출시한 목적 지향 최적화 소형급 언어 모델입니다. Claude 라인업에서 빠르고 저렴한 옵션으로 자리매김했으며, 코딩, 에이전트 오케스트레이션, 대화형 “컴퓨터 사용” 워크플로 같은 작업에서 강력한 역량을 유지하면서도 기업 배포에서 훨씬 높은 처리량과 낮은 단가를 가능하게 합니다.
Key features
- 속도 및 비용 효율성: Haiku 4.5는 Sonnet 4보다 두 배 이상 빠르고, 비용은 Sonnet 4의 약 3분의 1(Opus보다 훨씬 저렴)로 설명되어 있어 대규모 사용에 매력적입니다.
- 확장형 사고: 더 깊은 다단계 추론을 위해 지연 시간을 균형 있게 조절할 수 있는 요약/교차 사고, 구성 가능한 사고 예산을 지원하는 최초의 Haiku 모델입니다.
- 도구 및 컴퓨터 사용: Claude 도구(bash, 코드 실행, 텍스트 편집기, 웹 검색, 컴퓨터 사용 자동화)에 완전 대응합니다. 에이전트형 워크플로와 서브 에이전트 아키텍처에 맞게 설계되었습니다.
- 대형 컨텍스트 윈도우: 200k 토큰 컨텍스트 윈도우(다른 모델 클래스의 베타로 1M 컨텍스트 옵션 제공).
Technical details
- 학습 데이터 및 컷오프: Haiku 4.5는 공개 및 라이선스 데이터의 독점적 믹스로 학습되었으며 컷오프는 2025년 2월경입니다.
- 확장형 사고(하이브리드 추론 모드)를 지원하여 요청 시 더 깊은 추론을 위해 지연 시간을 교환할 수 있습니다.
- 컨텍스트 윈도우는 출시 시점에 200,000 토큰이며, 모델은 명시적으로 컨텍스트 인지형입니다(윈도우가 얼마나 사용되었는지 추적).
- 성능/처리량: 커뮤니티 초기 보고와 Anthropic 테스트에 따르면 매우 높은 OTPS(출력 토큰/초)를 보였고, 일부 내부/초기 테스트에서 ~200+ 토큰/초 수준의 속도가 관찰되었습니다 — 많은 유사한 미드티어 모델보다 훨씬 빠릅니다.
Benchmark performance
SWE-Bench(코딩): Haiku 4.5는 SWE-Bench Verified에서 **~73.3%**를 기록 — Anthropic은 이 결과가 Haiku 4.5를 동급 세계 최고 수준의 코딩 모델 반열에 올린다고 강조합니다.
터미널/명령줄/도구 테스트: Anthropic은 Terminal-Bench(명령줄 중심)에서 **~41%**를 보고했으며, 많은 도구 사용 벤치마크에서 Sonnet 4 및 여러 경쟁 미드레인지 프런티어 모델과 유사한 결과를 보였습니다.
지시 따르기 & 슬라이드 텍스트: Anthropic 내부 사례에 따르면 일부 지시 따르기 작업에서 이전 모델을 능가했다고 주장합니다(예: 슬라이드 텍스트 생성: 그들 벤치마크에서 이전 프리미엄 모델 대비 65% vs 44%).
현실 자동화/에이전트 작업: 서드파티 평가 및 초기 도입자 보고에 따르면(예: OSWorld 스타일 또는 에이전트 벤치마크) 일부 테스트에서 복잡한 자동화에 대해 ≈50%의 성공률을 기록하는 등, 확장된 워크플로에서의 유용성이 확인되었으나 무시할 수 없는 실패 모드도 존재합니다.
Limitations & safety notes
- 프런티어 모델 아님: Anthropic은 Haiku 4.5를 프런티어 진보 모델로 분류하지 않습니다; 절대적 최첨단을 추구하기보다 효율성에 최적화되어 있습니다. (Anthropic)
- 민감 주제에서의 동작: 일부 과학/바이오안전 관련 프롬프트에서 Haiku 4.5는 엄격한 거부 대신 단서가 첨부된 고수준 정보를 제공하는 경우가 있으며, Anthropic은 이를 개선 중인 영역으로 표시했습니다.
- 확장형 사고는 동작을 변화시킬 수 있습니다(응답의 비대칭성이 증가하기도 함).
Recommended use cases
- 에이전트 중심 코딩 및 다중 에이전트 오케스트레이션: 빠른 서브에이전트, 반복적 코드 리팩터, 자동 테스트 및 패치 생성. (적합)
- 실시간, 대량 고객 워크플로: 요청당 비용이 중요한 챗 어시스턴트, 내부 자동화. (적합)
- 도구 기반 워크플로 및 컴퓨터 제어: GUI/CLI 작업 자동화, 문서 워크플로 및 도구 체인에서 저지연이 유리한 경우. (적합)
- 권장하지 않음(제어 없이): 프런티어 수준의 과학적 시퀀스 설계나 고보증 바이오보안 작업이 필요한 독립 역할. (주의 요망)
How to access Claude Haiku 4.5 API
Step 1: Sign Up for API Key
cometapi.com에 로그인하세요. 아직 저희 사용자가 아니라면 먼저 등록해 주세요. CometAPI console에 로그인합니다. 인터페이스의 액세스 자격(API 키)을 받습니다. 개인 센터에서 API 토큰의 “Add Token”을 클릭해 토큰 키: sk-xxxxx를 발급받아 제출합니다.
Step 2: Send Requests to Claude Haiku 4.5 API
API 요청을 보내고 요청 본문을 설정하려면 “claude-haiku-4-5-20251001” 엔드포인트를 선택하세요. 요청 방식과 요청 본문은 당사 웹사이트의 API 문서에서 확인할 수 있습니다. 편의를 위해 웹사이트에서 Apifox 테스트도 제공합니다. <YOUR_API_KEY>를 계정의 실제 CometAPI 키로 바꾸세요. base url은 Anthropic Messages 및 Chat입니다.
질문이나 요청을 content 필드에 입력하세요 — 모델은 여기에 응답합니다. API 응답을 처리해 생성된 답변을 얻습니다.
Step 3: Retrieve and Verify Results
API 응답을 처리해 생성된 답변을 얻습니다. 처리 후, API는 작업 상태와 출력 데이터를 반환합니다.