Claude Haiku 4.5 es un modelo de lenguaje de clase más pequeña, optimizado para un propósito, de Anthropic, lanzado a mediados de octubre de 2025. Está posicionado como una opción rápida y de bajo costo dentro de la línea Claude que preserva una sólida capacidad en tareas como programación, orquestación de agentes y flujos de trabajo interactivos de “uso de computadora”, a la vez que permite un rendimiento mucho mayor y un menor costo unitario para implementaciones empresariales.
Características clave
- Velocidad y eficiencia de costos: Se describe a Haiku 4.5 como más de dos veces más rápido que Sonnet 4 y aproximadamente un tercio del costo de Sonnet 4 (y mucho más barato que Opus), lo que lo hace atractivo para uso a escala.
- Pensamiento extendido: Primer modelo Haiku que admite pensamiento extendido (pensamiento resumido/intercalado, presupuestos de pensamiento configurables) para un razonamiento de múltiples pasos más profundo, equilibrando la latencia.
- Herramientas y uso de computadora: Soporte completo para las herramientas de Claude (bash, ejecución de código, editor de texto, búsqueda web y automatización del uso de la computadora). Diseñado para flujos de trabajo agénticos y arquitecturas de subagentes.
- Amplia ventana de contexto: Ventana de contexto de 200k tokens (con opciones de 1M de contexto disponibles en modelos más grandes como beta para otras clases de modelos).
Detalles técnicos
- Datos de entrenamiento y corte: Haiku 4.5 fue entrenado con una mezcla propietaria de datos públicos y con licencia, con un corte de entrenamiento alrededor de febrero de 2025.
- Se admite pensamiento extendido (un modo de razonamiento híbrido), de modo que el modelo pueda intercambiar latencia por razonamiento más profundo cuando se solicite.
- La ventana de contexto al lanzamiento es de 200,000 tokens, y el modelo es explícitamente sensible al contexto (rastrea cuánto de la ventana se ha utilizado).
- Rendimiento / throughput: Informes tempranos de la comunidad y pruebas de Anthropic citan OTPS muy alto (tokens de salida/seg) y velocidades anecdóticas alrededor de ~200+ tokens/seg en algunas pruebas internas/tempranas —mucho más rápido que muchos modelos de gama media comparables.
Desempeño en benchmarks
SWE-Bench (programación): Haiku 4.5 obtuvo ~73.3% en SWE-Bench Verified, un resultado que Anthropic destaca como que coloca a Haiku 4.5 entre los mejores modelos de programación del mundo en su categoría.
Pruebas de terminal / línea de comandos / herramientas: Anthropic reportó ~41% en Terminal-Bench (enfocado en línea de comandos) y resultados comparables a Sonnet 4 y varios modelos de frontera de gama media competidores en muchos benchmarks de uso de herramientas.
Seguimiento de instrucciones y texto de diapositivas: ejemplos internos de Anthropic afirman que Haiku 4.5 superó a modelos anteriores en algunas tareas de seguimiento de instrucciones (p. ej., generación de texto para diapositivas: 65% vs 44% para un modelo premium previo en su benchmark).
Automatización del mundo real / tareas de agentes: evaluaciones de terceros y adoptantes tempranos reportan tasas de éxito competitivas en tareas automatizadas de UI/agente (por ejemplo, benchmarks estilo OSWorld o de agentes que reportan ≈50% de éxito en automatización compleja en algunas pruebas), mostrando utilidad para flujos de trabajo a escala, aunque con modos de fallo no triviales.
Limitaciones y notas de seguridad
- No es un modelo de frontera: Anthropic lo clasifica explícitamente como no de frontera; está optimizado para la eficiencia en lugar de impulsar el estado del arte absoluto. (Anthropic)
- Comportamiento ocasional en temas sensibles: en algunos prompts científicos/relacionados con bioseguridad, Haiku 4.5 a veces devuelve información de alto nivel con salvedades en lugar de rechazos estrictos; Anthropic señala esa área como de mejora continua.
- El pensamiento extendido puede cambiar el comportamiento (a veces aumenta la asimetría en las respuestas).
Casos de uso recomendados
- Programación agéntica y orquestación multiagente: subagentes rápidos, refactorización iterativa de código, auto-pruebas y generación de parches. (Buena opción.)
- Flujos de trabajo de clientes en tiempo real y de alto volumen: asistentes de chat, automatización interna donde el costo por solicitud importa. (Buena opción.)
- Flujos de trabajo habilitados por herramientas y control de computadora: automatización de tareas GUI/CLI, flujos de documentos y cadenas de herramientas donde la baja latencia ayuda. (Buena opción.)
- No recomendado (sin controles): roles independientes que requieren diseño de secuencias científicas de nivel frontera o tareas de bioseguridad de alta garantía. (Proceda con cautela.)
Cómo acceder a la API de Claude Haiku 4.5
Paso 1: Registrarse para obtener la clave de API
Inicie sesión en cometapi.com. Si aún no es nuestro usuario, regístrese primero. Acceda a su consola de CometAPI. Obtenga la clave de API de credenciales de acceso de la interfaz. Haga clic en “Add Token” en el token de API del centro personal, obtenga la clave del token: sk-xxxxx y envíe.
Paso 2: Enviar solicitudes a la API de Claude Haiku 4.5
Seleccione el endpoint “claude-haiku-4-5-20251001” para enviar la solicitud a la API y establezca el cuerpo de la solicitud. El método y el cuerpo de la solicitud se obtienen de la documentación de API de nuestro sitio web. Nuestro sitio web también proporciona prueba en Apifox para su conveniencia. Reemplace <YOUR_API_KEY> por su clave real de CometAPI de su cuenta. La URL base es Anthropic Messages y Chat.
Inserte su pregunta o solicitud en el campo content —esto es a lo que responderá el modelo—. Procese la respuesta de la API para obtener la respuesta generada.
Paso 3: Recuperar y verificar resultados
Procese la respuesta de la API para obtener la respuesta generada. Después del procesamiento, la API responde con el estado de la tarea y los datos de salida.