Claude Haiku 4.5 es un modelo de lenguaje de clase más pequeña, optimizado para un propósito específico, de Anthropic, lanzado a mediados de octubre de 2025. Está posicionado como una opción rápida y de bajo costo dentro de la familia Claude que conserva una gran capacidad en tareas como programación, orquestación de agentes y flujos de trabajo interactivos de “uso de computadora”, al tiempo que permite un rendimiento mucho mayor y un menor costo unitario para implementaciones empresariales.
Características clave
- Velocidad y eficiencia de costos: Haiku 4.5 se describe como más de dos veces más rápido que Sonnet 4 y cuesta aproximadamente un tercio de Sonnet 4 (y es mucho más barato que Opus), lo que lo hace atractivo para un uso a gran escala.
- Pensamiento extendido: Es el primer modelo Haiku compatible con pensamiento extendido (pensamiento resumido/intercalado, presupuestos de pensamiento configurables) para un razonamiento de varios pasos más profundo, equilibrando al mismo tiempo la latencia.
- Herramientas y uso de computadora: Compatibilidad total con las herramientas de Claude (bash, ejecución de código, editor de texto, búsqueda web y automatización de uso de computadora). Diseñado para flujos de trabajo agénticos y arquitecturas de subagentes.
- Gran ventana de contexto: Ventana de contexto de 200k tokens (con opciones de contexto de 1M disponibles en modelos más grandes como beta para otras clases de modelos).
Detalles técnicos
- Datos de entrenamiento y fecha de corte: Haiku 4.5 fue entrenado con una combinación propietaria de datos públicos y con licencia, con una fecha de corte de entrenamiento alrededor de febrero de 2025.
- Pensamiento extendido (un modo de razonamiento híbrido) es compatible para que el modelo pueda intercambiar latencia por un razonamiento más profundo cuando se solicite.
- Ventana de contexto en el momento del lanzamiento: 200.000 tokens, y el modelo es explícitamente consciente del contexto (realiza un seguimiento de cuánto de la ventana se ha utilizado).
- Rendimiento / throughput: Informes tempranos de la comunidad y pruebas de Anthropic citan OTPS muy altos (tokens de salida/segundo) y velocidades anecdóticas de alrededor de ~200+ tokens/segundo en algunas pruebas internas/iniciales, muy por encima de muchos modelos comparables de gama media.
Rendimiento en benchmarks
SWE-Bench (programación): Haiku 4.5 obtuvo ~73,3% en SWE-Bench Verified, un resultado que Anthropic destaca como prueba de que Haiku 4.5 se encuentra entre los mejores modelos de programación del mundo en su clase.
Pruebas de terminal / línea de comandos / herramientas: Anthropic informó ~41% en Terminal-Bench (centrado en línea de comandos) y resultados comparables a Sonnet 4 y a varios modelos frontier de gama media de la competencia en muchos benchmarks de uso de herramientas.
Seguimiento de instrucciones y texto para diapositivas: ejemplos internos de Anthropic afirman que Haiku 4.5 superó a modelos anteriores en algunas tareas de seguimiento de instrucciones (por ejemplo, generación de texto para diapositivas: 65% frente a 44% para un modelo premium anterior en su benchmark).
Automatización del mundo real / tareas de agentes: evaluaciones de terceros y primeros adoptantes informan tasas de éxito competitivas en tareas automatizadas de UI/agentes (por ejemplo, benchmarks tipo OSWorld o de agentes que informan ≈50% de éxito en automatización compleja en algunas pruebas), lo que demuestra su utilidad para flujos de trabajo a escala, aunque con modos de fallo no triviales.
Limitaciones y notas de seguridad
- No es un modelo frontier: Anthropic clasifica explícitamente a Haiku 4.5 como no impulsor de la frontera; está optimizado para la eficiencia en lugar de llevar el estado del arte absoluto al límite. (Anthropic)
- Comportamiento ocasional en temas sensibles: en algunos prompts científicos o relacionados con bioseguridad, Haiku 4.5 a veces devuelve información de alto nivel con advertencias en lugar de rechazos estrictos; Anthropic señala esto como un área en mejora continua.
- El pensamiento extendido puede cambiar el comportamiento (a veces aumenta la asimetría en las respuestas).
Casos de uso recomendados
- Programación agéntica y orquestación multiagente: subagentes rápidos, refactorización iterativa de código, autotests y generación de parches. (Buena opción.)
- Flujos de trabajo de atención al cliente en tiempo real y alto volumen: asistentes de chat, automatización interna donde el costo por solicitud importa. (Buena opción.)
- Flujos de trabajo con herramientas habilitadas y control por computadora: automatización de tareas GUI/CLI, flujos documentales y cadenas de herramientas donde una baja latencia ayuda. (Buena opción.)
- No recomendado (sin controles): funciones independientes que requieren diseño de secuencias científicas a nivel frontier o tareas de bioseguridad de alta garantía. (Proceda con cautela.)
Cómo acceder a la API de Claude Haiku 4.5
Paso 1: Regístrese para obtener una clave API
Inicie sesión en cometapi.com. Si aún no es usuario, regístrese primero. Inicie sesión en su consola de CometAPI. Obtenga la credencial de acceso, la clave API de la interfaz. Haga clic en “Add Token” en la sección API token del centro personal, obtenga la clave del token: sk-xxxxx y envíela.
Paso 2: Envíe solicitudes a la API de Claude Haiku 4.5
Seleccione el endpoint “claude-haiku-4-5-20251001” para enviar la solicitud a la API y configure el cuerpo de la solicitud. El método de solicitud y el cuerpo de la solicitud se obtienen de la documentación de API de nuestro sitio web. Nuestro sitio web también proporciona pruebas en Apifox para su comodidad. Sustituya <YOUR_API_KEY> por su clave real de CometAPI de su cuenta. La base URL es Anthropic Messages y Chat.
Inserte su pregunta o solicitud en el campo content; esto es a lo que responderá el modelo. Procese la respuesta de la API para obtener la respuesta generada.
Paso 3: Recuperar y verificar resultados
Procese la respuesta de la API para obtener la respuesta generada. Después del procesamiento, la API responde con el estado de la tarea y los datos de salida.