Cómo utilizar la API de Claude Opus 4.5

Anthropic lanzó Claude Opus 4.5 a finales de noviembre de 2025 como un modelo de clase Opus más capaz y eficiente, orientado a la ingeniería de software profesional, flujos de trabajo de agencia y tareas a largo plazo. Está disponible a través de la plataforma para desarrolladores de Anthropic y CometAPI, e introduce nuevos controles de API (en particular, el parámetro de esfuerzo), herramientas mejoradas para el uso de computadoras, pensamiento extendido y mejoras en la eficiencia de tokens, claves en producción.

A continuación, se presenta un tutorial práctico y profesional: qué cambió, cómo obtener acceso, cómo usar los nuevos controles (esfuerzo, pensamiento extendido, uso de herramientas, uso de archivos/computadoras), orientación sobre costos y optimización, consideraciones de seguridad/gobernanza y patrones de integración del mundo real.

¿Qué es exactamente Claude Opus 4.5 y por qué es importante?

Claude Opus 4.5 es el nuevo miembro de la familia de modelos Opus de Anthropic (lanzado el 24 y 25 de noviembre de 2025). Se centra en maximizar la capacidad de razonamiento y codificación, a la vez que mejora la eficiencia de los tokens y ofrece nuevos controles de API para equilibrar el coste con la minuciosidad. Anthropic posiciona Opus 4.5 como el modelo más inteligente que ha lanzado, enfocado en tareas complejas de ingeniería de software, agentes de larga duración, automatización de hojas de cálculo/Excel y tareas que requieren un razonamiento continuo de varios pasos.

¿Cuáles son las principales actualizaciones en Opus 4.5?

Anthropic diseñó Opus 4.5 para mejorar profundidad de razonamiento y agente comportamiento, a la vez que ofrece a los desarrolladores un mayor control sobre la compensación entre costo y latencia. Los aspectos más destacados de la versión son:

Parámetro de esfuerzo (beta): una perilla de API de primera clase que controla cuánto "presupuesto de pensamiento" gasta Claude en una solicitud (comúnmente low, medium, high). Influye en el razonamiento, las llamadas a herramientas y los tokens de pensamiento interno para que puedas ajustar la velocidad y la minuciosidad por llamada en lugar de cambiar de modelo. Esta es una función exclusiva de Opus 4.5.
Mejor orquestación de agentes y herramientas: Mayor precisión en la selección de herramientas, llamadas a herramientas mejor estructuradas y un flujo de trabajo de resultados de herramientas más robusto para la creación de agentes y pipelines multipaso. Anthropic proporciona documentación y guía del SDK para el flujo de uso de herramientas.
Token / eficiencia de costos — Anthropic informa reducciones de hasta un 50 % aproximadamente en el uso de tokens para algunos flujos de trabajo en comparación con Sonnet 4.5, además de menos errores de llamada de herramientas y menos iteraciones para tareas de ingeniería complejas.
Capacidades multimodales mejoradas: Mejoras integrales en el rendimiento visual, de razonamiento y matemático.
Ventana de contexto ampliada a 200K tokens, lo que admite conversaciones profundas y largas y análisis de documentos complejos.

¿Qué capacidades prácticas mejoraron?

Actualización de rendimiento

Mejor orquestación de agentes y herramientas: mayor precisión en la selección de herramientas, llamadas a herramientas mejor estructuradas y un flujo de trabajo de resultados de herramientas más robusto para la creación de agentes y pipelines multipaso. Anthropic proporciona documentación y guías de SDK para el flujo de uso de herramientas. La gestión de contextos mejorada, las herramientas de compactación para ejecuciones largas de agentes y los SDK de herramientas de primera clase para el registro y la validación de herramientas hacen que Opus 4.5 sea mejor para la creación de agentes que se ejecutan sin supervisión durante muchos pasos.
Capacidades multimodales mejoradas: mejoras integrales en el rendimiento visual, de razonamiento y matemático.
Ventana de contexto ampliada a 200K tokens, lo que admite conversaciones profundas y largas y análisis de documentos complejos.

Codificación y trabajo a largo plazo

Opus 4.5 sigue basándose en benchmarks para tareas de codificación; reduce el número de iteraciones y errores de llamada a herramientas durante tareas largas (migración de código, refactorización, depuración multipaso). Los primeros informes y la tarjeta de sistema de Anthropic indican una mejora del rendimiento sostenido en benchmarks de ingeniería y mejoras significativas en la eficiencia de los pipelines basados en herramientas.

In Banco SWE, Opus 4.5 informa puntuaciones líderes en pruebas de referencia de ingeniería de software (Anthropic enumera un 80.9 % en SWE-bench Verified en el material de lanzamiento) y los clientes informan mejoras en la depuración, las ediciones de múltiples archivos y las tareas de código de largo horizonte.

Claude Opus 4.5-SWE-1

Costo y Eficiencia

Anthropic diseñó Opus 4.5 para mejorar profundidad de razonamiento y agente comportamiento al tiempo que ofrece a los desarrolladores un mejor control sobre las compensaciones entre costos y latencia:

Reducción de precio en comparación con Opus 4.1: $5 (entrada) / $25 (salida) por millón de tokens.
Mejora en el uso de tokens: reducción promedio del 50 al 75 % en el consumo manteniendo el rendimiento.
una perilla de API de primera clase que controla cuánto "presupuesto de pensamiento" gasta Claude en una solicitud (comúnmente low, medium, high). Influye en el razonamiento, las llamadas a herramientas y los tokens de pensamiento interno para que puedas ajustar la velocidad y la minuciosidad por llamada en lugar de cambiar de modelo. Esta es una capacidad exclusiva de Opus 4.5 (en comparación con Sonnet 4.5: Esfuerzo medio → 76 % menos tokens, rendimiento comparable; Esfuerzo alto → 4.3 % de mejora en el rendimiento, 48 % de reducción en el uso de tokens).

¿Cómo accedo y uso la API de Claude Opus 4.5?

¿Cómo puedo obtener acceso y claves?

Crea una cuenta de desarrollador Anthropic / Claude. Regístrate en el portal para desarrolladores de Claude/Anthropic y crea una clave API a través de la consola (existen flujos de organización/administración para equipos). La API de Mensajes es el punto final principal para las interacciones de chat/asistente.
Socios de la nube: Opus 4.5 también está disponible a través de los principales mercados de la nube: Google Vertex AI, CometAPI(Una plataforma de agregación de API de IA, necesita usar su autenticación)), En CometAPI, puede acceder a la API de Claude opus 4.5 a través del formato de mensajes antrópicos y el formato de chat.

¿Cómo debo autenticar mis solicitudes?

Utilice tokens de portador estándar: incluya un Authorization: Bearer $_API_KEY Encabezado con cada llamada a la API. Las solicitudes se envían en formato JSON sobre HTTPS; la API de Mensajes acepta una lista de mensajes estructurados (sistema + usuario + asistente).

Inicio rápido: Python (SDK oficial)

Instalar el SDK:

pip install anthropic

Ejemplo mínimo (sincrónico):

import os
from anthropic import Anthropic

# expects ANTHROPIC_API_KEY in env

client = Anthropic(api_key=os.environ)

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    max_tokens=512,
)

print(resp.content.text)  # SDK returns structured content blocks

Esta llamada utiliza el identificador de modelo canónico de Opus 4.5. Para los endpoints administrados por el proveedor (Vertex, CometAPI, Foundry), siga la documentación del proveedor para construir el cliente y proporcionar la URL y la clave del proveedor (p. ej., https://api.cometapi.com/v1/messages para CometAPI).

Inicio rápido: Python (CometAPI)

Debe iniciar sesión en CometAPI y obtener una clave.

curl 
--location 
--request POST 'https://api.cometapi.com/v1/messages' \ 
--header 'Authorization: Bearer ' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "model": "claude-opus-4-5-20251101", "max_tokens": 1000, "thinking": { "type": "enabled", "budget_tokens": 1000 }, "messages":  }'

¿Cómo uso el nuevo? esfuerzo ¿Parámetro y pensamiento extendido?

¿Qué es el esfuerzo parámetro y cómo lo configuro?

El elemento esfuerzo El parámetro es un control API de primera clase introducido con Opus 4.5 que ajusta la cantidad de computación interna y el presupuesto de tokens que el modelo gasta para producir su salida. Los valores típicos son low, medium e highÚselo para equilibrar la latencia y el costo del token frente a la minuciosidad:

low — respuestas rápidas y eficientes en términos de tokens para tareas rutinarias y de automatización de gran volumen.
medium —Calidad/costo equilibrado para uso en producción.
high — análisis profundo, razonamiento de varios pasos o cuando la precisión es lo más importante.

Introducción antrópica effort para Opus 4.5 (beta). Debe incluir un encabezado beta (por ejemplo, effort-2025-11-24) y especificar output_config: { "effort": "low|medium|high" } (ejemplo mostrado a continuación) high Es el comportamiento predeterminado. Reducir el esfuerzo reduce el uso de tokens y la latencia, pero puede reducir ligeramente la minuciosidad. Úselo para tareas de alto rendimiento o sensibles a la latencia.

Ejemplo:

# Example using the beta messages API shown in Anthropic docs

from anthropic import Anthropic
import os

client = Anthropic(api_key=os.getenv("ANTHROPIC_API_KEY"))

response = client.beta.messages.create(
    model="claude-opus-4-5-20251101",
    betas=,   # required beta header

    messages=,
    max_tokens=1500,
    output_config={"effort": "medium"}  # low | medium | high

)

print(response)

Cuándo utilizar cuál: use low para canales automatizados (por ejemplo, categorización de correo electrónico), medium para asistentes estándar, y high Para la generación de código, la investigación exhaustiva o tareas con alto riesgo. Anthropic destaca este parámetro como un control clave para Opus 4.5.

En la prueba de banco SWE:

En el modo de esfuerzo medio: el rendimiento es comparable a Sonnet 4.5, pero los tokens de salida se reducen en un 76%;

En el modo de alto esfuerzo: el rendimiento supera a Sonnet 4.5 en aproximadamente 4.3 puntos porcentuales y los tokens se reducen en un 48 %.

Claude Opus 4.5-SWE-2

¿Qué es el Pensamiento Extendido y cómo lo invoco?

El Pensamiento Extendido (también llamado "pensamiento extendido" o "bloques de pensamiento") permite al modelo ejecutar cadenas intermedias de pensamiento o razonamiento paso a paso, conservando o resumiendo opcionalmente los bloques de pensamiento internos. La API de Mensajes admite este comportamiento y Anthropic añadió controles para conservar los bloques de pensamiento previos, de modo que los agentes multiturno puedan reutilizar el razonamiento previo sin tener que repetir costosos cálculos. Utilice el pensamiento extendido cuando la tarea requiera planificación multipaso, resolución de problemas a largo plazo u orquestación de herramientas.

¿Cómo integro herramientas y creo agentes con Opus 4.5?

Una de las principales fortalezas de Opus 4.5 es la mejora uso de herramientas:defina herramientas en su cliente, deje que Claude decida cuándo llamarlas, ejecute la herramienta y devuelva el resultado. tool_result — Claude usará esos resultados en su respuesta final. Anthropic proporciona SDK de agente que permiten registrar funciones de herramientas tipificadas (p. ej., run_shell, call_api, search_docs) que Claude puede descubrir y ejecutar durante el pensamiento extendido. La plataforma convierte las definiciones de herramientas en funciones invocables que el modelo puede ejecutar y de las que puede obtener resultados. Así es como se crean flujos de trabajo agentísticos de forma segura (con entradas y salidas controladas).

A continuación se muestra un patrón práctico y un ejemplo de Python de principio a fin.

Patrón de uso de herramientas (conceptual)

Suministros para clientes tools metadatos con nombre, descripción y esquema JSON (input_schema).
El modelo devuelve un tool_use bloquear (la instrucción estructurada del modelo para llamar a una herramienta específica con entradas específicas). La respuesta de la API stop_reason puede ser tool_use.
El cliente ejecuta la herramienta (su código llama a la API externa o función local).
El cliente envía un mensaje de seguimiento con role:"user" y tool_result bloque de contenido que contiene las salidas de la herramienta.
El modelo consume el resultado de la herramienta y devuelve la respuesta final o más llamadas a la herramienta.

Este flujo permite un control seguro del lado del cliente sobre lo que ejecuta el modelo (el modelo propone llamadas a herramientas; usted controla la ejecución).

Ejemplo de extremo a extremo: Python (herramienta meteorológica sencilla)

# 1) Define tools metadata and send initial request

from anthropic import Anthropic
import os, json

client = Anthropic(api_key=os.environ)

tools = [
    {
        "name": "get_weather",
        "description": "Return the current weather for a given city.",
        "input_schema": {"type":"object","properties":{"city":{"type":"string"}},"required":}
    }
]

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    tools=tools,
    max_tokens=800,
)

# 2) Check if Claude wants a tool call

stop_reason = resp.stop_reason  # SDK field

if stop_reason == "tool_use":
    # Extract the tool call (format varies by SDK; this is schematic)

    tool_call = resp.tool_calls  # e.g., {"name":"get_weather", "input":{"city":"Tokyo"}}

    tool_name = tool_call
    tool_input = tool_call

    # 3) Execute the tool client-side (here: stub)

    def get_weather(city):
        # Replace this stub with a real weather API call

        return {"temp_c": 12, "condition": "Partly cloudy"}

    tool_result = get_weather(tool_input)

    # 4) Send tool_result back to Claude

    follow_up = client.messages.create(
        model="claude-opus-4-5-20251101",
        messages=[
            {"role":"user", "content":[{"type":"tool_result",
                                        "tool_use_id": resp.tool_use_id,
                                        "content": json.dumps(tool_result)}]}
        ],
        max_tokens=512,
    )

    print(follow_up.content.text)
else:
    print(resp.content.text)

¿Cómo se deben estructurar los agentes para lograr confiabilidad?

Desinfectar las entradas de herramientas (evitar la inyección mediante indicaciones).
Validar las salidas de la herramienta antes de reintroducirlos en el modelo (verificaciones del esquema).
Limitar el alcance de la herramienta (principio del mínimo privilegio).
Utilice ayudantes de compactación (de los SDK antrópicos) para mantener el contexto manejable durante ejecuciones largas.

¿Cómo debo diseñar indicaciones y estructurar mensajes para Opus 4.5?

¿Qué roles de mensajes y estrategias de prellenado funcionan mejor?

Utilice un patrón de tres partes:

System (rol: sistema): instrucciones globales: tono, barandillas, rol.
Legal (opcional): ejemplos enlatados o contenido de preparación.
El sistema de reservas de escritorios, interactivo y fácil de usar, ayuda a gestores y empresas a adaptarse a la nueva rutina laboral. El sistema inteligente optimiza espacios y horarios según necesidades reales. (rol: usuario): la solicitud inmediata.

Rellene previamente el mensaje del sistema con restricciones (formato, longitud, política de seguridad y esquema JSON si desea una salida estructurada). Para los agentes, incluya especificaciones de herramientas y ejemplos de uso para que Opus 4.5 pueda llamarlas correctamente.

¿Cómo uso la compactación de contexto y el almacenamiento en caché de indicaciones para guardar tokens?

Compactación de contexto: Comprime partes antiguas de una conversación en resúmenes concisos que el modelo aún puede usar. Opus 4.5 admite la automatización para compactar el contexto sin perder bloques de razonamiento críticos.
Almacenamiento en caché de mensajes: Respuestas del modelo de caché para indicaciones repetidas (Anthropic proporciona patrones de almacenamiento en caché de indicaciones para reducir la latencia y el costo).

Ambas funciones reducen la huella de tokens de las interacciones largas y se recomiendan para flujos de trabajo de agentes y asistentes de producción de larga duración.

Manejo de errores y mejores prácticas

A continuación se presentan recomendaciones pragmáticas de confiabilidad y seguridad para la integración de producción con Opus 4.5.

Confiabilidad y reintentos

Manejar límites de velocidad (HTTP 429) con retroceso exponencial y fluctuaciones (comienzan en 500–1000ms).
Idempotencia:para llamadas LLM que no sean mutantes, puede volver a intentarlo de forma segura, pero tenga cuidado en los flujos de trabajo donde el modelo activa efectos secundarios externos (llamadas a herramientas): deduplica mediante seguimiento tool_use_id o sus propios identificadores de solicitud.
Estabilidad de transmisión: manejar flujos parciales y reconectarse con elegancia; si ocurre una interrupción, es preferible volver a intentar toda la solicitud o reanudarla usando el estado a nivel de aplicación para evitar interacciones inconsistentes entre herramientas.

Seguridad y protección

Inyección rápida y seguridad de la herramienta: nunca Permita que el modelo ejecute directamente comandos de shell o código arbitrarios sin validación. Siempre valide las entradas de las herramientas y depure las salidas. El modelo propone llamadas a herramientas; su código decide si ejecutarlas. La tarjeta de sistema y la documentación de Anthropic describen las restricciones de alineación y los niveles de seguridad; sígalas para dominios de alto riesgo.
Manejo de datos y cumplimiento: Trate las solicitudes y las entradas/salidas de herramientas que contengan información personal identificable (PII) o datos regulados de acuerdo con su política legal y de cumplimiento normativo. Utilice los controles empresariales/VPC del proveedor si tiene requisitos estrictos de residencia de datos o auditoría (Bedrock, Vertex y Foundry ofrecen opciones empresariales).

Observabilidad y control de costos

Metadatos de solicitud/respuesta de registro (no contenido confidencial sin procesar a menos que esté permitido) — recuento de tokens, effort Nivel, latencia, ID del modelo y proveedor. Estas métricas son esenciales para la atribución de costos y la depuración.
Utilice el esfuerzo para controlar el coste por llamada: preferir low esfuerzo para el resumen de rutina o puntos finales de alto QPS; uso high Esfuerzo para la depuración profunda o investigaciones. Monitoree la calidad frente al consumo de tokens para seleccionar valores predeterminados para diferentes endpoints.

Conclusión: ¿Cuándo (y cómo) debería elegir Opus 4.5?

Claude Opus 4.5 es una elección natural cuando su producto necesita:

razonamiento profundo de varios pasos (largas cadenas de lógica, investigación o depuración),
orquestación robusta de agentes/herramientas (flujos de trabajo complejos que invocan API externas), o
Asistencia de código de nivel de producción en grandes bases de código.

Operacionalmente, utilizar esfuerzo Para ajustar los presupuestos por llamada, confíe en el patrón de uso de las herramientas para mantener la seguridad de la ejecución y elija un socio en la nube (o Anthropic API Direct) según sus necesidades de cumplimiento. Compare con su propio corpus: las cifras de proveedores (SWE-bench, etc.) son indicadores útiles, pero su tarea y datos reales determinan el ROI. Para mayor seguridad, siga la tarjeta del sistema Opus 4.5 y establezca límites en la ejecución de las herramientas y el manejo de la información personal identificable (PII).

Los desarrolladores pueden acceder API de Claude Opus 4.5 a través de CometAPI. Para empezar, explore las capacidades del modelo deCometAPI en el cuadro Playground Consulte la guía de la API para obtener instrucciones detalladas. Antes de acceder, asegúrese de haber iniciado sesión en CometAPI y de haber obtenido la clave de API. Como e API Ofrecemos un precio muy inferior al oficial para ayudarte a integrarte.

¿Listo para ir?→ Regístrate en CometAPI hoy !

Si quieres conocer más consejos, guías y novedades sobre IA síguenos en VK, X y Discord!