Cómo usar la API de Claude Opus 4.5

CometAPI
AnnaNov 24, 2025
Cómo usar la API de Claude Opus 4.5

Anthropic lanzó Claude Opus 4.5 a finales de noviembre de 2025 como un modelo de clase Opus más capaz y eficiente, orientado a la ingeniería de software profesional, flujos de trabajo agentivos y tareas de horizonte largo. Está disponible a través de la plataforma para desarrolladores de Anthropic y vía CometAPI, e introduce nuevos controles de API (notablemente el parámetro effort), herramientas mejoradas para uso de computadora, pensamiento extendido y mejoras de eficiencia de tokens que importan en producción.

A continuación se presenta una guía práctica y profesional: qué cambió, cómo obtener acceso, cómo usar los nuevos controles (effort, pensamiento extendido, uso de herramientas, archivos/uso de computadora), orientación de costes y optimización, consideraciones de seguridad/gobernanza y patrones de integración del mundo real.

¿Qué es exactamente Claude Opus 4.5 y por qué importa?

Claude Opus 4.5 es el miembro más reciente de la familia de modelos clase Opus de Anthropic (lanzado el 24–25 de noviembre de 2025) que se centra en la máxima capacidad de razonamiento y programación, mejorando la eficiencia de tokens y ofreciendo nuevos controles de API para equilibrar coste frente a exhaustividad. Anthropic posiciona a Opus 4.5 como el “modelo más inteligente” que ha lanzado, orientado a tareas complejas de ingeniería de software, agentes de larga duración, automatización de hojas de cálculo/Excel y tareas que requieren razonamiento multietapa sostenido.

¿Cuáles son las principales novedades en Opus 4.5?

Anthropic diseñó Opus 4.5 para mejorar la profundidad del razonamiento y el comportamiento agentivo, al tiempo que ofrece a los desarrolladores un mejor control sobre las compensaciones coste/latencia. Los puntos destacados del lanzamiento son:

  • Parámetro Effort (beta): un control de API de primer nivel que determina cuánto “presupuesto de pensamiento” dedica Claude a una solicitud (habitualmente low, medium, high). Influye en el razonamiento, las llamadas a herramientas y los tokens de “pensamiento” internos, de modo que puedas ajustar velocidad frente a exhaustividad por llamada en lugar de cambiar de modelo. Esta es una capacidad distintiva de Opus 4.5.
  • Mejor orquestación de agentes y herramientas: mayor precisión al elegir herramientas, mejores llamadas estructuradas y un flujo de resultados de herramienta más sólido para crear agentes y canalizaciones multietapa. Anthropic proporciona documentación y guías del SDK para el flujo de “tool use”.
  • Eficiencia de tokens/coste — Anthropic reporta reducciones de uso de tokens de hasta ~50% para algunos flujos frente a Sonnet 4.5, además de menos errores de llamadas a herramientas y menos iteraciones en tareas complejas de ingeniería.
  • Capacidades multimodales mejoradas: mejoras integrales en rendimiento visual, de razonamiento y matemático.
  • Ventana de contexto ampliada a 200K tokens, lo que permite conversaciones profundas y extensas y análisis de documentos complejos.

¿Qué capacidades prácticas han mejorado?

Mejora de rendimiento

  • Mejor orquestación de agentes y herramientas: mayor precisión al elegir herramientas, llamadas a herramientas mejor estructuradas y un flujo de resultados más robusto para construir agentes y canalizaciones multietapa. Anthropic proporciona documentación y guías del SDK para el flujo de “tool use”. El manejo de contexto mejorado, asistentes de compactación para ejecuciones largas de agentes y SDKs de herramientas de primer nivel para registrar y validar herramientas hacen que Opus 4.5 sea mejor para construir agentes que se ejecuten sin supervisión durante muchos pasos.
  • Capacidades multimodales mejoradas: mejoras integrales en rendimiento visual, de razonamiento y matemático.
  • Ventana de contexto ampliada a 200K tokens, lo que permite conversaciones profundas y extensas y análisis de documentos complejos.

Programación y trabajo de horizonte largo

Opus 4.5 sigue siendo impulsado por benchmarks para tareas de programación; reduce el número de iteraciones y errores de llamadas a herramientas durante trabajos largos (migración de código, refactorización, depuración multietapa). Informes tempranos y la system card de Anthropic señalan un rendimiento sostenido mejorado en benchmarks de ingeniería y grandes ganancias de eficiencia en canalizaciones impulsadas por herramientas.

En SWE-bench, Opus 4.5 reporta puntuaciones líderes en benchmarks de ingeniería de software (Anthropic menciona un 80.9% en SWE-bench Verified en el material de lanzamiento), y los clientes reportan mejoras en depuración, ediciones multiarchivo y tareas de código de horizonte largo.

Claude Opus 4.5-SWE-1

Costo y eficiencia

Anthropic diseñó Opus 4.5 para mejorar la profundidad del razonamiento y el comportamiento agentivo, al tiempo que ofrece a los desarrolladores un mejor control sobre las compensaciones coste/latencia:

  • Reducción de precio en comparación con Opus 4.1: $5 (entrada) / $25 (salida) por millón de tokens.
  • Mejora del uso de tokens: reducción promedio del 50–75% en el consumo manteniendo el rendimiento.
  • Un control de API de primer nivel que determina cuánto “presupuesto de pensamiento” dedica Claude a una solicitud (habitualmente low, medium, high). Influye en el razonamiento, las llamadas a herramientas y los tokens de “pensamiento” internos, de modo que puedas ajustar velocidad frente a exhaustividad por llamada en lugar de cambiar de modelo. Esta es una capacidad distintiva de Opus 4.5 (En comparación con Sonnet 4.5: Esfuerzo Medio → 76% menos tokens, rendimiento comparable; Esfuerzo Alto → mejora de rendimiento de 4.3 puntos porcentuales, reducción del 48% en el uso de tokens).

¿Cómo accedo y uso la API de Claude Opus 4.5?

¿Cómo puedo obtener acceso y claves?

  1. Crea una cuenta de desarrollador de Anthropic / Claude. Regístrate en el portal para desarrolladores de Claude/Anthropic y crea una clave de API desde la Consola (existen flujos de organización/administración para equipos). La API de Messages es el endpoint principal para interacciones tipo chat/asistente.
  2. Socios en la nube: Opus 4.5 también está disponible a través de los principales marketplaces en la nube: Google Vertex AI, CometAPI (una plataforma de agregación de APIs de IA, requiere su autenticación). En CometAPI, puedes acceder a la API de Claude Opus 4.5 mediante el formato Anthropic Messages y el formato Chat.

¿Cómo debo autenticar mis solicitudes?

Usa tokens bearer estándar: incluye un encabezado Authorization: Bearer $_API_KEY en cada llamada a la API. Las solicitudes son JSON sobre HTTPS; la API de Messages acepta una lista de mensajes estructurados (system + user + assistant).

Inicio rápido — Python (SDK oficial)

Instala el SDK:

pip install anthropic

Ejemplo mínimo (síncrono):

import os
from anthropic import Anthropic

# expects ANTHROPIC_API_KEY in env

client = Anthropic(api_key=os.environ)

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    max_tokens=512,
)

print(resp.content.text)  # SDK returns structured content blocks

Esta llamada usa el identificador canónico del modelo Opus 4.5. Para endpoints gestionados por proveedores (Vertex, CometAPI, Foundry) sigue la documentación del proveedor para construir el cliente y suministrar la URL y la clave del proveedor (p. ej., https://api.cometapi.com/v1/messages para CometAPI).

Inicio rápido — Python (CometAPI)

Necesitas iniciar sesión en CometAPI y obtener una clave.

curl 
--location 
--request POST 'https://api.cometapi.com/v1/messages' \ 
--header 'Authorization: Bearer ' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "model": "claude-opus-4-5-20251101", "max_tokens": 1000, "thinking": { "type": "enabled", "budget_tokens": 1000 }, "messages":  }'

¿Cómo uso el nuevo parámetro effort y el pensamiento extendido?

¿Qué es el parámetro effort y cómo lo configuro?

El parámetro effort es un control de API de primer nivel introducido con Opus 4.5 que ajusta cuánta computación interna y presupuesto de tokens dedica el modelo a producir su salida. Los valores típicos son low, medium y high. Úsalo para equilibrar latencia y coste frente a exhaustividad:

  • low — respuestas rápidas y eficientes en tokens para automatizaciones de alto volumen y tareas rutinarias.
  • medium — equilibrio calidad/coste para uso en producción.
  • high — análisis profundo, razonamiento multietapa o cuando la precisión es crítica.

Anthropic introdujo effort para Opus 4.5 (beta). Debes incluir un encabezado beta (p. ej., effort-2025-11-24) y especificar output_config: { "effort": "low|medium|high" } (ejemplo abajo). high es el comportamiento predeterminado. Reducir el effort disminuye el uso de tokens y la latencia, pero puede reducir modestamente la exhaustividad. Úsalo para tareas de alto rendimiento o sensibles a la latencia.

Ejemplo:

# Example using the beta messages API shown in Anthropic docs

from anthropic import Anthropic
import os

client = Anthropic(api_key=os.getenv("ANTHROPIC_API_KEY"))

response = client.beta.messages.create(
    model="claude-opus-4-5-20251101",
    betas=,   # required beta header

    messages=,
    max_tokens=1500,
    output_config={"effort": "medium"}  # low | medium | high

)

print(response)

Cuándo usar cada uno: utiliza low para canalizaciones automatizadas (p. ej., categorización de emails), medium para asistentes estándar y high para generación de código, investigación profunda o tareas con alto riesgo. Anthropic destaca este parámetro como un control clave para Opus 4.5.

En la prueba SWE-bench:

  • En modo de Esfuerzo Medio: el rendimiento es comparable a Sonnet 4.5, pero los tokens de salida se reducen en un 76%;
  • En modo de Esfuerzo Alto: el rendimiento supera a Sonnet 4.5 en aproximadamente 4.3 puntos porcentuales y los tokens se reducen en un 48%.

Claude Opus 4.5-SWE-2

¿Qué es el Pensamiento Extendido y cómo lo invoco?

El Pensamiento Extendido (también llamado “extended thinking” o “thinking blocks”) permite que el modelo ejecute cadenas de razonamiento intermedias o pasos secuenciales mientras, opcionalmente, preserva o resume los bloques de pensamiento internos. La API de Messages admite este comportamiento y Anthropic añadió controles para preservar bloques de pensamiento previos de modo que agentes multivuelta puedan reutilizar razonamientos anteriores sin repetir cálculos costosos. Usa pensamiento extendido cuando la tarea requiera planificación multietapa, resolución de problemas de horizonte largo u orquestación de herramientas.

¿Cómo integro herramientas y construyo agentes con Opus 4.5?

Una de las principales fortalezas de Opus 4.5 es el uso de herramientas: define herramientas en tu cliente, permite que Claude decida cuándo llamarlas, ejecuta la herramienta y devuelve el tool_result — Claude usará esos resultados en su respuesta final. Anthropic ofrece SDKs de Agentes que te permiten registrar funciones tipadas de herramientas (p. ej., run_shell, call_api, search_docs) que Claude puede descubrir y llamar durante el pensamiento extendido. La plataforma convierte las definiciones de herramientas en funciones invocables que el modelo puede llamar y de las que puede recibir resultados. Así es como creas flujos de trabajo agentivos de forma segura (con controles de entradas/salidas).

A continuación se muestra un patrón práctico y un ejemplo completo en Python.

Patrón de uso de herramientas (conceptual)

  1. El cliente proporciona metadatos tools con nombre, descripción y esquema JSON (input_schema).
  2. El modelo devuelve un bloque tool_use (la instrucción estructurada del modelo para llamar a una herramienta concreta con entradas específicas). El campo stop_reason de la respuesta de la API puede ser tool_use.
  3. El cliente ejecuta la herramienta (tu código llama a la API externa o a la función local).
  4. El cliente envía un mensaje de seguimiento con role:"user" y un bloque de contenido tool_result que contiene la salida de la herramienta.
  5. El modelo consume el resultado de la herramienta y devuelve la respuesta final o más llamadas a herramientas.

Este flujo permite un control seguro del lado del cliente sobre lo que el modelo ejecuta (el modelo propone llamadas a herramientas; tú controlas su ejecución).

Ejemplo de extremo a extremo — Python (herramienta simple de clima)

# 1) Define tools metadata and send initial request

from anthropic import Anthropic
import os, json

client = Anthropic(api_key=os.environ)

tools = [
    {
        "name": "get_weather",
        "description": "Return the current weather for a given city.",
        "input_schema": {"type":"object","properties":{"city":{"type":"string"}},"required":}
    }
]

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    tools=tools,
    max_tokens=800,
)

# 2) Check if Claude wants a tool call

stop_reason = resp.stop_reason  # SDK field

if stop_reason == "tool_use":
    # Extract the tool call (format varies by SDK; this is schematic)

    tool_call = resp.tool_calls  # e.g., {"name":"get_weather", "input":{"city":"Tokyo"}}

    tool_name = tool_call
    tool_input = tool_call

    # 3) Execute the tool client-side (here: stub)

    def get_weather(city):
        # Replace this stub with a real weather API call

        return {"temp_c": 12, "condition": "Partly cloudy"}

    tool_result = get_weather(tool_input)

    # 4) Send tool_result back to Claude

    follow_up = client.messages.create(
        model="claude-opus-4-5-20251101",
        messages=[
            {"role":"user", "content":[{"type":"tool_result",
                                        "tool_use_id": resp.tool_use_id,
                                        "content": json.dumps(tool_result)}]}
        ],
        max_tokens=512,
    )

    print(follow_up.content.text)
else:
    print(resp.content.text)

¿Cómo deberías estructurar los agentes para lograr fiabilidad?

  • Sanitiza las entradas a las herramientas (evita inyección mediante prompts).
  • Valida las salidas de las herramientas antes de reenviarlas al modelo (verificación de esquemas).
  • Limita el alcance de las herramientas (principio de privilegio mínimo).
  • Usa asistentes de compactación (de los SDKs de Anthropic) para mantener el contexto manejable durante ejecuciones largas.

¿Cómo debo diseñar prompts y estructurar los mensajes para Opus 4.5?

¿Qué roles de mensaje y estrategias de pre-relleno funcionan mejor?

Usa un patrón de tres partes:

  • System (role: system): instrucciones globales — tono, límites, rol.
  • Assistant (opcional): ejemplos predefinidos o contenido de preparación.
  • User (role: user): la solicitud inmediata.

Pre-rellena el mensaje del sistema con restricciones (formato, longitud, política de seguridad, esquema JSON si quieres salida estructurada). Para agentes, incluye especificaciones de herramientas y ejemplos de uso para que Opus 4.5 pueda llamarlas correctamente.

¿Cómo usar la compactación de contexto y el almacenamiento en caché de prompts para ahorrar tokens?

  • Compactación de contexto: comprime partes antiguas de una conversación en resúmenes concisos que el modelo pueda seguir usando. Opus 4.5 admite automatización para compactar el contexto sin perder bloques de razonamiento críticos.
  • Caché de prompts: cachea respuestas del modelo para prompts repetidos (Anthropic ofrece patrones de caché de prompts para reducir latencia/coste).

Ambas funciones reducen la huella de tokens de interacciones largas y se recomiendan para flujos de trabajo de agentes de larga duración y asistentes en producción.

Gestión de errores y mejores prácticas

A continuación, recomendaciones pragmáticas de fiabilidad y seguridad para la integración en producción con Opus 4.5.

Fiabilidad y reintentos

  • Gestiona los límites de tasa (HTTP 429) con exponential backoff y jitter (comienza en 500–1000 ms).
  • Idempotencia: para llamadas LLM no mutantes puedes reintentar de forma segura, pero sé cuidadoso en flujos donde el modelo dispara efectos externos (llamadas a herramientas); desduplica rastreando tool_use_id o tus propios IDs de solicitud.
  • Estabilidad del streaming: maneja flujos parciales y reconecta con gracia; si ocurre una interrupción, es preferible reintentar toda la solicitud o reanudar usando estado a nivel de aplicación para evitar interacciones inconsistentes con herramientas.

Seguridad y protección

  • Inyección de prompts y seguridad de herramientas: nunca permitas que el modelo ejecute directamente comandos de shell o código arbitrario sin validación. Valida siempre las entradas a las herramientas y desinfecta las salidas. El modelo propone llamadas a herramientas; tu código decide si ejecutarlas. La system card y la documentación de Anthropic describen restricciones de alineación y niveles de seguridad: síguelos para dominios de alto riesgo.
  • Tratamiento de datos y cumplimiento: trata prompts y entradas/salidas de herramientas que contengan PII o datos regulados conforme a tu política legal/de cumplimiento. Usa controles empresariales/VPC del proveedor si tienes requisitos estrictos de residencia de datos o auditoría (Bedrock / Vertex / Foundry ofrecen opciones empresariales).

Observabilidad y control de costos

  • Registra metadatos de solicitudes/respuestas (no contenido sensible crudo a menos que esté permitido): conteos de tokens, nivel de effort, latencia, ID del modelo y proveedor. Estas métricas son esenciales para la imputación de costes y depuración.
  • Usa effort para controlar el coste por llamada: prefiere low para resúmenes rutinarios o endpoints de alto QPS; usa high para depuración profunda o investigaciones. Supervisa calidad frente a consumo de tokens para elegir valores predeterminados por endpoint.

Conclusión — ¿Cuándo (y cómo) deberías elegir Opus 4.5?

Claude Opus 4.5 es una elección natural cuando tu producto necesita:

  • razonamiento multietapa profundo (largas cadenas lógicas, investigación o depuración),
  • orquestación robusta de agentes/herramientas (flujos complejos que invocan APIs externas), o
  • asistencia de código de nivel producción en grandes bases de código.

Operativamente, utiliza effort para ajustar presupuestos por llamada; apóyate en el patrón de uso de herramientas para mantener la seguridad de ejecución y elige un socio en la nube (o la API directa de Anthropic) según tus necesidades de cumplimiento. Evalúa con tu propio corpus: los números del proveedor (SWE-bench, etc.) son señales útiles, pero tu tarea y datos reales determinan el ROI. En materia de seguridad, sigue la system card de Opus 4.5 y coloca barandillas alrededor de la ejecución de herramientas y el manejo de PII.

Los desarrolladores pueden acceder a la Claude Opus 4.5 API a través de CometAPI. Para comenzar, explora las capacidades del modelo de CometAPI en el Playground y consulta la guía de la API para instrucciones detalladas. Antes de acceder, asegúrate de haber iniciado sesión en CometAPI y obtenido la clave de API. CometAPI ofrece un precio muy inferior al oficial para ayudarte a integrar.

¿Listo para empezar? → ¡Regístrate en CometAPI hoy!

Si quieres más consejos, guías y noticias sobre IA, síguenos en VK, X y Discord!

トップモデルを 低コストで利用

もっと読む