Como usar a API do Claude Opus 4.5

CometAPI
AnnaNov 24, 2025
Como usar a API do Claude Opus 4.5

A Anthropic lançou o Claude Opus 4.5 no final de novembro de 2025 como um modelo da classe Opus mais robusto e eficiente, voltado para engenharia de software profissional, fluxos de trabalho com agentes e tarefas de longo prazo. Disponível na plataforma de desenvolvedores da Anthropic e via CometAPI, o Claude Opus 4.5 introduz novos controles de API (notadamente o parâmetro de esforço), ferramentas aprimoradas para uso computacional, pensamento expandido e melhorias na eficiência de tokens que fazem a diferença em produção.

A seguir, apresentamos um guia prático e profissional: o que mudou, como obter acesso, como usar os novos controles (esforço, pensamento estratégico, uso de ferramentas, uso de arquivos/computadores), orientações sobre custos e otimização, considerações de segurança/governança e padrões de integração no mundo real.

O que exatamente é Claude Opus 4.5 e por que isso é importante?

Claude Opus 4.5 é o membro mais recente da família de modelos Opus da Anthropic (lançado entre 24 e 25 de novembro de 2025), com foco em máxima capacidade de raciocínio e codificação, além de aprimorar a eficiência de tokens e oferecer novos controles de API para equilibrar custo e abrangência. A Anthropic posiciona o Opus 4.5 como o "modelo mais inteligente" já lançado, voltado para tarefas complexas de engenharia de software, agentes de longa duração, automação de planilhas/Excel e tarefas que exigem raciocínio contínuo em várias etapas.

Quais são as principais atualizações do Opus 4.5?

A Anthropic projetou o Opus 4.5 para melhorar profundidade de raciocínio e agente comportamento, ao mesmo tempo que oferece aos desenvolvedores melhor controle sobre as compensações entre custo e latência. Os principais destaques desta versão são:

  • Parâmetro de esforço (beta): um parâmetro de API de primeira classe que controla quanto do "orçamento de pensamento" Claude gasta em uma solicitação (geralmente low, medium, highIsso influencia o raciocínio, as chamadas de ferramentas e os tokens internos de "pensamento", permitindo ajustar a velocidade versus a abrangência a cada chamada, em vez de alternar entre modelos. Essa é uma funcionalidade exclusiva do Opus 4.5.
  • Melhor orquestração de agentes e ferramentas: Precisão aprimorada na seleção de ferramentas, chamadas de ferramentas mais bem estruturadas e um fluxo de trabalho ferramenta-resultado mais robusto para a criação de agentes e pipelines de várias etapas. A Anthropic fornece documentação e orientações do SDK para o fluxo de "uso de ferramentas".
  • Token / eficiência de custo — A Anthropic relata reduções de até 50% no uso de tokens para alguns fluxos de trabalho em comparação com o Sonnet 4.5, além de menos erros de chamada de ferramentas e menos iterações para tarefas complexas de engenharia.
  • Capacidades multimodais aprimoradas: Melhorias abrangentes no desempenho visual, de raciocínio e matemático.
  • A janela de contexto foi expandida para 200 mil tokens, permitindo conversas longas e aprofundadas e análises complexas de documentos.

Quais capacidades práticas foram aprimoradas?

Atualização de desempenho

  • Melhor orquestração de agentes e ferramentas: maior precisão na escolha de ferramentas, chamadas de ferramentas mais bem estruturadas e um fluxo de trabalho ferramenta-resultado mais robusto para a criação de agentes e pipelines de várias etapas. A Anthropic fornece documentação e orientações do SDK para o fluxo de "uso de ferramentas". O gerenciamento de contexto aprimorado, os auxiliares de compactação para execuções longas de agentes e os SDKs de ferramentas de primeira linha para registro e validação de ferramentas tornam o Opus 4.5 melhor para a criação de agentes que são executados de forma autônoma por várias etapas.
  • Capacidades multimodais aprimoradas: Melhorias abrangentes no desempenho visual, de raciocínio e matemático.
  • A janela de contexto foi expandida para 200 mil tokens, permitindo conversas longas e aprofundadas e análises complexas de documentos.

Programação e trabalho de longo prazo

O Opus 4.5 continua a ser orientado por benchmarks para tarefas de codificação; ele reduz o número de iterações e erros de chamadas de ferramentas durante trabalhos longos (migração de código, refatoração, depuração em várias etapas). Os primeiros relatórios e a ficha técnica do sistema da Anthropic apontam para um desempenho sustentado aprimorado em benchmarks de engenharia e ganhos de eficiência significativos em pipelines orientados por ferramentas.

In SWE-bench, O Opus 4.5 apresenta excelentes resultados em benchmarks de engenharia de software (a Anthropic lista 80.9% no SWE-bench Verified em seu material de lançamento), e os clientes relatam melhorias na depuração, edição de múltiplos arquivos e tarefas de código de longo prazo.

Claude Opus 4.5-SWE-1

Custo e Eficiência

A Anthropic projetou o Opus 4.5 para melhorar profundidade de raciocínio e agente comportamento, ao mesmo tempo que oferece aos desenvolvedores maior controle sobre a relação custo/latência:

  • Redução de preço em comparação com o Opus 4.1: US$ 5 (entrada) / US$ 25 (saída) por milhão de tokens.
  • Melhoria no uso de tokens: redução média de 50 a 75% no consumo, mantendo o desempenho.
  • um parâmetro de API de primeira classe que controla quanto do "orçamento de pensamento" Claude gasta em uma solicitação (geralmente low, medium, highIsso influencia o raciocínio, as chamadas de ferramentas e os tokens internos de "pensamento", permitindo ajustar a velocidade versus a abrangência a cada chamada, em vez de alternar entre modelos. Essa é uma funcionalidade exclusiva do Opus 4.5 (em comparação com o Sonnet 4.5: Esforço Médio → 76% menos tokens, desempenho comparável; Alto Esforço → melhoria de desempenho de 4.3%, redução de 48% no uso de tokens).

Como faço para acessar e usar a API do Claude Opus 4.5?

Como posso obter acesso e chaves?

  1. Crie uma conta de desenvolvedor Anthropic/Claude. Cadastre-se no portal de desenvolvedores da Claude/Anthropic e crie uma chave de API pelo Console (existem fluxos de organização/administração para equipes). A API de Mensagens é o endpoint principal para interações de chat/assistente.
  2. Parceiros de nuvem: O Opus 4.5 também está disponível nos principais marketplaces de nuvem, como o Google Vertex AI. CometAPI(Uma plataforma de agregação de APIs de IA, que requer autenticação) No CometAPI, você pode acessar a API Claude opus 4.5 através dos formatos de Mensagens Antropológicas e Chat.

Como devo autenticar minhas solicitações?

Use tokens de portador padrão: inclua um Authorization: Bearer $_API_KEY Um cabeçalho é enviado em cada chamada de API. As requisições são feitas em JSON via HTTPS; a API de Mensagens aceita uma lista de mensagens estruturadas (sistema + usuário + assistente).

Guia de início rápido — Python (SDK oficial)

Instale o SDK:

pip install anthropic

Exemplo mínimo (síncrono):

import os
from anthropic import Anthropic

# expects ANTHROPIC_API_KEY in env

client = Anthropic(api_key=os.environ)

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    max_tokens=512,
)

print(resp.content.text)  # SDK returns structured content blocks

Esta chamada utiliza o identificador de modelo canônico do Opus 4.5. Para endpoints gerenciados pelo provedor (Vertex, CometAPI, Foundry), siga a documentação do provedor para construir o cliente e fornecer a URL e a chave do provedor (por exemplo, https://api.cometapi.com/v1/messages para CometAPI).

Guia de Introdução — Python (CometAPI)

Você precisa fazer login no CometAPI e obter uma chave.

curl 
--location 
--request POST 'https://api.cometapi.com/v1/messages' \ 
--header 'Authorization: Bearer ' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "model": "claude-opus-4-5-20251101", "max_tokens": 1000, "thinking": { "type": "enabled", "budget_tokens": 1000 }, "messages":  }'

Como faço para usar o novo esforço Parâmetro e pensamento expandido?

O que é a sessão esforço parâmetro e como faço para configurá-lo?

O esforço O parâmetro é um controle de API de primeira classe introduzido no Opus 4.5 que ajusta a quantidade de computação interna e orçamento de tokens que o modelo gasta para produzir sua saída. Os valores típicos são low, medium e highUse-o para equilibrar a latência e o custo do token com a abrangência do processo:

  • low — Respostas rápidas e com uso eficiente de tokens para automação de alto volume e tarefas rotineiras.
  • medium — Equilíbrio entre qualidade e custo para uso na produção.
  • high — análise profunda, raciocínio em várias etapas ou quando a precisão é fundamental.

Antrópico introduzido effort para Opus 4.5 (beta). Você deve incluir um cabeçalho beta (por exemplo, effort-2025-11-24) e especifique output_config: { "effort": "low|medium|high" } (exemplo mostrado abaixo). high é o comportamento padrão. Reduzir o esforço diminui o uso de tokens e a latência, mas pode reduzir ligeiramente a abrangência. Use-o para tarefas de alto desempenho ou sensíveis à latência.

Exemplo:

# Example using the beta messages API shown in Anthropic docs

from anthropic import Anthropic
import os

client = Anthropic(api_key=os.getenv("ANTHROPIC_API_KEY"))

response = client.beta.messages.create(
    model="claude-opus-4-5-20251101",
    betas=,   # required beta header

    messages=,
    max_tokens=1500,
    output_config={"effort": "medium"}  # low | medium | high

)

print(response)

Quando usar cada um: usar low para fluxos de trabalho automatizados (por exemplo, categorização de e-mails), medium para assistentes padrão, e high Para geração de código, pesquisa aprofundada ou tarefas sensíveis ao risco. A Anthropic destaca esse parâmetro como um controle fundamental para o Opus 4.5.

No teste SWE-bench:

  • No modo de esforço médio: o desempenho é comparável ao do Sonnet 4.5, mas os tokens de saída são reduzidos em 76%;
  • No modo de Alto Esforço: o desempenho supera o do Sonnet 4.5 em aproximadamente 4.3 pontos percentuais, e os tokens são reduzidos em 48%.

Claude Opus 4.5-SWE-2

O que é o Pensamento Expandido e como posso invocá-lo?

O Pensamento Estendido (também chamado de "blocos de pensamento") permite que o modelo execute cadeias intermediárias de raciocínio ou raciocínio passo a passo, preservando ou resumindo opcionalmente os blocos de pensamento internos. A API de Mensagens oferece suporte a esse comportamento e a Anthropic adicionou controles para preservar blocos de pensamento anteriores, permitindo que agentes com múltiplas interações reutilizem raciocínios anteriores sem a necessidade de recálculos dispendiosos. Utilize o pensamento estendido quando a tarefa exigir planejamento em várias etapas, resolução de problemas de longo prazo ou orquestração de ferramentas.

Como faço para integrar ferramentas e criar agentes com o Opus 4.5?

Um dos principais pontos fortes do Opus 4.5 é a melhoria. uso da ferramentaDefina as ferramentas no seu cliente, deixe o Claude decidir quando chamá-las, execute a ferramenta e retorne o resultado. tool_result — Claude usará esses resultados em sua resposta final. A Anthropic fornece SDKs de Agente que permitem registrar funções de ferramentas tipadas (por exemplo, run_shell, call_api, search_docs) que Claude pode descobrir e invocar durante o processo de raciocínio prolongado. A plataforma converte definições de ferramentas em funções que o modelo pode chamar e das quais pode receber resultados. É assim que se criam fluxos de trabalho agéticos com segurança (com entradas/saídas controladas).

A seguir, apresentamos um padrão prático e um exemplo completo em Python.

Padrão de uso de ferramentas (conceitual)

  1. Suprimentos do cliente tools metadados com nome, descrição e esquema JSON (input_schema).
  2. O modelo retorna um tool_use quadra (instruções estruturadas do modelo para chamar uma ferramenta específica com entradas específicas). A resposta da API stop_reason pode ser tool_use.
  3. O cliente executa a ferramenta. (Seu código chama a API externa ou uma função local).
  4. O cliente envia uma mensagem de acompanhamento. com role:"user" e uma tool_result Bloco de conteúdo contendo os resultados da ferramenta.
  5. O modelo consome o resultado da ferramenta e retorna a resposta final ou realiza novas chamadas à ferramenta.

Esse fluxo permite o controle seguro, por parte do cliente, sobre o que o modelo executa (o modelo). propõe A ferramenta chama; você controla a execução).

Exemplo completo — Python (ferramenta simples de previsão do tempo)

# 1) Define tools metadata and send initial request

from anthropic import Anthropic
import os, json

client = Anthropic(api_key=os.environ)

tools = [
    {
        "name": "get_weather",
        "description": "Return the current weather for a given city.",
        "input_schema": {"type":"object","properties":{"city":{"type":"string"}},"required":}
    }
]

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    tools=tools,
    max_tokens=800,
)

# 2) Check if Claude wants a tool call

stop_reason = resp.stop_reason  # SDK field

if stop_reason == "tool_use":
    # Extract the tool call (format varies by SDK; this is schematic)

    tool_call = resp.tool_calls  # e.g., {"name":"get_weather", "input":{"city":"Tokyo"}}

    tool_name = tool_call
    tool_input = tool_call

    # 3) Execute the tool client-side (here: stub)

    def get_weather(city):
        # Replace this stub with a real weather API call

        return {"temp_c": 12, "condition": "Partly cloudy"}

    tool_result = get_weather(tool_input)

    # 4) Send tool_result back to Claude

    follow_up = client.messages.create(
        model="claude-opus-4-5-20251101",
        messages=[
            {"role":"user", "content":[{"type":"tool_result",
                                        "tool_use_id": resp.tool_use_id,
                                        "content": json.dumps(tool_result)}]}
        ],
        max_tokens=512,
    )

    print(follow_up.content.text)
else:
    print(resp.content.text)

Como estruturar os agentes para garantir confiabilidade?

  • Higienizar entradas da ferramenta (evitar injeção por meio de instruções).
  • Validar os resultados da ferramenta antes de os realimentar ao modelo (verificações de esquema).
  • Limitar o escopo da ferramenta (princípio do menor privilégio).
  • Use auxiliares de compactação (dos SDKs Antrópicos) para manter o contexto gerenciável em longas execuções.

Como devo elaborar os prompts e estruturar as mensagens para o Opus 4.5?

Quais funções de mensagem e estratégias de preenchimento automático funcionam melhor?

Utilize um padrão de três partes:

  • System (função: sistema): instruções globais — tom, diretrizes, função.
  • Assistente (opcional): exemplos prontos ou conteúdo introdutório.
  • Utilizador (função: usuário): a solicitação imediata.

Preencha previamente a mensagem do sistema com restrições (formato, comprimento, política de segurança, esquema JSON, caso deseje uma saída estruturada). Para agentes, inclua especificações de ferramentas e exemplos de uso para que o Opus 4.5 possa invocá-las corretamente.

Como faço para usar a compactação de contexto e o cache de prompts para salvar tokens?

  • Compactação de contexto: Comprima partes antigas de uma conversa em resumos concisos que o modelo ainda possa usar. O Opus 4.5 oferece suporte à automação para compactar o contexto sem perder blocos de raciocínio críticos.
  • Cache de prompts: Respostas do modelo de cache para solicitações repetidas (o Anthropic fornece padrões de cache de solicitações para reduzir a latência/custo).

Ambas as funcionalidades reduzem o consumo de tokens em interações longas e são recomendadas para fluxos de trabalho de agentes de longa duração e assistentes de produção.

Tratamento de erros e boas práticas

A seguir, apresentamos recomendações práticas de confiabilidade e segurança para a integração em produção com o Opus 4.5.

Confiabilidade e novas tentativas

  • Lidar com limites de taxa (HTTP 429) com recuo exponencial e jitter (começa em 500–1000ms).
  • IdempotênciaPara chamadas LLM não mutativas, você pode tentar novamente com segurança, mas tenha cuidado em fluxos de trabalho onde o modelo aciona efeitos colaterais externos (chamadas de ferramentas) — elimine duplicatas rastreando tool_use_id ou seus próprios IDs de solicitação.
  • Estabilidade do streaming: Lidar com fluxos parciais e reconectar de forma adequada; se ocorrer uma interrupção, preferir tentar novamente toda a solicitação ou retomar usando o estado em nível de aplicativo para evitar interações inconsistentes entre ferramentas.

Segurança e proteção

  • Injeção rápida e segurança da ferramenta: nunca Permita que o modelo execute diretamente comandos ou código arbitrários do shell sem validação. Sempre valide as entradas das ferramentas e higienize as saídas. O modelo propõe chamadas de ferramentas; seu código decide se as executará. O cartão de sistema e a documentação do Anthropic descrevem as restrições de alinhamento e os níveis de segurança — siga-os para domínios de alto risco.
  • Tratamento e conformidade de dados: Trate as solicitações e as entradas/saídas das ferramentas que contenham informações pessoais identificáveis ​​(PII) ou dados regulamentados de acordo com sua política legal/de conformidade. Use os controles corporativos/VPC do provedor se você tiver requisitos rigorosos de residência de dados ou auditoria (Bedrock/Vertex/Foundry oferecem opções corporativas).

Observabilidade e controle de custos

  • Registrar metadados de solicitação/resposta (não é conteúdo sensível bruto, a menos que seja permitido) — contagem de tokens, effort Nível, latência, ID do modelo e provedor. Essas métricas são essenciais para a atribuição de custos e depuração.
  • Use o esforço para controlar o custo por chamada.:prefiro low esforço para sumarização de rotina ou endpoints de alta QPS; usar high Esforço para depuração ou investigações aprofundadas. Monitore a qualidade em relação ao consumo de tokens para escolher valores padrão para diferentes endpoints.

Conclusão — Quando (e como) você deve escolher o Opus 4.5?

Claude Opus 4.5 é a escolha natural quando seu produto precisa de:

  • raciocínio profundo em várias etapas (longas cadeias de lógica, pesquisa ou depuração),
  • orquestração robusta de agentes/ferramentas (fluxos de trabalho complexos que invocam APIs externas), ou
  • Assistência com código de nível de produção em grandes bases de código.

Operacionalmente, use esforço Para ajustar os orçamentos por chamada, confie no padrão de uso da ferramenta para manter a segurança da execução e escolha um parceiro de nuvem (ou a API da Anthropic diretamente) com base em suas necessidades de conformidade. Compare com seu próprio conjunto de dados: os números dos fornecedores (SWE-bench etc.) são indicadores úteis, mas sua tarefa e seus dados reais determinam o ROI. Para segurança, siga o guia do sistema Opus 4.5 e estabeleça medidas de proteção em torno da execução da ferramenta e do tratamento de informações pessoais identificáveis ​​(PII).

Os desenvolvedores podem acessar API Claude Opus 4.5 por meio da CometAPI. Para começar, explore os recursos do modelo deCometAPI no Playground e consulte o guia da API para obter instruções detalhadas. Antes de acessar, certifique-se de ter feito login na CometAPI e obtido a chave da API. CometAPI oferecem um preço muito mais baixo que o preço oficial para ajudar você a se integrar.

Pronto para ir?→ Inscreva-se no CometAPI hoje mesmo !

Se você quiser saber mais dicas, guias e novidades sobre IA, siga-nos em VKX e  Discord!

Leia Mais

500+ Modelos em Uma API

Até 20% de Desconto