Как использовать API Claude Opus 4.5

Anthropic выпустила Claude Opus 4.5 в конце ноября 2025 года как более мощную и более эффективную модель класса Opus, нацеленную на профессиональную разработку программного обеспечения, агентные рабочие процессы и задачи с длинным горизонтом. Он доступен через платформу для разработчиков Anthropic и через CometAPI и вводит новые управляющие параметры API (особенно параметр effort), улучшенные средства компьютерного взаимодействия, расширенное мышление и улучшения эффективности по токенам, которые важны в продакшене.

Ниже приведено практическое, профессиональное руководство: что изменилось, как получить доступ, как использовать новые параметры (effort, extended thinking, tool use, files/computer use), рекомендации по стоимости и оптимизации, вопросы безопасности/управления и реальные шаблоны интеграции.

Что такое Claude Opus 4.5 и почему это важно?

Claude Opus 4.5 — это новейший представитель семейства моделей класса Opus от Anthropic (релиз 24–25 ноября 2025 года), ориентированный на максимальные возможности рассуждения и кодирования при одновременном улучшении эффективности по токенам и предоставлении новых средств управления API для балансировки стоимости и тщательности. Anthropic позиционирует Opus 4.5 как «самую интеллектуальную модель», нацеленную на сложные задачи в разработке ПО, долгоживущих агентов, автоматизацию в таблицах/Excel и задачи, требующие устойчивого многошагового рассуждения.

Какие основные обновления в Opus 4.5?

Anthropic спроектировала Opus 4.5 для улучшения глубины рассуждений и агентного поведения, одновременно предоставляя разработчикам лучший контроль над компромиссами между стоимостью и задержкой. Основные моменты релиза:

Параметр effort (beta): первоклассный регулятор API, управляющий тем, сколько «бюджета на размышления» Claude тратит на запрос (обычно low, medium, high). Он влияет на рассуждение, вызовы инструментов и внутренние «thinking»-токены, так что вы можете настраивать скорость и тщательность на уровне каждого вызова вместо переключения моделей. Это фирменная возможность Opus 4.5.
Лучшая оркестрация агентов и инструментов: более точный выбор инструментов, лучше структурированные вызовы инструментов и более надёжный цикл результатов инструментов для построения агентов и многошаговых конвейеров. Anthropic предоставляет документацию и рекомендации SDK по потоку «tool use».
Эффективность по токенам/стоимости — Anthropic сообщает о сокращении использования токенов до ~50% для некоторых рабочих процессов по сравнению с Sonnet 4.5, а также о меньшем числе ошибок вызова инструментов и меньшем числе итераций для сложных инженерных задач.
Улучшенные мультимодальные возможности: комплексные улучшения в области визуального восприятия, рассуждений и математики.
Окно контекста расширено до 200K токенов, поддерживая глубокие, длительные диалоги и анализ сложных документов.

Какие практические возможности улучшены?

Обновление производительности

Лучшая оркестрация агентов и инструментов: повышена точность выбора инструментов, улучшена структура вызовов инструментов и более надёжный цикл обработки результатов для построения агентов и многошаговых пайплайнов. Anthropic поставляет документацию и рекомендации SDK по потоку «tool use». Улучшена работа с контекстом, добавлены помощники компактации для длительных запусков агентов и предоставлены первоклассные SDK инструментов для регистрации и валидации инструментов — всё это делает Opus 4.5 лучше для построения агентов, работающих без присмотра много шагов подряд.
Улучшенные мультимодальные возможности: комплексные улучшения в визуальном восприятии, рассуждении и математике.
Окно контекста расширено до 200K токенов, что поддерживает длительные разговоры и анализ сложных документов.

Кодирование и задачи с длинным горизонтом

Opus 4.5 остаётся ориентированным на бенчмарки для задач программирования; он сокращает число итераций и ошибок вызовов инструментов во время долгих заданий (миграция кода, рефакторинг, многошаговая отладка). Ранние отчёты и системная карточка Anthropic отмечают улучшенную устойчивую производительность на инженерных бенчмарках и значительный выигрыш в эффективности в конвейерах, управляемых инструментами.

В SWE-bench Opus 4.5 демонстрирует лидирующие показатели на бенчмарках по разработке ПО (Anthropic указывает 80,9% на SWE-bench Verified в материалах запуска), а клиенты сообщают об улучшениях в отладке, правках в нескольких файлах и задачах с длинным горизонтом в коде.

Claude Opus 4.5-SWE-1

Стоимость и эффективность

Anthropic разработала Opus 4.5 для улучшения глубины рассуждений и агентного поведения, одновременно предоставляя разработчикам лучший контроль над компромиссами между стоимостью и задержкой:

Снижение цены по сравнению с Opus 4.1: $5 (вход) / $25 (выход) за миллион токенов.
Улучшение использования токенов: среднее снижение потребления на 50–75% при сохранении качества.
первоклассный регулятор API, который управляет тем, сколько «бюджета на размышления» Claude тратит на запрос (обычно low, medium, high). Он влияет на рассуждение, вызовы инструментов и внутренние «thinking»-токены, чтобы вы могли настраивать скорость и тщательность на уровне каждого вызова вместо переключения моделей. Это фирменная возможность Opus 4.5 (по сравнению с Sonnet 4.5: Medium Effort → на 76% меньше токенов при сопоставимой производительности; High Effort → прирост производительности ~4,3 п.п., снижение использования токенов на 48%).

Как получить доступ и использовать API Claude Opus 4.5?

Как получить доступ и ключи?

Создайте учётную запись разработчика Anthropic / Claude. Зарегистрируйтесь на портале разработчика Claude/Anthropic и создайте ключ API в Консоли (для команд доступны потоки организации/администрирования). Messages API — основной эндпоинт для взаимодействий в стиле чата/ассистента.
Облачные партнёры: Opus 4.5 также доступен через крупные облачные маркетплейсы Google Vertex AI, CometAPI (платформа агрегирования AI API; требуется её аутентификация). В CometAPI вы можете обращаться к API Claude Opus 4.5 через формат Anthropic Messages и Chat.

Как аутентифицировать запросы?

Используйте стандартные Bearer-токены: добавляйте заголовок Authorization: Bearer $_API_KEY в каждый вызов API. Запросы — JSON через HTTPS; Messages API принимает список структурированных сообщений (system + user + assistant).

Быстрый старт — Python (официальный SDK)

Установите SDK:

pip install anthropic

Минимальный пример (синхронный):

import os
from anthropic import Anthropic

# expects ANTHROPIC_API_KEY in env

client = Anthropic(api_key=os.environ)

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    max_tokens=512,
)

print(resp.content.text)  # SDK returns structured content blocks

Этот вызов использует канонический идентификатор модели Opus 4.5. Для управляемых провайдером эндпоинтов (Vertex, CometAPI, Foundry) следуйте документации провайдера для создания клиента и указания URL и ключа провайдера (например, https://api.cometapi.com/v1/messages для CometAPI).

Быстрый старт — Python (CometAPI)

Вам нужно войти в CometAPI и получить ключ.

curl 
--location 
--request POST 'https://api.cometapi.com/v1/messages' \ 
--header 'Authorization: Bearer ' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "model": "claude-opus-4-5-20251101", "max_tokens": 1000, "thinking": { "type": "enabled", "budget_tokens": 1000 }, "messages":  }'

Как использовать новый параметр effort и расширенное мышление?

Что такое параметр effort и как его задать?

Параметр effort — это первоклассное управление API, введённое в Opus 4.5, которое настраивает, сколько внутренних вычислений и токенов модель тратит на формирование ответа. Типичные значения: low, medium и high. Используйте его, чтобы балансировать задержку и стоимость против тщательности:

low — быстрые и экономные по токенам ответы для массовой автоматизации и рутинных задач.
medium — сбалансированное качество/стоимость для продакшена.
high — глубокий анализ, многошаговое рассуждение или когда точность особенно важна.

Anthropic представила effort для Opus 4.5 (beta). Необходимо добавить бета-заголовок (например, effort-2025-11-24) и указать output_config: { "effort": "low|medium|high" } (пример ниже). По умолчанию используется high. Снижение effort уменьшает использование токенов и задержку, но может немного снизить тщательность. Применяйте для задач с высоким трафиком или чувствительных к задержке.

Пример:

# Example using the beta messages API shown in Anthropic docs

from anthropic import Anthropic
import os

client = Anthropic(api_key=os.getenv("ANTHROPIC_API_KEY"))

response = client.beta.messages.create(
    model="claude-opus-4-5-20251101",
    betas=,   # required beta header

    messages=,
    max_tokens=1500,
    output_config={"effort": "medium"}  # low | medium | high

)

print(response)

Когда что использовать: применяйте low для автоматизированных конвейеров (например, классификации писем), medium — для стандартных ассистентов, high — для генерации кода, глубоких исследований или задач с повышенными рисками. Anthropic выделяет этот параметр как ключевой контроль для Opus 4.5.

В тесте SWE-bench:

В режиме Medium Effort: производительность сопоставима с Sonnet 4.5, но выходных токенов на 76% меньше;

В режиме High Effort: производительность выше Sonnet 4.5 примерно на 4,3 п.п., а использование токенов снижено на 48%.

Claude Opus 4.5-SWE-2

Что такое Extended Thinking и как его вызвать?

Extended Thinking (также называемое «extended thinking» или «thinking blocks») позволяет модели выполнять промежуточные цепочки рассуждений или пошаговое мышление с возможностью сохранения или суммирования внутренних блоков мыслей. Messages API поддерживает это поведение, а Anthropic добавила средства для сохранения предыдущих блоков рассуждений, чтобы многоходовые агенты могли повторно использовать раннее мышление без повторных дорогостоящих вычислений. Используйте Extended Thinking, когда задача требует многошагового планирования, долгосрочного решения проблем или оркестрации инструментов.

Как интегрировать инструменты и строить агентов с Opus 4.5?

Одно из ключевых достоинств Opus 4.5 — улучшенный tool use: определите инструменты на стороне клиента, позвольте Claude решать, когда их вызвать, выполните инструмент и верните tool_result — Claude использует эти результаты в итоговом ответе. Anthropic предоставляет Agent SDK, позволяющие регистрировать типизированные функции-инструменты (например, run_shell, call_api, search_docs), которые Claude может обнаруживать и вызывать в процессе расширенного мышления. Платформа преобразует определения инструментов в вызываемые функции, которые модель может вызвать и получить от них результаты. Так вы строите агентные рабочие процессы безопасно (с контролируемыми входами/выходами).

Ниже — практический шаблон и сквозной пример на Python.

Шаблон использования инструментов (концептуально)

Клиент предоставляет метаданные tools с именем, описанием и JSON-схемой (input_schema).
Модель возвращает блок tool_use (структурированная инструкция вызвать конкретный инструмент с определёнными входными данными). Поле ответа API stop_reason может быть tool_use.
Клиент выполняет инструмент (ваш код вызывает внешний API или локальную функцию).
Клиент отправляет последующее сообщение с role:"user" и блоком tool_result в контенте, содержащим результаты инструмента.
Модель использует результат инструмента и возвращает финальный ответ или дополнительные вызовы инструментов.

Этот поток позволяет безопасно контролировать выполнение на стороне клиента (модель лишь предлагает вызовы инструментов; вы контролируете их выполнение).

Сквозной пример — Python (простая «погодная» утилита)

# 1) Define tools metadata and send initial request

from anthropic import Anthropic
import os, json

client = Anthropic(api_key=os.environ)

tools = [
    {
        "name": "get_weather",
        "description": "Return the current weather for a given city.",
        "input_schema": {"type":"object","properties":{"city":{"type":"string"}},"required":}
    }
]

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    tools=tools,
    max_tokens=800,
)

# 2) Check if Claude wants a tool call

stop_reason = resp.stop_reason  # SDK field

if stop_reason == "tool_use":
    # Extract the tool call (format varies by SDK; this is schematic)

    tool_call = resp.tool_calls  # e.g., {"name":"get_weather", "input":{"city":"Tokyo"}}

    tool_name = tool_call
    tool_input = tool_call

    # 3) Execute the tool client-side (here: stub)

    def get_weather(city):
        # Replace this stub with a real weather API call

        return {"temp_c": 12, "condition": "Partly cloudy"}

    tool_result = get_weather(tool_input)

    # 4) Send tool_result back to Claude

    follow_up = client.messages.create(
        model="claude-opus-4-5-20251101",
        messages=[
            {"role":"user", "content":[{"type":"tool_result",
                                        "tool_use_id": resp.tool_use_id,
                                        "content": json.dumps(tool_result)}]}
        ],
        max_tokens=512,
    )

    print(follow_up.content.text)
else:
    print(resp.content.text)

Как структурировать агентов для надёжной работы?

Санитизируйте входы инструментов (избегайте инъекций через подсказки).
Валидируйте выходы инструментов перед тем, как передавать их обратно модели (проверки схемы).
Ограничивайте область действия инструментов (принцип наименьших привилегий).
Используйте помощники компактации (из SDK Anthropic), чтобы держать контекст управляемым при длительных прогонах.

Как проектировать подсказки и структурировать сообщения для Opus 4.5?

Какие роли сообщений и стратегии префилла работают лучше всего?

Используйте трёхкомпонентный шаблон:

System (роль: system): глобальные инструкции — тон, ограничения, роль.
Assistant (необязательно): готовые примеры или прайминг-контент.
User (роль: user): непосредственный запрос.

Заполните системное сообщение ограничениями (формат, длина, политика безопасности, схема JSON, если нужен структурированный вывод). Для агентов включайте спецификации инструментов и примеры использования, чтобы Opus 4.5 корректно вызывал эти инструменты.

Как использовать компактацию контекста и кэширование подсказок для экономии токенов?

Компактация контекста: сжимайте старые части диалога в краткие сводки, которые модель всё ещё может использовать. Opus 4.5 поддерживает автоматизацию для компактации контекста без потери критических блоков рассуждений.
Кэширование подсказок: кэшируйте ответы модели для повторяющихся подсказок (Anthropic предлагает паттерны кэширования подсказок, снижающие задержку/стоимость).

Обе функции уменьшают токенную нагрузку при долгих взаимодействиях и рекомендуются для долгоживущих агентов и продакшен-ассистентов.

Обработка ошибок и лучшие практики

Ниже — прагматичные рекомендации по надёжности и безопасности для продакшен-интеграции Opus 4.5.

Надёжность и повторные попытки

Обрабатывайте лимиты скорости (HTTP 429) с экспоненциальным бэкоффом и джиттером (начните с 500–1000 мс).
Идемпотентность: для немодифицирующих вызовов LLM можно безопасно повторять попытки, но будьте осторожны в потоках, где модель инициирует внешние побочные эффекты (вызовы инструментов) — дедуплицируйте, отслеживая tool_use_id или собственные идентификаторы запросов.
Стабильность стриминга: обрабатывайте частичные потоки и корректно переподключайтесь; при прерывании предпочтительно повторить весь запрос или продолжить, используя состояние приложения, чтобы избежать несогласованных взаимодействий с инструментами.

Безопасность и соответствие

Prompt injection и безопасность инструментов: никогда не позволяйте модели напрямую выполнять произвольные команды оболочки или код без проверки. Всегда валидируйте входы инструментов и санитизируйте выходы. Модель предлагает вызовы инструментов; ваш код решает, запускать их или нет. Системная карточка Anthropic и документация описывают ограничения по выравниванию и уровни безопасности — следуйте им для областей повышенного риска.
Обработка данных и комплаенс: обращайтесь с подсказками и входами/выходами инструментов, содержащими PII или регулируемые данные, согласно вашей политике и законодательству. Используйте корпоративные контролируемые опции провайдера (Bedrock / Vertex / Foundry), если вам нужны строгая локализация данных или аудируемость.

Наблюдаемость и контроль затрат

Логируйте метаданные запросов/ответов (не сырой чувствительный контент, если это не разрешено) — количество токенов, уровень effort, задержку, идентификатор модели и провайдера. Эти метрики важны для распределения затрат и отладки.
Используйте effort для контроля стоимости на вызов: предпочитайте low для рутинной суммаризации или высокочастотных эндпоинтов; применяйте high для глубокой отладки или расследований. Мониторьте качество и потребление токенов, чтобы выбрать значения по умолчанию для разных эндпоинтов.

Вывод — когда (и как) выбирать Opus 4.5?

Claude Opus 4.5 — естественный выбор, когда вашему продукту нужны:

глубокое многошаговое рассуждение (длинные цепочки логики, исследования или отладка),
надёжная оркестрация агентов/инструментов (сложные рабочие процессы с вызовами внешних API), или
продакшен-уровневая помощь в коде по большим кодовым базам.

Операционно используйте effort для тонкой настройки бюджета на каждый вызов; опирайтесь на паттерн использования инструментов для безопасного исполнения и выбирайте облачного партнёра (или прямой Anthropic API) на основе требований к соответствию. Тестируйте на своей выборке: вендорные цифры (SWE-bench и т.п.) полезны как ориентир, но ROI определяют ваши реальные задачи и данные. Для безопасности следуйте системной карточке Opus 4.5 и устанавливайте защитные ограждения вокруг исполнения инструментов и обработки PII.

Разработчики могут получить доступ к Claude Opus 4.5 API через CometAPI. Чтобы начать, изучите возможности модели на CometAPI в Playground и обратитесь к руководству по API для подробных инструкций. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. CometAPI предлагает цену, значительно ниже официальной, чтобы упростить интеграцию.

Готовы начать? → Зарегистрируйтесь в CometAPI уже сегодня!

Если вы хотите получать больше советов, гайдов и новостей об ИИ, подписывайтесь на нас в VK, X и Discord!