Interfejs API O4-mini został zaprojektowany tak, aby zapewnić wysoką wydajność w takich zadaniach, jak matematyka, kodowanie, nauki ścisłe i rozumowanie wizualne, przy jednoczesnym zachowaniu efektywności i dostępności.

Omówienie
o4-mini jest częścią serii o OpenAI, rodziny modeli wytrenowanych do rozważania przed udzieleniem odpowiedzi, co skutkuje wyższą jakością odpowiedzi na złożone zapytania. Wyróżnia się zdolnością do integrowania narzędzi, takich jak przeglądanie stron internetowych, wykonywanie kodu Python, przetwarzanie obrazów i generowanie obrazów, co pozwala mu rozwiązywać problemy wieloetapowe z poziomem autonomii zbliżonym do zachowania agenta.
Główne cechy o4-mini
- Rozumowanie wizualne:o4-mini może przetwarzać i rozumować na podstawie obrazów, w tym niskiej jakości wizualizacji, takich jak rozmazane zdjęcia lub szkice. Może manipulować obrazami (np. obracając, powiększając), aby wspierać zadania takie jak interpretowanie diagramów lub rysunków naukowych.
- Integracja narzędzi:Ma pełny dostęp do narzędzi ChatGPT, obejmujących wyszukiwanie w sieci, analizę plików za pomocą języka Python i generowanie obrazów, co czyni go wszechstronnym narzędziem do złożonych przepływów pracy.
- Naturalność konwersacyjna:Model ten charakteryzuje się lepszym zrozumieniem instrukcji i może odwoływać się do wcześniejszych rozmów, co zwiększa jego użyteczność w środowiskach interaktywnych.
- Wydajność i skalowalność:Zoptymalizowany pod kątem zapytań o dużej liczbie użytkowników, o4-mini obsługuje wyższe limity wykorzystania niż o3, co sprawia, że jest idealny do zastosowań w realnym świecie.
- Opłacalność:W cenie 1.10 USD za wejście i 4.40 USD za wyjście za milion tokenów, oferuje konkurencyjny kompromis między szybkością, ceną i wydajnością.
Dane techniczne o4-mini
Architektura modeli i szkolenia
- Rozmiar i wydajność:W porównaniu do o3, o4-mini jest mniejszym modelem, zaprojektowanym z myślą o wydajności. Priorytetem jest szybkość i oszczędność, bez uszczerbku dla wydajności.
- Podejście szkolenioweWykorzystuje uczenie maszynowe na dużą skalę, zgodnie z trendem, w którym zwiększone zasoby obliczeniowe poprawiają wydajność modelu.
- Możliwości API: Obsługuje wywoływanie funkcji dla niestandardowych narzędzi i jest dostępny za pośrednictwem API Chat Completions i API Responses. Przyszłe aktualizacje będą obejmować wbudowane narzędzia, takie jak wyszukiwanie w sieci, wyszukiwanie plików i interpreter kodu.
Bezpieczeństwo i gotowość
- Protokoły bezpieczeństwa:o4-mini został poddany rygorystycznym testom wytrzymałościowym w ramach programu bezpieczeństwa OpenAI i jest oceniany przy użyciu zaktualizowanych ram gotowości.
- Ograniczenie ryzyka:Spada poniżej progu „Wysokiego” ryzyka w obszarach takich jak zagrożenia biologiczne/chemiczne, cyberbezpieczeństwo i samodoskonalenie sztucznej inteligencji, z dokładnością flagowania wynoszącą ~99% dla rozmów o ryzyku biologicznym podczas red-teamingu.
- Przejrzystość:OpenAI udostępnia szczegółową kartę systemu zawierającą wskaźniki bezpieczeństwa i wydajności.
Wydajność wzorcowa
o4-mini wykazało wyjątkową wydajność w szeregu testów porównawczych, pokazując swoją wszechstronność i siłę. Poniższa tabela podsumowuje jego wyniki:
| Benchmark | Precyzja (%) | Komentarz |
|---|---|---|
| Konkurs matematyczny AIME 2024 | 93.4 | Najlepiej działający model |
| Konkurs matematyczny AIME 2025 | 92.7 | Wyższe o3-mini (86.5) |
| Kodeks konkurencji Codeforces | 2719 ELO | Z terminalem przewyższa o3 (2706 ELO) |
| GPQA Diamond PhD-Level Science | 81.4 | Wyższe o3-mini (77.0) |
| MMMU Wizualizacja na poziomie college’u | 81.6 | Wyprzedza o1 (77.6) |
| MathVista Wizualne rozumowanie matematyczne | 84.3 | Wyprzedza o1 (71.8) |
| CharXiv-Rozumująca postać naukowa | 72.0 | Wyprzedza o1 (55.1) |
| Oprogramowanie zweryfikowane przez SWE-Bench | 68.1 | Wyprzedza o1 (48.9) |
| Edycja kodu Aider Polyglot | 68.9% (całość), 58.2% (różnica) | Wyższe o3-mini-high (różnica 61.7%) |
| Skala MultiChallenge Wieloobrotowy | 42.99 | Wyższe o3-mini (39.89) |
| Przeglądanie agenta BrowseComp | 51.5 | Z Pythonem i przeglądaniem przewyższa o3 (49.7) |
| Wywołanie funkcji Tau-bench | 49.2% (linie lotnicze), 65.6% (handel detaliczny) | Wyprzedza o3-mini-high (32.4% linia lotnicza) |
| Ostatni egzamin ludzkości Poziom ekspercki | 17.70 (bez narzędzi), 26.60 (z Pythonem i przeglądaniem) | Wyższa wydajność niż o3-mini (14.28 bez narzędzi) |
| SWE-Lancer IC SWE Diament | Zarobiono 56,375 XNUMX dolarów | Wyprzedza o3-mini-high (17,375 XNUMX USD) |
Przykład scenariuszy zastosowań
1. Wywoływanie funkcji dla narzędzi niestandardowych
o4-mini obsługuje wywoływanie funkcji w celu integracji niestandardowych narzędzi, takich jak wyszukiwanie w sieci i wykonywanie operacji w języku Python w celu analizy danych:
{
"model": "o4-mini",
"messages": ,
"tools":
}
}
},
{
"type": "function",
"function": {
"name": "python",
"description": "Execute Python code",
"parameters": {
"type": "object",
"properties": {
"code": {"type": "string", "description": "The Python code to execute"}
},
"required":
}
}
}
],
"tool_choice": "auto"
}
- Przebieg pracy: o4-mini wyszukuje dane dotyczące zużycia energii, analizuje je za pomocą języka Python i może generować wizualne wyniki w postaci wykresów.
- Dostęp: Dostępny poprzez API CometAPI, bez konieczności weryfikacji organizacji (weryfikacja API).
2. Integracja z Codex CLI
o4 mini jest obsługiwany przez Codex CLI, agenta kodowania typu open source, który działa lokalnie w terminalach i jest dostępny na GitHubTo narzędzie upraszcza podłączanie o4-mini do lokalnych zadań kodowania, a wkrótce planowane jest wsparcie dla GPT-4.1.
Zobacz także API GPT-4.1 oraz Interfejs API O3.
Jak zadzwonić o4-mini API z CometAPI
o4-mini Ceny API w CometAPI, 20% zniżki od ceny oficjalnej:
- Żetony wejściowe: 0.88 USD / mln żetonów
- Tokeny wyjściowe: 3.52/M tokenów
Wymagane kroki
- Zaloguj się do pl.com. Jeśli jeszcze nie jesteś naszym użytkownikiem, zarejestruj się najpierw
- Pobierz klucz API uwierzytelniania dostępu do interfejsu. Kliknij „Dodaj token” przy tokenie API w centrum osobistym, pobierz klucz tokena: sk-xxxxx i prześlij.
- Uzyskaj adres URL tej witryny: https://api.cometapi.com/
Metody użytkowania
- Wybierz "
o4-mini/ o4-mini-2025-04-16” punkt końcowy do wysłania żądania API i ustawienia treści żądania. Metoda żądania i treść żądania są pobierane z naszej witryny internetowej API doc. Nasza witryna internetowa udostępnia również test Apifox dla Twojej wygody. - Zastępować za pomocą aktualnego klucza CometAPI ze swojego konta.
- Wpisz swoje pytanie lub prośbę w polu treści — model odpowie właśnie na tę wiadomość.
- . Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź.
Aby uzyskać informacje o modelu uruchomionym w interfejsie API Comet, zobacz https://api.cometapi.com/new-model.
Informacje o cenie modelu w interfejsie API Comet można znaleźć tutaj https://api.cometapi.com/pricing.
Przykład użycia API
Programiści mogą wchodzić w interakcje z o4-mini poprzez API CometAPI, umożliwiając integrację z różnymi aplikacjami. Poniżej znajduje się przykład Pythona:
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.cometapi.com/v1/chat/completions",
api_key="<YOUR_API_KEY>",
)
response = openai.ChatCompletion.create(
model="o4-mini",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Explain the concept of quantum entanglement."}
]
)
print(response)
Ten skrypt wysyła monit do o4-mini modeluje i drukuje wygenerowaną odpowiedź, pokazując, jak ją wykorzystać o4-mini dla skomplikowanych wyjaśnień.



