O4-mini API 旨在在数学、编程、科学和视觉推理等任务中提供高性能,同时兼顾效率与可用性。

概述
o4-mini 属于 OpenAI 的 o 系列,这是一组在回答前进行深思熟虑的模型家族,能够为复杂查询提供更高质量的答案。它在集成工具方面表现突出,如网页浏览、Python 代码执行、图像处理与图像生成,使其能够以接近代理行为的自主性处理多步骤问题。
o4-mini 的主要功能
- 视觉推理:o4-mini 可以处理并理解图像,包括模糊照片或草图等低质量视觉内容。它可对图像进行操作(例如旋转、缩放),以支持解读图表或科学图像等任务。
- 工具集成:它可完全访问 ChatGPT 的工具,包括网页搜索、用 Python 进行文件分析,以及图像生成,使其在复杂工作流中具有高度通用性。
- 对话自然性:该模型改进了指令遵循能力,并可引用过往对话,增强互动场景中的可用性。
- 效率与可扩展性:为高并发请求进行了优化,o4-mini 支持比 o3 更高的使用额度,适合实际应用。
- 成本效益:定价为每百万输入令牌 $1.10、输出令牌 $4.40,在速度、成本与性能之间提供有竞争力的平衡。
o4-mini 技术细节
模型架构与训练
- 规模与效率:作为相对于 o3 更小的模型,o4-mini 以效率为核心设计,优先考虑速度与成本,同时不牺牲性能。
- 训练方法:采用大规模强化学习,遵循“算力增加提升模型性能”的趋势。
- API 能力:支持用于自定义工具的函数调用,并可通过 Chat Completions API 与 Responses API 访问。未来更新将包含内置工具,如网页搜索、文件搜索与代码解释器。
安全与准备度
- 安全协议:o4-mini 已通过 OpenAI 安全计划下的严格压力测试,并使用更新版 Preparedness Framework 进行评估。
- 风险缓解:在生物/化学风险、网络安全与 AI 自我改进等领域低于“高”风险阈值,在红队测试中对生物风险对话的标记准确率约为 99%。
- 透明度:OpenAI 提供详细的系统卡,列出了安全与性能指标。
基准性能
o4-mini 在多项基准测试中表现出色,展现了其通用性与实力。下表汇总了相关结果:
| Benchmark | Accuracy (%) | Notes |
|---|---|---|
| AIME 2024 Competition Math | 93.4 | Best-performing model |
| AIME 2025 Competition Math | 92.7 | Outperforms o3-mini (86.5) |
| Codeforces Competition Code | 2719 ELO | With terminal, outperforms o3 (2706 ELO) |
| GPQA Diamond PhD-Level Science | 81.4 | Outperforms o3-mini (77.0) |
| MMMU College-level Visual | 81.6 | Outperforms o1 (77.6) |
| MathVista Visual Math Reasoning | 84.3 | Outperforms o1 (71.8) |
| CharXiv-Reasoning Scientific Figure | 72.0 | Outperforms o1 (55.1) |
| SWE-Bench Verified Software | 68.1 | Outperforms o1 (48.9) |
| Aider Polyglot Code Editing | 68.9% (whole), 58.2% (diff) | Outperforms o3-mini-high (61.7% diff) |
| Scale MultiChallenge Multi-turn | 42.99 | Outperforms o3-mini (39.89) |
| BrowseComp Agentic Browsing | 51.5 | With Python + browsing, outperforms o3 (49.7) |
| Tau-bench Function Calling | 49.2% (Airline), 65.6% (Retail) | Outperforms o3-mini-high (32.4% Airline) |
| Humanity’s Last Exam Expert-Level | 17.70 (no tools), 26.60 (with Python + browsing) | Outperforms o3-mini (14.28 no tools) |
| SWE-Lancer IC SWE Diamond | $56,375 earned | Outperforms o3-mini-high ($17,375) |
应用场景示例
1. 自定义工具的函数调用
o4-mini 支持函数调用以集成自定义工具,例如用于数据分析的网页搜索与 Python 执行:
{
"model": "o4-mini",
"messages": ,
"tools":
}
}
},
{
"type": "function",
"function": {
"name": "python",
"description": "Execute Python code",
"parameters": {
"type": "object",
"properties": {
"code": {"type": "string", "description": "The Python code to execute"}
},
"required":
}
}
}
],
"tool_choice": "auto"
}
- 工作流程:o4-mini 搜索能耗数据,使用 Python 进行分析,并可生成图表等可视化输出。
- 访问:可通过 CometAPI API 使用,无需组织验证(API Verification)。
2. 与 Codex CLI 集成
o4 mini 受到 Codex CLI 支持,这是一款在本地终端运行的开源编码代理,可在 GitHub 获取。该工具简化了将 o4-mini 连接到本地编码任务的过程,并计划很快支持 GPT-4.1。
另请参阅 GPT-4.1 API 和 O3 API。
如何通过 CometAPI 调用 o4-mini API
CometAPI 中 o4-mini API 价格,较官方价优惠 20%:
- Input Tokens: $0.88 / M tokens
- Output Tokens: $3.52/ M tokens
必需步骤
- 登录 cometapi.com。如果您尚未成为我们的用户,请先注册
- 获取接口的访问凭据 API key。在个人中心的 API token 处点击“Add Token”,获得令牌密钥:sk-xxxxx 并提交。
- 获取本站点的 url:https://api.cometapi.com/
使用方法
- 选择 “
o4-mini/ o4-mini-2025-04-16” 端点发送 API 请求并设置请求体。请求方法与请求体可从我们网站的 API 文档获取。我们的网站也提供 Apifox 测试以便您使用。 - 将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI 密钥。
- 将您的问题或请求插入 content 字段——模型将对此进行响应。
- . 处理 API 响应以获取生成的答案。
有关在 Comet API 发布的模型信息请参见 https://api.cometapi.com/new-model.
有关 Comet API 模型价格信息请参见 https://api.cometapi.com/pricing。
API 使用示例
开发者可通过 CometAPI 的 API 与 o4-mini 交互,实现集成到各类应用。以下是一个 Python 示例:
import os
from openai import OpenAI
client = OpenAI(
base_url="https://api.cometapi.com/v1/chat/completions",
api_key="<YOUR_API_KEY>",
)
response = openai.ChatCompletion.create(
model="o4-mini",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Explain the concept of quantum entanglement."}
]
)
print(response)
该脚本向 o4-mini 模型发送提示并打印生成的响应,展示如何利用 o4-mini 进行复杂解释。
