在 2025 年初,OpenAI 推出了 o3‑mini,这是一款紧凑却强大的“推理”模型,旨在以更低的成本与延迟在 STEM 任务中交付高性能结果。自 2025 年 1 月 31 日公开亮相以来,o3‑mini 已集成到 ChatGPT 的模型选择器,并通过 API 向不同套餐层级的开发者和终端用户开放。
什么是 o3‑mini?
OpenAI 的 o3‑mini 是 o3 系列中的紧凑型推理模型,旨在以低于大型模型的计算成本提供先进的逻辑与面向 STEM 的能力。它继承自 o1‑mini,旨在为需要逐步推理的任务提供稳健表现,例如复杂数学问题、编程辅助和科学查询。
关键特性
- 结构化输出与函数调用:o3‑mini 支持结构化输出格式与无缝的函数调用接口,使开发者能以最小开销将其集成到生产工作流中。
- 三档推理力度:用户可选择低、中或高“推理力度”以平衡速度与分析深度,免费层用户默认使用“中”等级。
- 增强的 STEM 熟练度:专家评估显示,o3‑mini 在编码、数学与科学领域的表现可与原始 o1 相匹敌或更优,同时生成响应更为迅速。
o3‑mini 的表现如何?
速度与效率
- 平均比 o1‑mini 快 24%,基于响应延迟基准测试,同时在标准编码与推理评估中保持或超越准确度。
- 具成本效益:优化的推理路径降低了计算开销,为开发者带来更低的 API 成本。
准确性与能力
- 聚焦 STEM:在数学问题求解、代码生成与逻辑谜题方面表现出色,在相关测试套件中显著优于 o1‑mini。
- 搜索集成:原型级的网页浏览使 o3‑mini 能获取实时数据并引用来源,提升其在时效性查询中的实用价值。
- 不支持视觉:缺乏内置图像理解功能——开发者仍需依赖如 o4‑mini 或 o1‑vision 等专用视觉模型进行图像推理任务。
o3‑mini 的局限是什么?
技术与功能限制
- 视觉缺口:未集成图像处理使 o3‑mini 仅能处理文本查询,需在多模态应用中回退到具备视觉能力的模型。
- 原型功能:搜索集成仍处于早期原型阶段;在不同领域与输入查询间的可靠性与覆盖度可能存在差异。
竞争与市场动态
- DeepSeek 的 R1 模型:中国初创公司 DeepSeek 的开源 R1 推理模型持续施加竞争压力,以更低成本提供相近性能,对 OpenAI 在亚洲及其他地区的市场份额构成挑战。
- 简化路线图:2025 年 2 月,Sam Altman 宣布计划将独立的 o3 融入即将到来的 GPT‑5,预示着模型产品的整合以及远离离散“o3”品牌的转变。
o3‑mini 与其前代相比如何?
性能指标
相较于 o1‑mini,o3‑mini 提供:
- 更高的速率限制:Plus 与 Team 用户的每日消息上限从 50 提升至 150。
- 更佳的准确性:独立测试显示其在 STEM 任务中的推理准确性与清晰度更强。
成本与延迟
- 更低延迟:即使具备更深入的推理能力,仍保持与 o1‑mini 相当的响应时间,适用于对延迟敏感的应用。
- 成本效率:通过优化计算使用,o3‑mini 相较更大模型降低了每个 token 的成本,为开发者提供更具预算友好性的选择且不牺牲核心推理功能。
在 o3‑mini 之后有什么进展?
未来模型路线图
基于 o3‑mini,OpenAI 于 2025 年 4 月 16 日发布了 o3,并同步推出 o4‑mini。这些模型在 o3‑mini 的能力之上扩展,提供更大的上下文窗口、对视觉任务的支持以及进一步优化的推理效率。
持续改进
OpenAI 持续从以下方面完善 o3‑mini:
- 透明性增强:近期更新公开了部分模型内部的推理步骤,旨在提升可解释性与可信度。
- 速率限制调整:2 月份将 o3‑mini‑high 的每日请求上限为 Plus 用户提升至 50,并新增文件/图片上传支持。
计划弃用与后续模型
尽管起初反响良好,o3‑mini 在部分场景中将进入弃用阶段:
- GitHub Copilot:支持将于 2025 年 7 月 18 日结束,o4‑mini 将作为直接替代,提供更佳性能与能力。
- OpenAI 模型选择器:在 ChatGPT 界面中,o3‑mini 最终将被 o4‑mini 取代,后者在推理深度与准确性方面进一步增强。
这一规划中的逐步淘汰凸显了 OpenAI 的迭代路径:持续发布“mini”系列,逐步优化速度、成本与智能之间的平衡。
入门
CometAPI 提供统一的 REST 接口,聚合数百个 AI 模型——在一致的端点下,内置 API 密钥管理、使用配额与计费面板。无需再同时处理多家厂商的 URL 与凭证。
在等待期间,开发者可以通过 O4‑Mini API、O3 API 和 [O3 Mini API](https://www.cometapi.com/gpt-4-1-api/) 访问最新模型,以上列表以本文发表时为准。开始前,可在 Playground 探索模型能力,并查阅 API guide 获取详细说明。访问前,请确保已登录 CometAPI 并获取 API 密钥。CometAPI 提供远低于官方的价格,助力你完成集成。
结论
总而言之,o3‑mini 自 2025 年 1 月 31 日起全面发布,并在 ChatGPT 的 Free、Plus、Team、Pro 与 Enterprise 等套餐中广泛可用。它将改进的推理能力带给多元用户群,在计算效率与问题解决精度之间取得了显著平衡。尽管媒体报道赞扬其亲民的价格与性能,后续的合作伙伴弃用表明正向更先进的后继者(如 o4‑mini)过渡。尽管如此,o3‑mini 在普及以推理为核心的 AI 上的作用具有重要里程碑意义,凸显了 AI 创新的迭代特性,以及持续让强大 AI 工具更易用、更可靠的追求。
