2025 年初,OpenAI 推出了 o3-mini,一個緊湊而強大的「推理」模型,旨在以更低的成本和延遲在 STEM 任務中提供高性能結果。自 2019 年 1 月首次公開亮相以來, 2025 年 1 月 31 日,o3‑mini 已整合到 ChatGPT 的模型選擇器中,並透過 API 供不同計畫層級的開發人員和最終使用者存取。
什麼是 o3‑mini?
OpenAI 的 o3‑mini 是 o3 系列中的緊湊型推理模型,旨在以比大型模式更低的運算成本提供高階邏輯和 STEM 導向能力。它繼承了 o1‑mini 模型,旨在在需要逐步推理的任務(例如複雜的數學問題、程式輔助和科學查詢)中提供強大的效能。
產品特色
- 結構化輸出和函數調用:o3‑mini 支援結構化輸出格式和無縫函數呼叫接口,使開發人員能夠以最小的開銷將其整合到生產工作流程中。
- 三個推理努力水平:使用者可以選擇低、中或高「推理努力」設定來平衡速度和分析深度,其中「中」是免費用戶的預設設定。
- 提升 STEM 能力:專家評估表明,o3-mini 在編碼、數學和科學領域的表現與原始 o1 相當或超過其,同時能夠更快地產生回應。
o3‑mini 的效能如何?
速度和效率
- 24%的速度 透過反應延遲基準來衡量,平均比 o1-mini 更高,同時保持或超過標準編碼和推理評估的準確性。
- 經濟高效:最佳化的推理路徑減少了計算開銷,從而降低了開發人員的 API 成本。
準確性和能力
- STEM 重點:在數學問題解決、程式碼產生和邏輯謎題方面表現出色,在相關測試套件中的表現明顯優於 o1-mini。
- 搜尋集成:原型級網頁瀏覽可讓 o3-mini 取得即時資料並引用來源,增強其對最新查詢的實用性。
- 無視覺支持:缺乏內建影像理解-開發人員仍然依賴 o4-mini 或 o1-vision 等專門的視覺模型來完成視覺推理任務。
o3‑mini 有哪些限制?
技術和功能限制
- 視野差距:由於缺乏整合影像處理,o3-mini 只能進行基於文字的查詢,因此對於多模式應用,必須回退到具有視覺功能的模型。
- 原型特徵:搜尋整合仍處於早期原型形式;可靠性和覆蓋範圍可能因領域和傳入查詢而異。
競爭和市場動態
- DeepSeek 的 R1 模型:中國新創公司 DeepSeek 的開源 R1 推理模型繼續施加競爭壓力,以更低的成本提供類似的效能,並挑戰 OpenAI 在亞洲及其他地區的市場份額。
- 簡化路線圖:2025 年 3 月,Sam Altman 宣布計劃將獨立的 o5 納入即將發布的 GPT-3 版本中,這標誌著模型產品的潛在整合以及從離散的「oXNUMX」品牌的轉變。
o3-mini 與其前代產品相比如何?
性能指標
相比於 o1-minio3‑mini 提供:
- 更高的速率限制:Plus 和 Team 使用者每天的發送頻率限制從 50 條增加到 150 個。
- 提高準確度:獨立測試表明,STEM 任務中的推理準確性和清晰度更高。
成本和延遲
- 較低的延遲:儘管它具有更深層的推理能力,但它的反應時間與 o1-mini 相當,因此適用於延遲敏感的應用程式。
- 成本效益:透過最佳化計算使用情況,o3-mini 相對於較大的模型降低了每個令牌的成本,為開發人員提供了更經濟實惠的選擇,同時又不犧牲核心推理功能。
o3-mini 之後會有什麼產品?
未來模型路線圖
OpenAI 在 o3-mini 的基礎上發布了 o3 於 16 年 2025 月 XNUMX 日推出 o4-mini 與之並行。這些模型擴展了 o3‑mini 的功能,提供了更大的上下文視窗、對視覺任務的支援以及推理效率的進一步最佳化。
持續改進
OpenAI 透過以下方式繼續完善 o3‑mini:
- 透明度增強:最近的更新公開了模型內部審議步驟的部分內容,旨在提高可解釋性和可信度。
- 速率限制調整:3 月份,o50-mini-high 對 Plus 用戶的速率限制增加到每天 XNUMX 個請求,並增加了檔案/圖像上傳支援。
計劃棄用和後續模型
儘管最初頗具吸引力, o3-mini 在某些情況下將被棄用:
- GitHub 副駕駛:支援結束於 2025 年 7 月 18 日與 o4-mini 定位為尋求改進性能和功能的用戶的直接替代品。
- OpenAI 模型選擇器:在 ChatGPT 的介面中, o3-mini 最終將被取代 o4-mini,進一步提高了推理深度和準確性。
這項計畫的逐步淘汰凸顯了 OpenAI 的迭代方法:發布連續的「迷你」模型,逐步改善速度、成本和智慧之間的平衡。
入門
CometAPI 提供了一個統一的 REST 接口,在一致的端點下聚合了數百個 AI 模型,並具有內建的 API 金鑰管理、使用配額和計費儀表板。而不需要處理多個供應商 URL 和憑證。
在等待期間,開發人員可以訪問 O4-Mini API ,O3 API O3 Mini API 通過 彗星API,列出的最新模型截至本文發布之日。首先,探索模型在 游乐场 並諮詢 API指南 以獲得詳細說明。造訪前請確保您已經登入CometAPI並取得API金鑰。 彗星API 提供遠低於官方價格的價格,幫助您整合。
結論
綜上所述, o3-mini 已完全釋放 2025 年 1 月 31 日ChatGPT 的免費版、Plus 版、Team 版、Pro 版和 Enterprise 版均可廣泛使用。它為多樣化的用戶群帶來了更強大的推理能力,在計算效率和問題解決精度之間取得了顯著的平衡。儘管媒體報導稱讚了其價格實惠和性能,但隨後合作夥伴的棄用預示著向更先進的繼任者(例如 o4-mini儘管如此,o3-mini 在實現以推理為中心的人工智慧民主化方面所發揮的作用代表著一個重要的里程碑,強調了人工智慧創新的迭代性質以及使強大的人工智慧工具既可訪問又可靠的持續追求。
