在2024年至2025年期間,ChatGPT及其同類模型從純粹的對話式學習生命週期管理(LLM)轉向提供端到端的服務。 深入研究 功能包括:瀏覽器輔助檢索、長篇綜合分析、多模態證據提取以及緊密整合的安全控制。接下來,我們將討論什麼是深度研究以及如何獲得深度研究結果。
ChatGPT 中的「深度研究」是什麼?
「深度研究」是 ChatGPT 的一項產品化功能,它超越了簡單的單輪問答:您只需提供一個研究提示(例如,「調查關於 XX 的最新研究,總結關鍵方法並提供可複現的引用」),系統即可自動檢索網絡文檔、讀取並提取證據、匯總不同觀點,並返回一份結構化且包含參考文獻的報告。此功能將瀏覽、文件檢索和綜合分析整合到一個流程中,使用戶獲得接近真人研究助理的體驗,而非僅僅是系統自動產生的回應。
為什麼選擇這個時機?數據、計算、模型和產品需求
2024-2025年,三大趨勢的融合使得深度研究成為現實:
- 改進的多模態和推理模型。 較新的基礎模型(o 系列、GPT-4o 以及後來的 GPT-5 系列)具備更強大的推理能力和執行多步驟指令的能力,從而能夠對檢索到的證據進行更深入的分析。
- 用於安全瀏覽和檢索的工具。 更完善的工具介面(沙箱、點擊式瀏覽、檢索模組)和諸如檢索增強生成(RAG)之類的架構模式,使模型能夠在會話期間查閱外部資源。結果是:無需重新訓練即可獲得更豐富、可更新的知識。
- 產品對節省時間的自動化需求。 機構和個人都希望自動化研究助理能夠在幾分鐘內(而不是幾小時)產生結構化、可引用的研究成果——這促使供應商將研究流程產品化,並將其作為功能提供。 OpenAI 推出專門的「深度研究」工具以及隨後的輕量級版本,正是反映了這種市場需求。
chatgpt 中哪裡有深度研究?
ChatGPT 網頁/應用程式:
深度研究是 ChatGPT 的內建功能 代理人 (一種專用工具/模式)能夠自動瀏覽、讀取網頁、PDF、圖像和上傳的文件,並將其整合為一份引用的研究報告。它以組件的形式出現在 ChatGPT 介面中。 深入研究 此選項(或透過「代理模式」/代理選擇器)以分級形式提供(完整付費版本以及面向更多用戶推出的更便宜的「輕量級」版本)。它是內建的 ChatGPT 編輯器中的選項 - 挑選 “深度研究” 從編輯器/工具下拉式選單(或在新版 UI 更新中的「代理模式」)輸入您的研究查詢。
Plus/Team/Enterprise/Edu 套餐每月允許 25 個任務;Pro 用戶每月可運行 250 個任務;免費用戶每月可運行 5 個任務,達到配額限制後將啟動輕量級備份模式。
快速步驟:
- 開啟 ChatGPT(chatgpt.com / chat.openai.com)並登入。
- 新建一個聊天窗口,查看訊息編輯器(輸入框)。點選模式/工具下拉選單。你應該會看到 “深度研究” (或選擇 代理模式 存取更新後的視覺/代理功能)。
- 輸入您的提示訊息,並(可選)附加文件(PDF、電子表格、圖片)。深度研究將運行(通常需要 5-30 分鐘),並返回一份引用報告。
如果看不到「+」號,需要在提示前的輸入框中輸入「/」(刪除「」),然後才能看到深入分析。
API訪問
OpenAI 不 提供深度研究 API。或者,您可以選擇 彗星API 它使用了 chatgpt 的深度研究 API。這是一個第三方聚合 API 平台,其 API 定價低於官方平台。使用 響應 調用深度研究的端點。
截至2025年,將有兩種深度研究專業化模式:
- O3-深度研究 API:
o3-deep-research— 更強大、更高品質的研究模式。 - O4-Mini-Deep-Research API:
o4-mini-deep-research— 更輕量級、成本更低的版本,適用於速度更快或查詢更頻繁的情況。
OpenAI 會根據以下方式對深度研究收取費用: 代幣使用情況 (輸入和輸出令牌),以及工具使用情況(例如,網路搜尋),與其他模型類似。 CometAPI 提供的價格為官方價格的 20%。詳情如下:
| 型號 | 輸入代幣成本 | 輸出代幣成本 |
|---|---|---|
| o3-深度研究 | 每百萬個代幣8美元 | 每百萬個代幣32美元 |
| o4-迷你深度研究 | 每百萬個代幣1.6美元 | 每百萬個代幣6.4美元 |
我的建議
使用 ChatGPT 進行深度研究當你想要一個 不干預的研究助理你輸入查詢內容,代理程式進行網路搜尋、資訊整合,並產生一份包含引用的報告。這非常適合臨時研究、創意構思或商業/學術探索。
使用API 如果:
- 你有一個 開發人員工作流程 (例如,產生每日研究摘要、與內部工具整合、自動化研究流程)。
- 您能夠勝任工具編排工作:澄清問題、抓取、分塊和後處理結果。
- 您需要更多控制權:您可以調整提示、處理澄清、連結工具以及與您自己的系統整合。
ChatGPT 中的深度研究功能在底層是如何運作的?
核心技術組件(管道視圖)
典型的深度研究運行會將多個子系統串聯起來:
-
查詢理解與分解系統首先將使用者提示解析為子任務(例如,定義範圍、尋找原始資料、擷取資料、綜合分析分歧)。這種顯式分解提高了冗長複雜任務的可追溯性。
-
檢索和瀏覽該助理結合使用快取索引、網路搜尋 API 和內建瀏覽代理程式來取得網頁、PDF、資料集和程式碼片段。檢索並非簡單的「前 k 個結果」傳遞;它通常包括基於權威性和相關性的重新排序,以及用於證據的片段提取。對 RAG 的學術評論表明,這種混合檢索+生成模式現在已成為基於語境的輸出的標準。
-
文檔攝取與長上下文推理文件被分塊,轉換為向量嵌入,並與思路鍊或深思熟慮的推理提示一起輸入到推理模型中。現代研究模式利用更長的上下文視窗(有時會進行選擇性微調或使用上下文範例)來保持多源綜合的連貫性。
-
證據整合與引用此模型能夠辨識需要佐證的論斷,加入來源資訊(URL、引用片段或書目元資料),並突顯不確定之處。產品可能提供書目和內嵌引用,或可匯出的報告。
-
安全、過濾和人機互動檢查在交付最終輸出之前,深度研究模組會運行安全策略(過濾幻覺、標記有爭議的說法、添加內容警告),有時還會將高風險任務路由給人工審核員或要求用戶確認。
目前最重要的演算法和方法是什麼?
- 檢索增強生成 (RAG) ——仍然是模型輸出與外部證據緊密連結的核心。系統性回顧表明,RAG仍然是事實依據的主要方法,儘管關於其成本和穩健性的爭論仍在繼續。
- 深思熟慮/思路鏈的一致性 — 明確的內部推理步驟,既可以提高準確性,又可以使模型在回答問題時參考安全規範。
- 圖結構檢索(GraphRAG及其變體) ——整合關係知識和多跳連接,以挖掘更相關、更具情境感知的證據。這是2024-2025年的一個活躍研究領域。
- 代理框架 — 小型控制器代理負責協調瀏覽、提取、驗證和摘要等步驟,如今在生產環境的深度研究流程中已十分常見。這些控制器降低了端到端流程的脆弱性。
限制和安全/倫理問題
輸出結果(幻覺和錯誤歸因)的可信度如何?
雖然深度研究相比簡單的提示能提高引用率,但模型仍然會臆造事實和錯誤歸因,尤其是在訊號較弱的查詢或權威來源需要付費存取的情況下。產品公告和報告都承認這些限制;更輕量級、更便宜的模型版本如果使用不當,也更容易產生更短、更缺乏依據的答案。
廣泛普及會帶來哪些心理健康和社會風險?
OpenAI 和獨立報告揭示了一系列不容忽視的社會危害風險。公開報告顯示,每週與 ChatGPT 的大量互動都包含自殺意念或精神病症狀;這項數據引發了審查、訴訟和監管關注。這些事件強調,深度研究——尤其是在用於提供建議或治療時——必須與安全保障措施、引導使用者諮詢人類專家以及明確的免責聲明相結合。
那麼,偏見、濫用和對抗性操弄又該如何處理呢?
深度研究可能被惡意攻擊者操縱,例如透過優化網路內容以植入欺騙性訊號(搜尋引擎優化、使用傀儡帳號)或故意散佈虛假資訊以影響資訊合成。因此,對抗性檢索、來源驗證和來源感知模型訓練的研究至關重要。
隱私和版權問題
對付費或受版權保護的研究進行抓取、索引和摘要會引發法律和倫理問題。產品團隊正在探索使用授權語料庫、權限管理和浮水印技術來解決這些問題;針對自動摘要的合理使用界限的研究也在進行中。
結論
ChatGPT 的深度研究並非單一實驗室或單一技術所能涵蓋;它是一項多層次的努力,涉及檢索和定位、基於推理的對齊、多模態和實時交互、高效模型工程,以及使這些實驗得以大規模開展的系統/基礎設施。近期推出的產品(「深度研究」功能和升級版 GPT 系列)、企業對協商式對齊的研究、學術界對 RAG 和智能體模型的積極研究,以及大規模的基礎設施投資,共同勾勒出該領域目前的發展方向。
目前,可以透過 ChatGPT 和 API 進行深度研究,兩者各有優缺點。
開發人員可以訪問 O4-Mini-Deep-Research API O3-深度研究 API 透過 CometAPI, 最新型號版本 始終與官方網站同步更新。首先,探索該模型的功能 游乐场 並諮詢 API指南 以獲得詳細說明。造訪前請確保您已經登入CometAPI並取得API金鑰。 彗星API 提供遠低於官方價格的價格,幫助您整合。
準備出發了嗎? → 立即註冊 CometAPI !


