OpenAI 正式發布了其在人工智慧驅動生產力領域的最新進展:ChatGPT Agent。這項新功能將 ChatGPT 從對話式助理轉變為主動式數位代理,能夠代表用戶自主執行複雜的多步驟任務。此次發布是在 OpenAI 執行長 Sam Altman 主持的直播中宣布的,ChatGPT Agent 標誌著人工智慧實用性的重大飛躍,標誌著智慧助理發展的關鍵時刻。
關鍵能力
ChatGPT 代理整合了「虛擬電腦」環境,使其能夠跨 Web 介面、文件和第三方服務推理、規劃和執行任務,無需人工幹預。核心功能包括:
- 網頁瀏覽與研究:對公共網站和上傳的文件進行深入研究,收集和綜合資訊。
- 表格填寫和交易:透過使用者批准的操作填寫線上表格、下訂單並管理預訂(例如航班預訂、晚餐預訂)。
- 文件和幻燈片生成:產生可編輯的 PowerPoint 簡報和 Excel 電子表格,使用戶能夠直接從代理程式獲得完全格式化的可交付成果。
工作原理
使用者可以透過 ChatGPT 介面工具下拉選單中的「代理模式」切換按鈕啟動 ChatGPT 代理。啟用後,代理商會即時講述其操作,讓流程的每個步驟都清晰透明。在任何時候,使用者都擁有完全的控制權——在執行任何後續操作(例如發送電子郵件、購物)之前,都會明確請求權限,並且可以在操作過程中中斷或重新定向任務。
此功能利用「連接器」與使用者帳戶和第三方應用程式進行互動。連接器簡化了工作流程(例如日曆管理或收件匣摘要),而手動登入提示則確保了強大的安全性和資料隱私保護。
從算子演進到深度研究
ChatGPT Agent 以 OpenAI 早期的工具集(Operator 和 Deep Research)為基礎,將其優勢整合到一個統一的平台中。 Operator 以瀏覽器為基礎的自動化功能已納入 Agent 的虛擬瀏覽器,而 Deep Research 的自主網路來源分析功能現已無縫整合到 Agent 的工具包中。隨著 Operator 的獨立介面在未來幾週內棄用,使用者將過渡到功能更豐富的 Agent 環境來執行所有代理任務。
可用性和訪問
ChatGPT Agent 最初可供以下平台的訂閱者使用: 專業版, 更多和 團隊 ChatGPT 的層級。啟動非常簡單,只需從工具下拉選單中選擇“代理模式”或輸入 /agent 在任何聊天會話中均可使用指令。面向 Plus 和 Team 用戶的推出可能需要幾天時間,預計歐洲經濟區 (EEA) 和瑞士將於 2025 年夏季晚些時候全面開放。作為 OpenAI 分階段部署策略的一部分,企業和教育客戶預計在不久的將來獲得存取權限。
安全和隱私措施
為了解決人們對自主 AI 行為的擔憂,OpenAI 在 ChatGPT 代理中嵌入了多個安全層:
- 明確同意:任何影響現實世界系統的行為都會引發明確的許可請求。
- 可中斷性:使用者可以在任何階段停止或覆蓋任務,確保與其目標一致。
- 風險標記:系統標記潛在的危險或不道德的請求,暫停執行並通知使用者確認。
這些措施強調了 OpenAI 對負責任的人工智慧部署的承諾,旨在減少複雜工作流程中的錯誤或誤用。
入門
CometAPI 提供了一個統一的 REST 接口,在一致的端點下聚合了數百個 AI 模型,並具有內建的 API 金鑰管理、使用配額和計費儀表板。而不需要處理多個供應商 URL 和憑證。
在等待期間,開發人員可以訪問 O4-Mini API ,O3 API GPT-4.1 API 通過 彗星API,列出的最新模型截至本文發布之日。首先,探索模型在 游乐场 並諮詢 API指南 以獲得詳細說明。造訪前請確保您已經登入CometAPI並取得API金鑰。 彗星API 提供遠低於官方價格的價格,幫助您整合。
結論
OpenAI 的 ChatGPT Agent 代表了對話式人工智慧的關鍵性演進,它將被動對話系統轉變為能夠執行端到端任務的主動數位夥伴。透過將深度研究能力與安全性、權限驅動的操作相結合,OpenAI 旨在打造一個既能批判性思考又能代表使用者果斷行動的下一代助理。隨著該功能在 Pro、Plus 和 Team 層級以及最終擴展到企業領域,更廣泛的科技生態系統將密切關注代理式人工智慧如何重塑軟體領域的生產力、隱私規範和競爭態勢。持續強調安全措施和道德框架對於充分發揮 ChatGPT Agent 的潛力並防止意外後果至關重要。
