Google I/O 2026 回顧:代理式人工智慧的曙光、Gemini 3.5、Omni 與 Antigravity

CometAPI
AnnaMay 24, 2026
Google I/O 2026 回顧:代理式人工智慧的曙光、Gemini 3.5、Omni 與 Antigravity

Google I/O 2026 於 2026 年 5 月舉行,標誌著向 智能體型 AI 的關鍵轉變——這類系統不僅回應,還能自主管理、協調任務,並深入整合至各產品。隨著在 Gemini 模型、開發平台、搜尋與硬體上的重大公告,Google 進一步鞏固其「AI 優先」策略。

本篇綜合評述以資料、基準與實際影響拆解重點公告。針對希望在不被供應商綁定且成本可控的情況下利用這些進展的開發者與企業,CometAPI 透過單一與 OpenAI 相容的 API 金鑰,提供對 500+ AI 模型(包含 Gemini 替代如 GPT、Claude 等)的統一存取——價格通常低 20-40%。

搜尋正成為 AI 的作業層

I/O 2026 最大的產品故事是 Search。Google 表示正將進階模型能力導入 Search,以一個全新的 AI 強化搜尋框,稱這是 25 年來對 Search 的最大升級。這並非行銷話術;而是 Google 希望讓 Search 從「檢索介面」進化為「任務介面」的訊號。

新的搜尋體驗遠不止「AI 摘要」。Google 推出可在背景 24/7 運作的搜尋智能體,能監測部落格、新聞網站、社群貼文,以及金融、購物、體育等即時資料的變化,並傳送綜合更新。它也擴展了智能體式預訂能力,使用者可請 Search 尋找符合特定條件的在地服務與體驗,然後導向供應商連結完成預訂。這讓 Search 成為一種隨時在線的助手,而不只是查詢框。

Google 亦將 AI Mode 中的 Personal Intelligence 擴展至近 200 個國家與地區、涵蓋 98 種語言,且無需訂閱。使用者可連接 Gmail 與 Google Photos,Google Calendar 即將支援。這重要之處在於,Google 嘗試讓 Search 更具情境感知,而不迫使使用者為了更高的個人化效用而付費。

商業含義很直接:即便面臨 AI 原生競爭者的壓力,Google 正試圖讓 Search 比以往更有用以守住其優勢。路透社報導 Google 在更廣泛的搜尋挑戰與來自 OpenAI 等競爭之際發布這些升級,同時強調其在 Search 與 Gemini 的 AI 驅動成長。換言之,這既是產品轉向,也是護城河防禦。

Gemini 3.5 Flash 是 Google 所需的速度敘事

Google 最重要的模型公告是 Gemini 3.5 Flash。依據 Google,該模型為智能體工作流程與程式設計而建,按每秒輸出 Token 數衡量,速度比其他前沿模型快四倍。此一主張意義重大,因目前 AI 市場愈發重視實際延遲,而非僅是基準成績。更快的模型在營運上更便宜、在工作流程中更易部署,亦更適合需多步驟的智能體。

Google 也將 3.5 Flash 定位為可在規模上實現「從提示到行動」的模型。在開發者重點中,Google 表示該模型是 Gemini API 中 Managed Agents 的引擎,也是跨 Antigravity 與 AI Studio 的更廣智能體技術棧核心。這意味著 Google 正以高速模型來標準化執行密集型任務,而非要求開發者用單一昂貴旗艦模型承擔所有事。

對企業而言,務實的結論是:速度現已是產品策略。一個「足夠好」但更快的模型,可能比紙面稍優但較慢的模型更有價值。這在客戶支援自動化、內部助理、萃取管線與互動式搜尋工具中特別成立,因為回應時間會影響完成率與使用者信任。Google 自身的定位顯示,它視 3.5 Flash 為適用於長時程任務、程式碼生成與真實世界效用的模型,而不只是展示。

Gemini 3.5 Flash 在程式設計與智能體任務上表現出色:

  • Terminal-Bench 2.1(智能體終端編碼):76.2%(對比 Gemini 3 Flash:58.0%;GPT-5.5:78.2%)。
  • SWE-Bench Pro:55.1%(強勁的智能體編碼)。
  • MCP Atlas(多步驟工作流程):83.6%——領先許多競爭者。
  • 在長距離多輪資安基準上提升 42%,同時 Token 減少 72%。
  • 輸出 Token 速度比前沿模型最高快 4 倍,成本更低。

實際範例包括在數小時內綜整研究論文並編寫可遊玩的遊戲,或在 60 秒內生成結帳 UX 流程。

企業採用:Macquarie Bank 以文件密集的入職流程試點;Salesforce 將其整合至 Agentforce 自動化。

CometAPI 推薦:測試 Gemini 3.5 等效模型,或透過 CometAPI 的統一端點路由至成本最佳化替代。可即時切換模型且無需改動程式碼——非常適合基準測試或生產擴容。

第 3 章:Gemini Omni 讓多模態生成更接近生產環境

若 3.5 Flash 是速度敘事,Gemini Omni 則是創作敘事。Google 以 Omni 作為可由任意輸入創作的模型(從影片開始),可將影像、音訊、影片與文字作為輸入生成高品質且以 Gemini 真實世界知識為基礎的影片。它也能透過對話編輯影片,這顯示 Google 將生成媒體視為互動式工作流程,而非一次性輸出。

這很重要,因為多模態 AI 正從新奇走向實用。模型能接收更多輸入型態並在其間保持脈絡,越可能契合真實創作工作:產品解說、廣告變體、訓練教材、社群短片、分鏡與內部溝通。

核心能力

  • 多模態輸入/輸出:結合參考以產生一致性輸出(例如影像 + 文字提示以生成特定風格影片)。
  • 對話式編輯:以自然語言編輯——變更風格、角度、背景或加入效果。
  • 物理與脈絡感知:準確模擬真實世界行為。
  • 可用性:將在 Gemini app、Google Flow、YouTube Shorts 上推出(免費方案有額度限制)。

展示案例包括將草圖變成實拍、在鏡面上生成漣漪效果、或黏土動畫解說片。安全機制包含 SynthID 浮水印與 C2PA 認證。

給創作者與行銷人員:這降低了影片製作門檻。企業可快速原型廣告或訓練內容。

CometAPI 提示:將 Omni 工作流程與 CometAPI 的廣泛模型存取搭配,打造混合管線——例如用 Claude 編寫腳本,並將生成路由至其他具影片能力的模型以確保冗餘或成本控制。

開發者獲得迄今最清晰的智能體工作流程路線圖

Google I/O 2026 對開發者格外友好。公司發布 Google Antigravity 2.0,一款獨立桌面應用程式,作為智能體互動的中樞,允許開發者並行協調多個智能體,並支援排程任務與跨 Google AI Studio、Android、Firebase 的生態整合。這是將軟體開發明確推向「智能體編排」而非僅僅「提示工程」。

Google 也在 Gemini API 中推出 Managed Agents。只需一次 API 呼叫,開發者即可啟動能推理、使用工具並在隔離的 Linux 環境執行程式碼的智能體。Google 表示這些智能體由 Antigravity 的 agent harness 驅動,並建構於 Gemini 3.5 Flash 之上。這讓模型/API 組合不再是實驗室原型,而是打造自動化工作流程的實用技術堆疊。

Antigravity 2.0 的關鍵功能

  • 動態子智能體:主智能體可衍生專門子智能體以並行處理任務。
  • 排程任務與非同步工作流程:智能體可在背景以類似 cron 的方式排程運行。
  • Artifacts:可驗證的輸出,如計畫、螢幕截圖與錄製,增進信任。
  • 整合:AI Studio 原生 Kotlin、一鍵部署至 Cloud Run/Firebase、支援語音。
  • 具備沙箱化、憑證遮蔽與 Git 原則等安全機制。

這改變了開發方式:智能體能處理複雜工作流程,從 Android/網頁應用到全端部署。

對開發者的影響:減少樣板碼並加速迭代。可從 AI Studio 無縫匯出至 Antigravity。

CometAPI 整合建議:針對以 Antigravity 構建並進入生產的 AI 功能,使用 CometAPI 作為後端。以更實惠的成本存取 500+ 模型,避免對 Google 的依賴,並最佳化成本——非常適合多供應商的智能體應用。

Gemini Spark —— 你的 24/7 個人 AI 智能體

Gemini Spark 是 Google 的常駐個人智能體,即使裝置離線也在雲端持續運行。

Spark 能做什麼

  • 監控 Gmail、Calendar、Docs,提供主動提醒與摘要。
  • 處理撰寫郵件、製作學習指南或透過整合(如 Instacart)購物等任務。
  • 學習使用者模式以打造個人化工作流程。
  • 由 Gemini 3.5 Flash 與 Antigravity 驅動。

它讓 AI 從被動轉為主動,提供給 Ultra 訂閱用戶與企業。

隱私說明:需授權;Google 強調重大操作前的使用者控制與確認。

CometAPI 的自訂智能體:以 CometAPI 的模型建立類似智能體,獲得更高彈性或偏重隱私的部署。

比較表:Gemini 3.5 Flash 與競品

功能/基準測試Gemini 3.5 FlashGemini 3.1 ProClaude Opus 4.7GPT-5.5
Terminal-Bench 2.176.2%70.3%66.1%78.2%
MCP Atlas(智能體)83.6%78.2%79.1%75.3%
速度(輸出 Token)快 4 倍基準較慢較慢
成本<前沿的 50%較高較高較高
多模態(透過 Omni)強(影片)受限

CometAPI 優勢:透過一個 API 存取上述所有(與更多)模型,具競爭性定價且無綁定。

CometAPI 如何補強 Google I/O 的創新

雖然 Google 生態強大,CometAPI 提供策略層:

  • 一個 API 對應 500+ 模型:Gemini、Claude、GPT、Llama、影像/影片模型——可無縫切換。
  • 成本節省:比直接供應商低 20-40%。
  • 無供應商綁定:非常適合建立在 Antigravity 上的混合智能體應用。
  • 企業就緒:與 OpenAI 相容,適用於生產。

建議:從免費 API 金鑰開始。整合以獲得備援模型、成本最佳化,或測試類 Omni 的功能並跨供應商比較。與 Google 的工具配合使用以獲得最佳效果——例如以 Antigravity 進行編排 + 以 CometAPI 進行多樣推論。

未來展望與結論

Google I/O 2026 鞏固了智能體型 AI 作為新標準。預期 2026-2027 年將有更深整合,從完整的 Android 17 Gemini Intelligence 到進階 XR。

對正打造下一波 AI 應用的團隊而言,結合 Google 的創新與 CometAPI 的靈活性,將帶來競爭優勢:在不受限制的前提下創新。

準備好將 AI 開發成本降低 20% 了嗎?

幾分鐘內免費開始。包含免費試用點數。無需信用卡。

閱讀更多