雙子座 3.0 秘密發布了嗎?最新真相與預測一覽

CometAPI
AnnaSep 17, 2025
雙子座 3.0 秘密發布了嗎?最新真相與預測一覽

在快節奏的人工智慧領域,Google即將憑藉其即將推出的 Gemini 3.0 模型再次實現重大飛躍。隨著 OpenAI 的 GPT-5 和 xAI 的 Grok 4 等競爭對手不斷突破界限,有關 Gemini 3.0 的傳聞已在科技論壇、社交媒體和行業新聞中流傳。現在,讓我們一起解讀這些訊息,並期待它的實際功能。

Gemini 3.0 已經秘密發布了嗎?

過去幾天,社群貼文和社群貼文報導了兩件相關的事情:

  1. 獨立地,貢獻者的測試數據在公開 google-gemini/gemini-cli repo 包含字串 gemini-3.0-ultra 在一個測試檔案中。該片段被社區成員發現並在社交平台上轉發;許多人將其解釋為“Gemini 3.0 Ultra”的洩露或早期證據。
  2. 瀏覽 LM Arena 模型清單的使用者註意到了一個新的模型名稱/代號 “海洋石” 在一些場地出現了一些目擊者,一些參與者認為這可能是「雙子星 3 號閃光」的秘密測試。這些目擊事件進一步證實了Google正在悄悄地對即將推出的雙子星 3 號變體進行現場測試的想法。

這聽起來是個好消息。畢竟,距離 Google Gemini 發布 Gemini 2.5 Pro 已經過去很久了。在這幾年裡,Claude Opus 4.1、Grok 4 和 GPT-5 等型號都相繼發布,效果都很好。這更讓我好奇 Gemini 會為 Gemini 3.0 帶來什麼驚喜。

然而,當我核實這些報道的真實性,並測試了疑似 Gemini 3.0 閃存的 Oceanstone 設備的性能後,我得出了一個令人驚訝的結論,既令人充滿希望,又令人失望。下面我將分享我的發現。

gemini 3.0 真的在 Gemini-CLI repo 中洩漏了嗎?

Gemini-CLI 倉庫中的模型名稱引用

社區重點提交 google-gemini/gemini-cli 引用的儲存庫 gemini-beta-3.0-pro, gemini-beta-3.0-flash 以及(在一些報告中) gemini-3.0-ultra該程式碼庫是公開的,並且正在積極開發;提交差異可見,這也是許多猜測的基礎。一個經常被連結的提交顯示了引發早期「3.0」討論的編輯。但是:程式碼庫文字可以包含佔位符、測試資料或用於驗證的內部名稱——程式碼庫中是否存在字串是 不會 證明模型二進位檔案或公共 API 端點已發布。

gemini-3.0-ultra

repo 維護者(以及 Google 合作者)實際上做了什麼

repo 維護者開啟並合併了一個簡短的拉取請求, 刪除或更正 誤導性的測試條目。維護者在合併後的 PR 中給出了明確的解釋: gemini-3.0-ultra 字串是 外部貢獻者新增的測試數據,它具有誤導性,因此該 PR 將其替換為正確的現有模型標識符(用於測試)。 PR 作者和程式碼庫協作者強調,該條目並非 Google 官方的產品識別碼。簡而言之:程式碼庫的外觀 測試值錯誤,而非產品洩漏.

為什麼這很重要: 公共程式碼庫接受外部作者的貢獻;測試夾具有時包含人工產生的標籤或占位符。社群發現此類佔位符與受控產品發布或官方產品清單不同。

gemini-3.0-超真相

簡而言之:Google 已經修復並評論了 CLI 安全性問題,而儲存庫編輯/回滾表明 3.0 字串並不是作為公開發布的信號。

Oceanstone 的業績報告-可信還是炒作?

海洋石 是本週出現在 LM Arena 公開排行榜和快速社交報道中的模型標籤。社區測試人員進行了非正式的正面對比,並報告稱 Oceanstone 的表現至少與 Gemini 相當,在一些快速測試中甚至略勝一籌。 2.5 閃存 在 Arena 任務的子集上。這些印象主要集中在:更好的提示跟隨、更強的短樣本編碼/推理能力,以及略微改善的對話一致性—— 但這些只是小樣本的人工投票和截圖,而不是受控基準.

LM Arena 的目擊事件告訴我們什麼

LM Arena 是一個開放的評估平台,研究人員和團隊可以在此進行盲比,有時會公開預發布或實驗模型的名稱(代號)。過去,LMArena 展示的代號後來會對應到 Google 官方發布的模型上(例如,在 Gemini 2.5 Flash Image 的預覽測試期間,曾使用過更早的代號)。

合理的解釋(更有可能):

  • Google 或合作夥伴/測試工具在執行內部管道或演示鷹架時臨時使用了內部/測試模型 ID(佔位符);這些字串洩露到了公共提交或測試資料集中。
  • LM Arena 有時會索引或公開提交評估的新/實驗模型(有時使用代號)。谷歌的測試模型可以合法地以以下代號出現: 海洋石 並非完整的、受支援的公開版本。這與觀察到的模式相符:代號出現在 LM Arena 中,型號名稱字串出現在公共倉庫中;維護人員隨後會清理這些引用。

我對 oceanstone 的測試結果

Oceanstone 展示了 AI 代理能力的範式轉變,超越了 GPT-5 的性能基準,並為自主系統引入了新標準。

主要觀察:

  • 原生互聯網集成:Oceanstone 最引人注目的升級之一在於其 透過其 API 存取互聯網的原生能力在受控測試中,該模型能夠以前幾代模型未曾達到的準確度處理即時查詢。例如,當系統提示輸入確切的當前日期時,它不再依賴靜態訓練數據,而是執行即時搜索,並正確報告 2025 年 9 月 17 日。此功能消除了先前的 LLM 中最持久的缺點之一:時間陳舊性。
  • 可靠、基於來源的內容產生: 在專業工作流程中,內容產生常常受到可信度和可靠性問題的限制。 Gemini 3.0 透過產生連貫、可驗證且基於來源的輸出,直接解決了這個問題。在我們的測驗中,模型能夠撰寫長篇文章,並具有恰當的引用和一致的敘述流程,既體現了創作的流暢性,也體現了事實的可靠性。
  • 網頁複製的精確度和 UI 保真度: 或許最令人意想不到的能力是 Gemini 3.0 能夠以驚人的保真度複製複雜的網頁。當被要求復刻蘋果官方網頁的佈局時,Gemini 3.0 的結果在結構、排版和介面元素方面都與原始設計完全一致。與 GPT-5 的嘗試相比,對比效果非常顯著。

雙子座 3.0 秘密發布了嗎?最新真相與預測一覽

總之: Oceanstone的表現和等級是值得肯定的,至於是否是Gemini 3.0 Flash的首發,還需要等待更多消息來確認。

Gemini 3.0 有哪些主要功能

改進的推理和編碼表現:

谷歌圍繞 Gemini 2.5 的公開演示以及隨後在編程競賽中取得的成就表明,其持續關注推理和代碼質量,多位分析師預計 Gemini 3.0 將進一步推進這一方向。 Gemini/DeepMind 在程式設計競賽中的成功凸顯了Google一直在不斷迭代推理能力——這條投資路徑自然指向 Gemini 3 級模型的更強大的推理能力。

更強大的多模態和生成影像特徵。

Gemini 應用已推出先進的影像編輯工具和熱門功能(例如「奈米香蕉」式影像變換),表明Google正在迅速擴展多模態工具。鑑於這一趨勢,有關 Gemini 3.0 將擴展影像→3D 渲染、更快的高品質影像合成以及更精細的修復功能的傳言也合理。

更長的上下文視窗和記憶/個性化。

谷歌已公開討論過 Chrome 瀏覽器 Gemini 的個人化實驗和多標籤頁上下文功能。增強的上下文視窗和更持久的個人化功能是 Gemini 3.0 合乎邏輯的產品方向。

Gemini 3 與 Gemini 2.5 有何不同?

為了了解預期結果,比較一下 2.5 的功能和存在的差距是有益的。

權限雙子座 2.5 優勢需要改進的地方/3.0 版本可能新增的內容
多模態文字、圖片、音頻、短視頻,「思考」模式,基準強推理。即時視訊處理、3D 理解、空間/地理空間資料、跨模態統一模型。
上下文窗口約 1 萬個代幣。可能有數百萬個標記上下文,更好的記憶/檢索以在長期使用中保持一致性。
代理/主動行為代理模式宣布;預定的行動;一定的自主權。更可靠的自主規劃、更深層的個人化、與設備和系統控制更強的整合。
與作業系統/裝置集成替換家庭設備上的助手;Android 整合;Wear OS 可用性。甚至更緊密的整合;也許 Gemini 可以作為更多設備類型(手錶、電視、物聯網)的核心助手,實現不同模式之間的更順暢的轉換。
速度、延遲、效率Gemini 2.5 Flash 速度更快;成本/效率最佳化。尤其是視訊方面有更好的性能;更低的延遲;更有效率的硬體使用;在設備上或邊緣執行敏感任務。

入門

CometAPI 是一個統一的 API 平台,它將來自領先供應商的 500 多個 AI 模型(例如 OpenAI 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等)聚合到一個開發者友好的介面中。透過提供一致的身份驗證、請求格式和回應處理,CometAPI 顯著簡化了將 AI 功能整合到您的應用程式中的過程。無論您是建立聊天機器人、影像產生器、音樂作曲家,還是資料驅動的分析流程,CometAPI 都能讓您更快地迭代、控製成本,並保持與供應商的兼容性——同時也能充分利用整個 AI 生態系統的最新突破。

首先,探索 google gemini 模型(例如 Gemini 2.5 Flash 影像 API,gemini 2.5 pro) 的功能 游乐场 並諮詢 API指南 以獲得詳細說明。造訪前請確保您已經登入CometAPI並取得API金鑰。 彗星API 提供遠低於官方價格的價格,幫助您整合。

因此,一旦正式版本發布,我們當然會立即整合我們的 AI API 網關 CometAPI。我們將以 Gemini 3.0 和 Gemini 2.5 Pro 作為主要驅動,並結合 Claude 和 GPT 等領先車型,打造前所未有的強大生產力。準備好了嗎? → 立即註冊 CometAPI !

最後的思考

Google Gemini 3 有望成為 Gemini 2.5 基礎上的重大進步。其發布的節奏、與裝置和作業系統的深度整合、模態的擴展,以及對推理、記憶和「代理」能力的重視,都指向一個旨在更實用、更智慧、更深入地融入日常工作流程的模型。

然而,與任何雄心勃勃的人工智慧模型一樣,傳聞/預測與實際交付之間的差距可能很大。 2025年末是許多功能推出的合理時機,但並非所有功能都能同時或廣泛推出。在全面完善的Gemini 3體驗全面普及之前,使用者可能會看到部分功能推出、功能集的交錯以及初始限制(成本、運算、隱私)。

閱讀更多

一個 API 中超過 500 個模型

最高 20% 折扣