DeepMind 揭開了 AlphaEvolve 的神秘面紗

CometAPI
AnnaMay 14, 2025
DeepMind 揭開了 AlphaEvolve 的神秘面紗

Google DeepMind 推出 AlphaEvolve 14 月 56 日,由 Gemini 驅動的人工智慧代理可以自主發現和優化理論和實踐領域的演算法。主要成就包括打破了矩陣乘法 11 年的記錄、推進了 XNUMX 維“接吻數”等開放性數學問題的解決方案,以及在谷歌自己的基礎設施(從數據中心調度到芯片設計和大型模型訓練)中實現了可衡量的效率提升。該系統利用提議和評估的進化循環,融合了 Gemini Flash 的速度和 Gemini Pro 的深度,標誌著朝著人工智慧驅動的科學和工業創新邁出了重要一步。

背景和上下文

AlphaEvolve 建立在 DeepMind 在 AI 驅動演算法發現方面的先前成功基礎之上——最引人注目的是 阿爾法張量該演算法於 2022 年首次超越了 Strassen 的 4×4 矩陣乘法演算法。與前代產品不同,AlphaEvolve 的設計理念是 一般用途 代理能夠發展整個程式碼庫而不是單一功能,將人工智慧生成的發明從孤立的任務擴展到廣泛的演算法工作流程。

AlphaEvolve 的關鍵突破

打破56年前的矩陣乘法記錄

  • 4×4複數矩陣乘法:AlphaEvolve 發現了一種需要 48 次標量乘法的演算法,而不是 Strassen 49 年具有里程碑意義的方法所要求的 1969 次——這是數學家們 XNUMX 多年來一直追求的壯舉。
  • 一般改進:總體而言,AlphaEvolve 增強了 14 種不同的矩陣乘法設置,其性能通常優於人工方法和先前的 AI 衍生方法。

開放數學問題的新解決方案

  • 親吻數問題(11維):人工智慧將已知的下限從 592 個球體提升到 593 個球體接觸中心球體——這是一個漸進但 可證明的新穎性 在百年歷史的幾何挑戰中取得進展。
  • 調查 50 多個問題:當應用於分析、組合學、幾何學和數論領域時,AlphaEvolve 75% 的時間複製了最先進的技術,並且 改善 大約 20% 的情況依賴現有的解決方案。

技術方法

AlphaEvolve 的核心流程包括:

  1. 提案生成 透過 Gemini Flash 進行廣泛探索,透過 Gemini Pro 進行深入推理。
  2. 自動評估其中驗證程序嚴格檢查每個候選的正確性和效能。
  3. 進化選擇,保留得分最高的變體並進行迭代,直到出現最佳或接近最佳的解決方案。

這個循環將大型語言模型轉變為“演算法工廠”,利用演化計算和自動定理證明的原理來推動真正的創新,而不僅僅是對現有程式碼的解釋。

現實世界的影響

基礎設施和效率提升

  • 資料中心調度:取得了 1% 提高編排效率,從而在 Google 規模上節省大量能源和成本。
  • LLM訓練內核:優化了用於訓練 Gemini 模型的關鍵矩陣乘法內核,從而 23% 加速該操作並將總體訓練時間縮短 1%—相當於每年節省數百萬美元的計算費用。

科學探索

除了內部部署之外,DeepMind 還計劃推出 搶先體驗計劃 為選定的學術研究人員提供更廣泛的材料科學、藥物發現和其他需要複雜演算法解決方案的領域的探索。

未來的前景和挑戰

雖然迄今為止特定領域的進步令人印象深刻,但專家警告說,將 AlphaEvolve 的進化方法擴展到更複雜、多階段的科學問題將需要在驗證器設計和模型可靠性方面進行進一步的創新。儘管如此,所證明的 人工智慧與人類的協同作用 在問題框架、驗證和迭代改進方面,開闢了一條通往人工智慧增強發現的有希望的道路,其規模是人類無法實現的。

結論

AlphaEvolve 代表了人工智慧驅動演算法設計的一個里程碑,將大型語言模型的創造性廣度與規範的進化搜尋和形式驗證結合在一起。 AlphaEvolve 不僅帶來了理論進步(例如改進的數學界限),也為Google自身的營運帶來了切實的效率提升,凸顯了 自動化科學發現。隨著 DeepMind 準備向外部研究人員敞開大門,更廣泛的社群可以期待在人工智慧和科學前沿進行前所未有的合作。

入門

CometAPI 提供統一的 REST 接口,在一致的端點下聚合數百種 AI 模型(包括 Gemini AI 系列),並內建 API 金鑰管理、使用配額和計費儀表板。而不需要處理多個供應商 URL 和憑證。

開發人員可以訪問 Gemini 2.5 Flash Pre API 等等透過 彗星API。首先,在 Playground 中探索模型的功能,並查閱 API指南 有關詳細說明。

閱讀更多

一個 API 中超過 500 個模型

最高 20% 折扣