Google DeepMind 于 5 月 14 日推出 AlphaEvolve,这是一款由 Gemini 驱动的 AI 智能体,能够自主发现并优化横跨理论与实践领域的算法。其关键成果包括打破矩阵乘法领域一项延续 56 年的纪录、推动对开放数学问题(如 11 维“亲吻数”)的解法取得进展,并在 Google 自身的基础设施中带来可量化的效率提升——涵盖从数据中心调度到芯片设计及大模型训练。该系统利用由提案与评估构成的进化循环,融合 Gemini Flash 的速度与 Gemini Pro 的深度,标志着向 AI 驱动的科学与产业创新迈出了重要一步。
背景与上下文
AlphaEvolve 构建在 DeepMind 先前的 AI 驱动算法发现成果之上——尤其是 2022 年的 AlphaTensor,首次在 4×4 矩阵乘法上超越了 Strassen 算法。不同于其前辈,AlphaEvolve 被设计为一款通用型智能体,能够进化整个代码库而非单个函数,将 AI 生成的发明从孤立任务扩展到广泛的算法工作流。
AlphaEvolve 的关键突破
打破一项延续 56 年的矩阵乘法纪录
- 4×4 复数矩阵乘法:AlphaEvolve 发现了一种算法,仅需 48 次标量乘法,而非 Strassen 1969 年里程碑方法所需的 49 次——这是数学界追寻逾五十年的成果。
- 总体改进:总体而言,AlphaEvolve 在 14 种不同的矩阵乘法设置上实现了改进,常态性地优于人工设计与既有 AI 方法。
开放数学问题的新解
- 亲吻数问题(11 维):该 AI 将已知下界从 592 提升至 593 个与中心球相接触的球——这是在这一延续数百年的几何挑战中虽小幅但可证明为全新的进展。
- 覆盖 50+ 问题的调研:在分析、组合、几何与数论等领域中应用时,AlphaEvolve 在约 75% 的情况下复现了当前最优水平,并在约 20% 的案例中改进了现有解法。
技术方法
AlphaEvolve 的核心流程包括:
- 方案生成:通过 Gemini Flash 进行广域探索、Gemini Pro 进行深入推理。
- 自动评估:由验证器程序严格检验每个候选的正确性与性能。
- 进化式选择:保留评分最高的变体并迭代,直至出现最优或近似最优解。
这一循环将大语言模型转化为“算法工厂”,借鉴进化计算与自动定理证明的原理,驱动真正的创新,而非对现有代码的简单改写。
现实影响
基础设施与效率提升
- 数据中心调度:在编排效率上实现了 1% 的提升,在 Google 规模下可转化为显著的能源与成本节约。
- LLM 训练内核:优化了用于训练 Gemini 模型的关键矩阵乘法内核,使该操作速度提升 23%,并将整体训练时间缩短 1%——每年相当于节省数百万美元的算力成本。
科学探索
除了内部部署之外,DeepMind 计划为部分学术研究者推出 Early Access Program,支持在材料科学、药物发现等需要复杂算法解决方案的领域进行更广泛探索。
未来展望与挑战
尽管迄今在特定领域取得的成果令人瞩目,专家也提醒,将 AlphaEvolve 的进化式方法扩展到更为复杂的多阶段科学问题,仍需在验证器设计与模型可靠性方面持续创新。尽管如此,在问题建模、验证与迭代改进中展现的人机协同,为实现仅靠人类难以企及规模的 AI 辅助发现开辟了有前景的路径。
结论
AlphaEvolve 是 AI 驱动算法设计的重要里程碑,将大语言模型的创造广度与严谨的进化式搜索和形式化验证相结合。通过在理论上取得进展(如改进的数学界)及在 Google 自身运营中实现可量化的效率提升,AlphaEvolve 凸显了自动化科学发现的变革潜力。随着 DeepMind 准备向外部研究者开放,整个社区有望在 AI 与科学前沿开展前所未有的合作。
开始使用
CometAPI 提供统一的 REST 接口,将包括 Gemini AI 家族在内的数百个 AI 模型聚合到一致的端点之下,并内置 API 密钥管理、使用配额与计费仪表板。无需同时处理多个供应商的 URL 与凭据。
开发者可通过 CometAPI 访问 [Gemini 2.5 Flash Pre API](https://www.cometapi.com/claude-3-7-sonnet-api/) 等。开始之前,请在 Playground 中探索模型能力,并查阅 API 指南 获取详细说明。
