AlphaEvolve：基于 Gemini 的编码代理，用于设计高级算法

aivatar

2025-05-15 23:17:26 0

AlphaEvolve：基于 Gemini 的编码代理，用于设计高级算法发布2025年5月14日作者由 AlphaEvolve 团队提供分

AlphaEvolve：基于 Gemini 的编码代理，用于设计高级算法

发布

2025年5月14日

作者

由 AlphaEvolve 团队提供

新的人工智能代理通过将大型语言模型的创造力与自动评估器相结合，发展了用于计算的数学和实际应用的算法

大型语言模型 (LLM) 功能极其丰富。它们可以汇总文档、生成代码，甚至集思广益，提出新想法。现在，我们扩展了这些功能，使其能够解决数学和现代计算领域中基础且高度复杂的问题。

今天，我们宣布推出AlphaEvolve，这是一款由大型语言模型驱动的进化编码代理，用于通用算法的发现和优化。AlphaEvolve 将我们Gemini 模型的创造性问题解决能力与验证答案的自动评估器相结合，并使用进化框架来改进最有前景的方案。

AlphaEvolve 提升了谷歌数据中心、芯片设计和 AI 训练流程的效率，包括训练 AlphaEvolve 本身所依赖的大型语言模型。它还帮助设计了更快的矩阵乘法算法，并找到了解决开放性数学问题的新方法，展现出在众多领域应用的巨大潜力。

利用大型语言模型设计更好的算法

2023年，我们首次证明大型语言模型可以生成用计算机代码编写的函数，从而帮助发现开放性科学问题中新的、可证明的正确知识。AlphaEvolve 是一个超越单一函数发现的代理，它可以演进整个代码库并开发更复杂的算法。

AlphaEvolve 利用了一系列先进的大型语言模型：我们速度最快、效率最高的模型Gemini Flash能够最大限度地拓展探索的思路广度；而我们最强大的模型Gemini Pro则能够提供深刻的深度和富有洞察力的建议。这些模型共同构建了以代码形式实现算法解决方案的计算机程序。

该图展示了提示采样器如何首先为语言模型组装提示，然后生成新的程序。这些程序由评估器评估并存储在程序数据库中。该数据库实现了一种进化算法，用于确定哪些程序将用于未来的提示。

AlphaEvolve 使用自动化评估指标来验证、运行和评分所提出的程序。这些指标对每个解决方案的准确性和质量进行了客观、可量化的评估。这使得 AlphaEvolve 在数学和计算机科学等能够清晰、系统地衡量进展的广泛领域尤其有用。

优化我们的计算生态系统

在过去的一年里，我们将 AlphaEvolve 发现的算法部署到了 Google 的整个计算生态系统中，包括我们的数据中心、硬件和软件。每一项改进的影响都会在我们的 AI 和计算基础设施中成倍增加，从而为所有用户构建一个更强大、更可持续的数字生态系统。

该图表展示了 AlphaEvolve 如何帮助 Google 提供更高效的数字生态系统，从数据中心调度和硬件设计到 AI 模型训练。

改善数据中心调度

AlphaEvolve 发现了一种简单却极其有效的启发式方法，可以帮助Borg更高效地协调 Google 庞大的数据中心。该解决方案已投入生产超过一年，平均持续恢复 Google 全球 0.7% 的计算资源。这种持续的效率提升意味着，在任何特定时刻，相同的计算资源占用空间可以完成更多任务。AlphaEvolve 的解决方案不仅带来了强大的性能，还带来了人类可读代码的显著操作优势：可解释性、可调试性、可预测性和易于部署性。

协助硬件设计

AlphaEvolve 提出了一个Verilog重写方案，删除了矩阵乘法关键算术电路中高度优化的、不必要的位。至关重要的是，该方案必须通过稳健的验证方法，以确认修改后的电路保持功能正确性。该方案已被集成到即将推出的谷歌定制 AI 加速器——张量处理单元(TPU) 中。通过用芯片设计师的标准语言提出修改建议，AlphaEvolve 促进了 AI 和硬件工程师之间的协作，以加速未来专用芯片的设计。

增强人工智能训练和推理

AlphaEvolve 正在加速 AI 性能和研究速度。通过更智能地将大型矩阵乘法运算分解为更易于管理的子问题，它将 Gemini 架构中这一关键内核的速度提高了23%，从而使 Gemini 的训练时间缩短了 1%。由于开发生成式 AI 模型需要大量的计算资源，因此每提高一点效率，都意味着可观的节省。除了性能提升之外，AlphaEvolve 还显著缩短了内核优化所需的工程时间，从数周的专家工作缩短为数天的自动化实验，从而帮助研究人员更快地进行创新。

AlphaEvolve 还可以优化低级 GPU 指令。这个极其复杂的领域通常已经由编译器进行了深度优化，因此人类工程师通常不会直接修改它。AlphaEvolve在基于Transformer的 AI 模型中，为FlashAttention内核的实现实现了高达 32.5% 的加速。这种优化可以帮助专家精准定位性能瓶颈，并将改进轻松融入到他们的代码库中，从而提高生产力，并在未来节省计算和能源成本。

推进数学和算法发现的前沿

AlphaEvolve 还能为复杂的数学问题提出新的解决方案。基于计算机程序的极简代码框架，AlphaEvolve 设计了一种基于梯度的新型优化程序的诸多组件，并发现了多种用于矩阵乘法（计算机科学的一个基本问题）的新算法。

播放视频

AlphaEvolve 提出的一系列改进，旨在探索更快的矩阵乘法算法。在本例中，AlphaEvolve 提出了对多个组件进行广泛改进的建议，包括优化器和权重初始化、损失函数以及超参数扫描。这些改进意义重大，在进化过程中需要进行 15 次突变。

AlphaEvolve 的程序发现了一种使用 48 次标量乘法来对 4x4 复值矩阵进行乘法运算的算法，改进了Strassen 于 1969 年提出的算法，该算法此前被认为是此类算法中的最佳算法。这一发现与我们之前的研究成果 AlphaTensor相比取得了显著进步。AlphaTensor 专注于矩阵乘法算法，而对于 4x4 矩阵，它仅发现了二进制运算的改进。

为了探究 AlphaEvolve 的广度，我们将该系统应用于数学分析、几何学、组合学和数论领域的 50 多个未解决的问题。该系统的灵活性使我们能够在数小时内完成大多数实验的设置。据我们所知，在大约 75% 的案例中，它能够重新发现最先进的解决方案。

在20%的案例中，AlphaEvolve改进了之前已知的最佳解决方案，并在相应的未解决难题上取得了进展。例如，它推进了接吻数问题。这项几何挑战吸引了数学家们超过300年，它关注的是与一个共同单位球面相切的不重叠球体的最大数量。AlphaEvolve发现了一个由593个外球体组成的结构，并在11维空间中建立了新的下界。

前进的道路

AlphaEvolve 展现了从发现特定领域算法到开发更复杂算法以应对各种现实挑战的进展。我们期待 AlphaEvolve 能够与大型语言模型一起不断改进，尤其是在它们编码能力不断提升的情况下。

我们与People + AI 研究团队携手，致力于打造一个友好的用户界面，方便用户与 AlphaEvolve 互动。我们计划为部分学术用户推出抢先体验计划，同时也在探索让 AlphaEvolve 更广泛普及的可能性。如有意向，请填写此表格。

虽然 AlphaEvolve 目前应用于数学和计算领域，但其通用性意味着它可以应用于任何解决方案可以用算法描述并自动验证的问题。我们相信 AlphaEvolve 能够在更多领域带来变革，例如材料科学、药物研发、可持续发展以及更广泛的技术和商业应用。

在我们的白皮书中了解更多详细信息
注册您对使用 AlphaEvolve 的兴趣
在我们的 Google Colab 中查看 AlphaEvolve 的数学结果

aivatar

Board of directors
John Chen Founder/ Board Director

Master’s Degree in International Trade in fro

Comments (0)

No comments

AlphaEvolve：基于 Gemini 的编码代理，用于设计高级算法

分享

新的人工智能代理通过将大型语言模型的创造力与自动评估器相结合，发展了用于计算的数学和实际应用的算法

利用大型语言模型设计更好的算法

优化我们的计算生态系统

改善数据中心调度

协助硬件设计

增强人工智能训练和推理

推进数学和算法发现的前沿

前进的道路

Tags

aivatar

Comments (0)

Post Comment

Recent Post

Categories

Popular posts