“HRM”(Hierarchical Reasoning Model)确实是一项极具颠覆性的 AI 创新,以下是经过查证的最新信息:模型
大小与训练要求极低:约 2700 万参数, 1000 条样本进行训练,无预训练、无 chain-of-thought(CoT)监督 Live SciencearXivcodemotion.com。
“HRM”(Hierarchical Reasoning Model)确实是一项极具颠覆性的 AI 创新,以下是经过查证的最新信息:
模型概述以及具体现有表现
- 全名与来源:HRM,即 Hierarchical Reasoning Model,由新加坡一家名为 Sapient Intelligence 的 AI 创业公司开发 Live Sciencebdtechtalks.substack.comcodemotion.com。
- 大小与训练要求极低:该模型只有约 2700 万参数,并且仅用 1000 条样本进行训练,无预训练、无 chain-of-thought(CoT)监督 Live SciencearXivcodemotion.com。
- 脑启发式架构:HRM 模型由两个互补模块构成: 高层模块(H-module):负责缓慢、抽象的战略规划; 低层模块(L-module):执行快速、细致的计算。 两者通过一个“hierarchical convergence(分层收敛)”过程协作,即低层通过多步内部迭代稳定于一个子问题的解,交由高层更新策略,再重置低层继续推进。这种设计不仅避免了 vanishing gradients 和 premature convergence,还显著增加了计算深度和效率 VentureBeatbdtechtalks.comSifyarXiv。
- 卓越性能: 在 ARC-AGI(一项衡量 AGI 能力的复杂推理 benchmark)中,HRM 的表现如下: ARC-AGI-1: 40.3%,优于 o3-mini-high 的 34.5%、Claude 3.7 的 21.2%、Deepseek R1 的 15.8% Live SciencearXivMedium; ARC-AGI-2:HRM 得分 5%,优于 o3-mini-high(3%)、Deepseek R1(1.3%)、Claude 3.7(0.9%)Live Science。 在 高难度数独和 复杂迷宫路径搜索测试中,HRM 几乎达到了完美(near-perfect accuracy),而同类 LLM 模型基本无法解答 Live ScienceMediumcodemotion.com。
- 训练成本低廉:只需少量 GPU 时间(如训练专业级数独任务约两 GPU 小时;ARC-AGI 任务约 50–200 GPU 小时)即可完成训练 VentureBeatMediumLive Science。
HRM 的开发者背景与开放程度
- 开发公司:HRM 模型由总部位于 新加坡的 Sapient Intelligence 开发 Live Sciencewinsomemarketing.comsapient.inc。
- 公司成立时间:目前公开资料并未明确指出 Sapient Intelligence 的具体成成立时间。不过,公司于 2025 年 6 月 26 日在 arXiv 发布了 HRM 相关论文,暗示这项研发成果在近期完成 arXivLive Science。
- 开放源码:该团队已将模型源码开源,发布在 GitHub(sapientinc/HRM),并采用 Apache-2.0 许可证,可以自由访问与使用 GitHubMedium。
- 创始团队:一篇 Medium 报道提到,这家公司由一群来自 DeepMind、Anthropic、XAI 的工程师组成,他们的目标是打造“像人类一样思考”的模型 Medium。
小结整理
方面 | 详情 |
---|---|
模型名称 | Hierarchical Reasoning Model(HRM) |
开发公司 | Sapient Intelligence(新加坡) |
参数规模 | ≈ 27M 参数 |
训练数据量 | 约 1,000 样本,无预训练 |
架构设计 | 高层规划 + 低层执行 → 分层收敛机制 |
表现优势 | ARC-AGI 中领先 o3-mini-high、Claude;数独和迷宫任务接近完美 |
训练成本 | 数小时或几百 GPU 小时内完成 |
开源情况 | 已开源至 GitHub,Apache-2.0 授权 |
团队背景 | 部分成员来自 DeepMind、Anthropic、XAI |
成立时间 | 未公开,论文发表于 2025年6月26日 |
总结:HRM 代表了一个非常激动人心的发展方向——通过非常精巧的结构和训练方式,实现高效、深度的推理能力,而非依赖海量参数和数据。这或许才是通向真正 AGI 的核心路径。
如果你想深入了解 HRM 的源代码、能运行 demo、训练配置细节,或关注 Sapient Intelligence 的未来规划,我可以帮你继续跟进!
Comments (0)
No comments