VagusMaker:全球首个区块链原生、百万步零错误长程智能体执行引擎

作者:张家林

2025年11月12日,arXiv 上发布了一篇重要论文《Solving Zero Errors in a Million-Step LLM Task》(arXiv:2511.09030)(以下简称MAKER论文)。这篇论文提出了一种名为 MAKER 的方法,核心思想可以用一句话概括:

即使使用最廉价、最小的开源模型(Llama-3-8B级别),只要把长程任务极致分解成无数微步,再用“先领先k倍投票确认 + 红旗自动否决”的机制,也能在超过100万步的超长任务中实现零错误

论文用经典的“20盘河内塔”问题(总步数 1,048,575 步)做了完整验证,一步都没错。这彻底改变了行业对“长链推理”的认知:可靠性不一定靠大模型,而是靠架构级纠错。

作者没有追求更大的参数,而是换了一条完全不同的路:把任务切到不能再细的微步,让一群廉价模型同时给出下一步的建议,然后用一种近乎残酷的规则决定胜负——谁的答案先把票数拉开到其他所有选项总和的k倍(比如4倍),谁就胜出;任何违反基本规则的建议,直接红旗出局并接受惩罚。这套方法被作者称为MAKER。它真正告诉我们,长链推理的死结从来不是单次推理能力不够,而是错误一旦出现就会像滚雪球一样越滚越大。MAKER用架构把雪球掐死在刚成型的那一刻。

但是,论文里的实现是离线、单机的。要真正实现智能体长程执行各种任务,需要每一步都可验证、可激励、可惩罚、可审计,还需要一个去中心化的基础设施。

北京数悦铭金公司基于Vagus开源项目,完美解决了这个问题。

Vagus 到底是什么?

Vagus(迷走神经)是一个受生物学启发的链上AI代理安全层,目标是防止智能体在物理世界失控(比如机械臂砸人、无人车撞墙)。它把生物的“迷走神经系统”搬到了区块链上,核心组件包括:

ANSState:三状态机(SAFE → DANGER → SHUTDOWN),带滞后和最小驻留时间,防止状态震荡AfferentInbox:任何传感器、摄像头、遥测数据都可以实时上链作为证据VagalBrake(迷走刹车):根据“健康指数”动态把动作速度、力度从100%降到10%甚至0ReflexArc(反射弧):不需要投票,毫秒级直接撤销危险动作CapabilityIssuer:给每个代理发行短生命周期、可随时撤销的“权限令牌”(Capability Token)Tone Oracle(Rust编写):链下计算一个叫 VTI(Vagal Tone Index)的健康分数,推高时触发刹车

简单说,Vagus 就是给所有智能体装了一个链上的自主神经系统 + 紧急刹车按钮

官网:https://vagus.datoms.cn

MAKER 论文的核心要点

MAKER 论文做了三件重要的事,却把错误率从 30%+ 降到了 0:

Maximal Agentic Decomposition(极致任务分解) 把一个大任务拆成成千上万极小的微任务,每一步只做一件事(比如河内塔里只移动一个盘子)。First-to-ahead-by-k Voting(先领先k倍确认) 让很多廉价小模型同时给出下一步建议,谁的答案先把票数拉开到其他所有答案总和的 k 倍(比如 k=4),就确认这一步。少数派错误会被自然淹没。Red-flagging(红旗机制) 设置硬规则(比如河内塔里大盘绝不能压小盘),任何违反规则的建议直接标记为红旗,立即淘汰并惩罚。

这三板斧加起来,哪怕每个模型单步错误率 20%,整体也能做到百万步零错误。

VagusMaker 到底做了什么?怎么实现的?

数悦铭金团队发现:Vagus 已经把 MAKER 需要的 90% 底层能力都造好了

Vagus的出发点和MAKER完全不同。它想解决的是物理世界里智能体的失控问题——机械臂突然抽风砸人,无人车在高速上突然刹车失灵。人形机器人一旦出错,代价是血肉之躯。于是他们把生物的迷走神经搬到了链上:一套实时监测“健康指数”(VTI)的系统,能在发现不对劲的瞬间降速、撤销权限、甚至直接关机。核心是一系列精密到近乎偏执的组件——三状态机带滞后保护、毫秒级反射弧、短命可回收的权限令牌、所有证据强制上链的AfferentInbox,以及一个用Rust写的Tone Oracle不停计算着系统的“心跳”是否正常。

谁也没想到,这套为防止机器人伤人而生的安全层,竟然和MAKER论文的需求严丝合缝。红旗机制?直接用ReflexArc就解决了。需要即时惩罚?Capability Token一秒回收。需要全局停车?VagalBrake和DANGER状态天生就干这个。需要证据可查?AfferentInbox本来就为法庭级审计而生。

MAKER 需要的功能 Vagus 已经有的现成组件 只需要怎么用
每步状态永久可查 AfferentInbox + ANSState 直接存
红旗自动触发惩罚 ReflexArc + Capability 撤销 直接调用
权限能随时收回 CapabilityIssuer(短命令牌) 直接发令牌
全局异常时刹车 VagalBrake + 三状态机 直接刹
证据链上存证 AfferentInbox 直接上链

于是他们只在 Vagus 原有代码上新增了 4 个轻量合约(总共不到 1200 行 Solidity):

MicroTaskManager.sol 负责把一个百万步的任务自动拆成按 step 编号的微任务,当前共识状态用 Merkle Root 存到 Arweave/IPFS。RedFlagValidator.sol 红旗规则引擎:检查每张票是否违反河内塔规则(大压小、空柱子、状态不一致等),违规立刻调用 ReflexArc 撤销权限、扣信誉、甚至触发 SHUTDOWN。ReputationWeightedVoter.sol 实现“先领先k倍”投票:每个代理的票权 = Reputation^0.7(次线性,防止巨鲸),当某个动作票权达到其他所有动作总和的 k 倍时,自动确认、分微赏金、更新状态、触发下一步。ReputationToken.sol(灵魂绑定) 记录每个代理的历史表现:正确投票 +5~20 分,投错 -30 分,触发红旗 -100 分,长期老实人慢慢涨上限。

另外,只改了 200 行 Rust 的 Tone Oracle,让它额外监控“投票太分裂”或“单步卡太久”,一异常就推高 VTI → 进入 DANGER → 全系统暂停,等人类介入。

第一个合约MicroTaskManager负责把百万步的大任务切成按序号排队的微任务,把当前共识状态的Merkle Root扔到Arweave或IPFS,历史永远删不掉。第二个RedFlagValidator是铁面无私的裁判,任何一张试图把大盘压到小盘上、或者和上一步状态对不上的票,当场触发反射弧,权限归零、信誉暴跌,严重时整个系统直接SHUTDOWN。第三个ReputationWeightedVoter是真正的决策大脑,它让每个参与者的票不再一人一票,而是和历史信誉挂钩(还取了0.7次方避免巨鲸垄断),当正确答案的票权滚雪球般领先到k倍时,这一步立刻确认,小额赏金实时分发,状态更新,下一步自动触发。第四个是灵魂绑定的ReputationToken,诚实投票慢慢加分,投错重扣,触发红旗直接血亏,长期老实人才有资格慢慢提高上限。

最后,他们只用了不到200行Rust,把Tone Oracle教了一项新本领:盯着投票是否过于分裂、单步是否卡得太久,一旦异常就把VTI推高,整个系统滑入DANGER状态,全球同步刹车,等人类来处理。

整个过程干净得像一场精密的手术:有人往合约里存一笔赏金发起任务,系统吐出第0步,世界各地持有权限令牌的玩家用自己电脑上的小模型算答案、提交投票,红旗裁判先过滤垃圾票,正确答案的票越滚越多,一旦领先k倍,赏金到账、状态前进,下一步无缝接上。如果中途哪里不对,Tone Oracle会第一时间让整个世界停下来。

完整的链上执行流程(20盘河内塔为例)

你往合约里存 8000 USDC 赏金,设置 k=4,调用 createTask系统自动生成 Step-0全球任意持有 Capability Token 的人,用自己电脑上的小模型算出下一步,提交 vote(move + proof 文件 CID)RedFlagValidator 先自动过滤垃圾票正确答案的票越积越多,一旦领先到 4 倍总票权 → 自动确认确认后:分一点微赏金给正确投票者 → 更新状态 → 触发 Step-1重复 1048575 次若中途严重分裂或卡住 → Tone Oracle 推高 VTI → 全局刹车 → DAO 人工处理

全程状态、投票、赏金、惩罚、刹车 100% 上链,可随时审计。

主要意义

VagusMaker 只是一个起点。它真正展示了:

百万步零容错任务可以完全交给去中心化的廉价小模型集群来跑执行安全(Vagus)与决策可靠性(MAKER)可以在同一套链上合约里完美闭环所有规则、证据、赏金、惩罚都公开透明,任何人都可以 fork、审计、改进

未来可以直接用于:

全自动化药物研发管线(百万步化学反应序列)全球供应链实时多方优化复杂金融衍生品自动执行与清算深空任务的超长周期自主规划智慧城市级别的能源、交通联合调度

只要任务能被形式化定义和验证,VagusMaker 类架构就能提供一个可信、可激励、可刹车的链上执行环境

结论

Vagus 从出生就定位为“AI代理的链上迷走神经”。 VagusMaker 的出现,让我们第一次看到:最严苛的物理安全与最硬核的长链推理,终于可以在区块链上彻底融合

这很可能成为 2026 年以后,智能体基础设施的核心基石之一。

欢迎关注 Vagus 开源项目,体验这一融合后的能力。代码完全开源,团队也非常欢迎社区一起参与后续迭代。

© 版权声明
THE END
如果内容对您有所帮助,就支持一下吧!
点赞0 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容