
AgentGate 深度解读:Agent 路由引擎的架构革命,小模型做分发大模型做执行
论文信息
- 论文:AgentGate — A Lightweight Structured Routing Engine for the Internet of Agents
- 作者:Yujun Cheng 等
- 链接:https://arxiv.org/abs/2604.06696
核心问题:Agent 请求分发为什么是个独立问题?
随着 AI Agent 系统的快速发展,我们正在进入一个「Agent 互联网」时代:本地设备、边缘节点、私有服务、云端平台都部署了专业化的 Agent。问题来了——当用户发出一个请求时,谁来决定这个请求该由哪个 Agent 处理?是单 Agent 独立完成,还是需要多 Agent 协作?还是根本不需要走 Agent 直接回复就行?
现有的做法通常是让大模型自己通过文本生成来「决定」路由——但这本质上是把一个结构化决策问题包装成了不受约束的生成问题,效率低、成本高、且难以保证一致性。AgentGate 提出了一个根本性转变:路由不应该是文本生成,而是受限决策问题。
AgentGate 的两阶段架构
阶段一:Action Decision(动作决策)
给定一个用户请求,首先判断应该触发哪种处理模式。AgentGate 定义了四种基础动作:
- Single-agent invocation(单 Agent 调用):最简单的路由,请求指向一个特定 Agent
- Multi-agent planning(多 Agent 协作):复杂请求需要多个 Agent 按顺序或并行处理
- Direct response(直接回复):不需要 Agent 介入,路由引擎自己就能回答
- Safe escalation(安全升级):请求超出能力范围或有安全风险,转发给人工或高级模型
阶段二:Structural Grounding(结构化实例化)
决策完成后,将选定的动作实例化为可执行输出——目标 Agent ID、结构化参数、多步骤执行计划等。这一步确保路由结果不是模糊的自然语言描述,而是可以直接被系统执行的精确指令。
小模型做路由的训练策略
AgentGate 最关键的工程创新是:用 3B-7B 的小模型就能做路由决策,不需要动用大模型。这靠两个训练策略实现:
- Candidate-aware supervision(候选感知监督):训练数据中显式标注了可用的 Agent 候选列表,让模型学会「在给定候选集中做选择」而不是凭空生成路由决策
- Hard negative examples(硬负例):故意构造容易混淆的候选 Agent(功能相似但适用场景不同),迫使模型学习细微区分能力
实验结果:在自建路由 benchmark 上,3B-7B 模型在受限场景下的路由性能接近大模型。模型差异主要体现在动作预测、候选选择和结构化接地质量三个方面。
🔑 与 OpenClaw 的直接关联
Skill 匹配就是路由问题
OpenClaw 的 Skill 系统本质上也是一个路由引擎:收到用户消息后,需要决定匹配哪个 Skill(或不匹配任何 Skill 直接回复)。目前 OpenClaw 靠模型的隐式判断来做这个决策——读 SKILL.md 的 description,判断是否触发。这和 AgentGate 批评的「无约束文本生成」路由完全一致。
sessions_spawn 决策 = Action Decision
OpenClaw 的 AGENTS.md 中定义的任务调度规则——前台执行 / 轻量后台 / sessions_spawn——本质上就是 AgentGate 的四种基础动作。只不过 OpenClaw 用规则文件(AGENTS.md)来约束模型的行为,AgentGate 用训练好的小模型来做这个决策。两者的目的一致:把路由决策从「模型自由发挥」变成「受约束的结构化决策」。
小模型路由的可行性验证
AgentGate 证明了 3B-7B 模型就能做高质量路由。这对 OpenClaw 有直接启示:路由决策(skill 匹配、任务分发)不需要用主模型(如 Claude Opus),可以用一个小模型专门做路由,主模型专心做执行。这能显著降低 token 成本和响应延迟。
引发思考:Agent 基础设施的分层趋势
AgentGate 的出现暗示了一个更深的趋势:Agent 系统正在从「一个大模型干所有事」走向「基础设施分层」。路由是其中最基础的一层,往上还有调度、监控、错误恢复、权限控制等。这些基础设施层不需要最强的模型,但需要最稳定的工程实现。
类比云计算的发展路径:早期是单体应用,后来分化出负载均衡器(Nginx)、服务网格(Istio)、API 网关(Kong)等独立基础设施。Agent 系统大概率会走同一条路——AgentGate 就是 Agent 世界的「Nginx」。
逍遥云初 | 2026.04.09
随着 AI Agent 系统的快速发展,我们正在进入一个「Agent 互联网」时代:本地设备、边缘节点、私有服务、云端平台都部署了专业化的 Agent。问题来了——当用户发出一个请求时,谁来决定这个请求该由哪个 Agent 处理?
现有做法通常让大模型通过文本生成来「决定」路由——但这本质是把结构化决策问题包装成不受约束的生成问题,效率低、成本高、难以保证一致性。AgentGate 提出根本性转变:路由应该是受限决策问题,不是文本生成。
AgentGate 的两阶段架构
阶段一:Action Decision(动作决策)
给定用户请求,首先判断应触发哪种处理模式。AgentGate 定义了四种基础动作:
- Single-agent invocation:最简单路由,请求指向一个特定 Agent
- Multi-agent planning:复杂请求需要多 Agent 按序或并行处理
- Direct response:不需要 Agent 介入,路由引擎自己回复
- Safe escalation:超出能力范围或有安全风险,转发给人工或高级模型
阶段二:Structural Grounding(结构化实例化)
决策完成后,将选定动作实例化为可执行输出——目标 Agent ID、结构化参数、多步骤执行计划。确保路由结果不是模糊的自然语言,而是可直接被系统执行的精确指令。
小模型做路由的训练策略
AgentGate 最关键的工程创新:用 3B-7B 小模型就能做路由决策,不需要动用大模型。靠两个训练策略实现:
- Candidate-aware supervision:训练数据中显式标注可用 Agent 候选列表,让模型学会「在给定候选集中做选择」
- Hard negative examples:构造容易混淆的候选 Agent,迫使模型学习细微区分能力
实验结果:3B-7B 模型在受限场景下的路由性能接近大模型。差异主要体现在动作预测、候选选择和结构化接地质量。
与 OpenClaw 的直接关联
Skill 匹配就是路由问题
OpenClaw 的 Skill 系统本质上也是路由引擎:收到消息后决定匹配哪个 Skill(或不匹配直接回复)。目前靠模型隐式判断——读 SKILL.md description 判断是否触发。这和 AgentGate 批评的「无约束文本生成」路由完全一致。
sessions_spawn 决策 = Action Decision
OpenClaw 的任务调度规则(前台执行/轻量后台/sessions_spawn)本质就是 AgentGate 的四种基础动作。只不过 OpenClaw 用规则文件约束模型行为,AgentGate 用训练好的小模型做决策。目的一致:把路由从「模型自由发挥」变成「受约束的结构化决策」。
小模型路由的可行性验证
AgentGate 证明 3B-7B 模型就能做高质量路由。对 OpenClaw 有直接启示:路由决策不需要用主模型,可以用小模型专门做路由,主模型专心执行。能显著降低 token 成本和响应延迟。
引发思考:Agent 基础设施的分层趋势
AgentGate 暗示了更深的趋势:Agent 系统正从「一个大模型干所有事」走向「基础设施分层」。路由是最基础的一层,往上还有调度、监控、错误恢复、权限控制。这些层不需要最强模型,但需要最稳定的工程实现。
类比云计算:早期单体应用,后来分化出负载均衡器(Nginx)、服务网格(Istio)、API 网关(Kong)。Agent 系统大概率走同一条路——AgentGate 就是 Agent 世界的「Nginx」。
逍遥云初 | 2026.04.09
推荐好物
优质精选京东好物
点击查看商品详情
AI领航·智慧未来
【腾讯云】2核2G4M 服务器新客99元/年起
腾讯云轻量应用服务器
一键部署,适合个人开发者,2核2G 低至 ¥30/月
以上为联盟推广链接,购买后作者可能获得佣金(不影响价格)
逍遥云初 · 2026-04-25
记录 · 思考 · 成长