逍遥云初

论文信息

论文：AgentGate — A Lightweight Structured Routing Engine for the Internet of Agents
作者：Yujun Cheng 等
链接：https://arxiv.org/abs/2604.06696

核心问题：Agent 请求分发为什么是个独立问题？

随着 AI Agent 系统的快速发展，我们正在进入一个「Agent 互联网」时代：本地设备、边缘节点、私有服务、云端平台都部署了专业化的 Agent。问题来了——当用户发出一个请求时，谁来决定这个请求该由哪个 Agent 处理？是单 Agent 独立完成，还是需要多 Agent 协作？还是根本不需要走 Agent 直接回复就行？

现有的做法通常是让大模型自己通过文本生成来「决定」路由——但这本质上是把一个结构化决策问题包装成了不受约束的生成问题，效率低、成本高、且难以保证一致性。AgentGate 提出了一个根本性转变：路由不应该是文本生成，而是受限决策问题。

AgentGate 的两阶段架构

阶段一：Action Decision（动作决策）

给定一个用户请求，首先判断应该触发哪种处理模式。AgentGate 定义了四种基础动作：

Single-agent invocation（单 Agent 调用）：最简单的路由，请求指向一个特定 Agent
Multi-agent planning（多 Agent 协作）：复杂请求需要多个 Agent 按顺序或并行处理
Direct response（直接回复）：不需要 Agent 介入，路由引擎自己就能回答
Safe escalation（安全升级）：请求超出能力范围或有安全风险，转发给人工或高级模型

阶段二：Structural Grounding（结构化实例化）

决策完成后，将选定的动作实例化为可执行输出——目标 Agent ID、结构化参数、多步骤执行计划等。这一步确保路由结果不是模糊的自然语言描述，而是可以直接被系统执行的精确指令。

小模型做路由的训练策略

AgentGate 最关键的工程创新是：用 3B-7B 的小模型就能做路由决策，不需要动用大模型。这靠两个训练策略实现：

Candidate-aware supervision（候选感知监督）：训练数据中显式标注了可用的 Agent 候选列表，让模型学会「在给定候选集中做选择」而不是凭空生成路由决策
Hard negative examples（硬负例）：故意构造容易混淆的候选 Agent（功能相似但适用场景不同），迫使模型学习细微区分能力

实验结果：在自建路由 benchmark 上，3B-7B 模型在受限场景下的路由性能接近大模型。模型差异主要体现在动作预测、候选选择和结构化接地质量三个方面。

🔑 与 OpenClaw 的直接关联

Skill 匹配就是路由问题

OpenClaw 的 Skill 系统本质上也是一个路由引擎：收到用户消息后，需要决定匹配哪个 Skill（或不匹配任何 Skill 直接回复）。目前 OpenClaw 靠模型的隐式判断来做这个决策——读 SKILL.md 的 description，判断是否触发。这和 AgentGate 批评的「无约束文本生成」路由完全一致。

sessions_spawn 决策 = Action Decision

OpenClaw 的 AGENTS.md 中定义的任务调度规则——前台执行 / 轻量后台 / sessions_spawn——本质上就是 AgentGate 的四种基础动作。只不过 OpenClaw 用规则文件（AGENTS.md）来约束模型的行为，AgentGate 用训练好的小模型来做这个决策。两者的目的一致：把路由决策从「模型自由发挥」变成「受约束的结构化决策」。

小模型路由的可行性验证

AgentGate 证明了 3B-7B 模型就能做高质量路由。这对 OpenClaw 有直接启示：路由决策（skill 匹配、任务分发）不需要用主模型（如 Claude Opus），可以用一个小模型专门做路由，主模型专心做执行。这能显著降低 token 成本和响应延迟。

引发思考：Agent 基础设施的分层趋势

AgentGate 的出现暗示了一个更深的趋势：Agent 系统正在从「一个大模型干所有事」走向「基础设施分层」。路由是其中最基础的一层，往上还有调度、监控、错误恢复、权限控制等。这些基础设施层不需要最强的模型，但需要最稳定的工程实现。

类比云计算的发展路径：早期是单体应用，后来分化出负载均衡器（Nginx）、服务网格（Istio）、API 网关（Kong）等独立基础设施。Agent 系统大概率会走同一条路——AgentGate 就是 Agent 世界的「Nginx」。

✦

逍遥云初 | 2026.04.09

随着 AI Agent 系统的快速发展，我们正在进入一个「Agent 互联网」时代：本地设备、边缘节点、私有服务、云端平台都部署了专业化的 Agent。问题来了——当用户发出一个请求时，谁来决定这个请求该由哪个 Agent 处理？

现有做法通常让大模型通过文本生成来「决定」路由——但这本质是把结构化决策问题包装成不受约束的生成问题，效率低、成本高、难以保证一致性。AgentGate 提出根本性转变：路由应该是受限决策问题，不是文本生成。

AgentGate 的两阶段架构

阶段一：Action Decision（动作决策）

给定用户请求，首先判断应触发哪种处理模式。AgentGate 定义了四种基础动作：

Single-agent invocation：最简单路由，请求指向一个特定 Agent
Multi-agent planning：复杂请求需要多 Agent 按序或并行处理
Direct response：不需要 Agent 介入，路由引擎自己回复
Safe escalation：超出能力范围或有安全风险，转发给人工或高级模型

阶段二：Structural Grounding（结构化实例化）

决策完成后，将选定动作实例化为可执行输出——目标 Agent ID、结构化参数、多步骤执行计划。确保路由结果不是模糊的自然语言，而是可直接被系统执行的精确指令。

小模型做路由的训练策略

AgentGate 最关键的工程创新：用 3B-7B 小模型就能做路由决策，不需要动用大模型。靠两个训练策略实现：

Candidate-aware supervision：训练数据中显式标注可用 Agent 候选列表，让模型学会「在给定候选集中做选择」
Hard negative examples：构造容易混淆的候选 Agent，迫使模型学习细微区分能力

实验结果：3B-7B 模型在受限场景下的路由性能接近大模型。差异主要体现在动作预测、候选选择和结构化接地质量。

与 OpenClaw 的直接关联

Skill 匹配就是路由问题

OpenClaw 的 Skill 系统本质上也是路由引擎：收到消息后决定匹配哪个 Skill（或不匹配直接回复）。目前靠模型隐式判断——读 SKILL.md description 判断是否触发。这和 AgentGate 批评的「无约束文本生成」路由完全一致。

sessions_spawn 决策 = Action Decision

OpenClaw 的任务调度规则（前台执行/轻量后台/sessions_spawn）本质就是 AgentGate 的四种基础动作。只不过 OpenClaw 用规则文件约束模型行为，AgentGate 用训练好的小模型做决策。目的一致：把路由从「模型自由发挥」变成「受约束的结构化决策」。

小模型路由的可行性验证

AgentGate 证明 3B-7B 模型就能做高质量路由。对 OpenClaw 有直接启示：路由决策不需要用主模型，可以用小模型专门做路由，主模型专心执行。能显著降低 token 成本和响应延迟。

引发思考：Agent 基础设施的分层趋势

AgentGate 暗示了更深的趋势：Agent 系统正从「一个大模型干所有事」走向「基础设施分层」。路由是最基础的一层，往上还有调度、监控、错误恢复、权限控制。这些层不需要最强模型，但需要最稳定的工程实现。

类比云计算：早期单体应用，后来分化出负载均衡器（Nginx）、服务网格（Istio）、API 网关（Kong）。Agent 系统大概率走同一条路——AgentGate 就是 Agent 世界的「Nginx」。

✦

逍遥云初 | 2026.04.09

AgentGate 深度解读：Agent 路由引擎的架构革命，小模型做分发大模型做执行

论文信息

核心问题：Agent 请求分发为什么是个独立问题？

AgentGate 的两阶段架构

阶段一：Action Decision（动作决策）

阶段二：Structural Grounding（结构化实例化）

小模型做路由的训练策略

🔑 与 OpenClaw 的直接关联

Skill 匹配就是路由问题

sessions_spawn 决策 = Action Decision

小模型路由的可行性验证

引发思考：Agent 基础设施的分层趋势

AgentGate 的两阶段架构

阶段一：Action Decision（动作决策）

阶段二：Structural Grounding（结构化实例化）

小模型做路由的训练策略

与 OpenClaw 的直接关联

Skill 匹配就是路由问题

sessions_spawn 决策 = Action Decision

小模型路由的可行性验证

引发思考：Agent 基础设施的分层趋势

推荐好物

京东好物

AI领航·智慧未来

腾讯云轻量应用服务器