首页/极客周刊/我为什么觉得 Hermes Agent 这张架构图很有价值:它把“会干活的 Agent”拆成了可理解、可复用的系统层
观点观察Hermes AgentAI Agent架构图技能系统记忆系统

我为什么觉得 Hermes Agent 这张架构图很有价值:它把“会干活的 Agent”拆成了可理解、可复用的系统层

2026年4月9日更新于 2026年4月9日
我为什么觉得 Hermes Agent 这张架构图很有价值:它把“会干活的 Agent”拆成了可理解、可复用的系统层

我最近看到一位国外作者公开了 Hermes Agent 的架构图,同时放出了画图 skill。对我来说,这张图最有价值的地方不是好看,而是它把一个自进化 Agent 的关键层次讲清楚了:记忆、技能、工具、通信、调度、平台接入,到底是怎么被拼成一个长期运行系统的。

我最近看到一位国外作者公开了 Hermes Agent 的架构图,同时还放出了一个专门用于绘制技术图的 Blueprinter skill。很多人看到这种内容,第一反应通常是“图画得真漂亮”;但我认真看完官方文档和 skill 页面之后,反而觉得它真正有价值的地方在于:它把一个看起来很玄的自进化 Agent,拆成了可以讨论、可以复用、可以工程化改造的结构层。

相关链接:

过去不少 Agent 项目都有一个共同问题:演示层很强,架构层很糊。你知道它“能做事”,但你说不清它到底凭什么能做、怎么把事情分层、哪些能力是模型本身,哪些能力是外部系统提供的,哪些又属于长期运行过程里沉淀出来的结构。于是系统一复杂,讨论就会立刻失焦。 Hermes Agent 的公开文档里有几个关键词非常鲜明:closed learning loop、persistent memory、skills system、subagents、multi-platform messaging、MCP support。这些词单独看都不陌生,但组合起来,其实已经不再是一个“会调用工具的聊天程序”,而是一个具备长期自我强化机制的运行环境。

我理解这张架构图最该表达的,不是模块多,而是路径清晰

一个真正有生命力的 Agent 系统,我觉得至少要回答五个问题:

  1. 用户从哪里进来?
  2. 系统如何理解当前任务?
  3. 它如何决定调用什么能力?
  4. 执行结果如何落盘并转化为长期资产?
  5. 下次遇到类似问题时,它如何变得更快?

Hermes 这类架构图的意义,就在于它把这五个问题串成了一条连续路径,而不是把“模型、工具、记忆”当作互不相干的零件堆在一起。

以官方文档描述来看,我会把它理解成几层:交互入口层、任务理解与调度层、执行层、记忆层、技能层、平台/工具扩展层。入口可以是 CLI、Telegram、Discord 甚至更多消息平台;调度层负责把任务送到合适的执行路径;执行层调用工具、模型与子代理;记忆层负责跨会话沉淀;技能层把一次成功做法变成可复用程序记忆;扩展层再通过 MCP、外部工具和运行后端把边界打开。

为什么“记忆层 + 技能层”是我最关注的组合

官方文档提到 Hermes 的一个关键卖点:built-in learning loop,也就是系统会在执行过程中把经验变成可复用资产。我觉得这是很多 Agent 跟传统聊天助手真正拉开差距的地方。 只有记忆,没有技能,系统会“记得很多事”,但不一定“更会做事”;只有技能,没有记忆,系统也许能复用流程,却不一定理解这个用户、这个项目和这个环境的连续性。把两者放到同一套架构里,意义就完全不一样了:记忆回答“我是谁、我们以前做过什么”,技能回答“遇到这种事,我该怎么高质量再做一遍”。

从工程角度看,这种分层也特别合理。因为记忆更像状态和上下文资产,技能更像过程资产和操作资产。前者偏检索、摘要、建模;后者偏流程封装、经验固化、调用触发。把这两块拆清楚,系统后期才不会越来越乱。

Blueprinter 这个配套 skill,恰好暴露了另一层价值

公开的 Blueprinter skill 并不是单纯“帮你画个漂亮图”,它的规则非常明确:高 data-ink ratio、无多余装饰、单色或极简强调色、严格对齐、结构优先。这种设计哲学本身就很值得玩味。它反映出的不是审美偏好,而是一种工程表达习惯:图不是用来营销的,图是用来让人看懂系统的。

我觉得这点对 Agent 项目尤其重要。因为 Agent 系统天生复杂,既有模型推理,也有工具调用,还可能有外部平台、消息总线、记忆写入、子代理并发、权限审批。如果没有高质量的架构图,团队内部沟通会非常痛苦,外部开发者也很难快速建立正确心智模型。

这张图真正适合谁看

我觉得至少有三类人会从这种架构公开里受益。

第一类,是正在搭 Agent 平台的人。 他们不一定照抄 Hermes,但完全可以参考它如何分离记忆、技能、工具和交互层,避免一上来就做成一锅粥。

第二类,是已经被“万能单 Agent”方案折磨过的人。 你会越来越意识到,一个系统不是模型更大就自然更稳,很多时候反而是分层设计是否清楚决定了上限。

第三类,是需要给团队讲清楚系统的人。 研发、产品、运维、安全、集成方,大家关心的问题都不同。没有架构图,你几乎没法在一个平面上对齐认知。

如果让我概括 Hermes 架构带来的启发

第一,Agent 不是单个大脑,而是多层机制的组合体。 模型只是其中一层,长期价值来自记忆、技能、调度和平台整合。

第二,自进化不是玄学,必须落实到结构上。 如果系统没有明确的经验沉淀路径,“自我提升”最终只是宣传语。

第三,图纸能力本身也是基础设施能力。 能否把复杂系统讲清楚,决定了它能不能被更多人真正使用、扩展和维护。

最后说我的判断

我一直觉得,一个技术项目愿意公开自己的架构图,往往意味着它已经开始从“只想展示效果”转向“愿意让别人理解它是怎么运作的”。而这一步非常重要。因为只有当外部开发者能理解你的系统,生态才可能形成;只有当团队内部能讲清楚系统,复杂度才有机会被控制住。

所以我看这张 Hermes Agent 架构图,重点不是它是不是最完美,而是它提供了一个非常好的讨论起点:如果你也想做长期运行、会自我沉淀、能跨平台协作的 Agent,到底应该从哪些层开始搭。

这比“又一个效果很惊艳的视频”更有价值。视频解决的是吸引力,架构图解决的是可复制性。真正能让一个系统活得久的,最后往往不是前者,而是后者。