我今天重点看了 5 个涨得最快的 Agent 项目:记忆、交易、科研和工程化都开始连起来了

如果只看这两天的开源热度,我会把注意力放在 Agent 这一条线上。原因不是单点能力又强了一点,而是长期记忆、多 Agent 协作、自动科研、生产级编排,以及更完整的任务执行闭环开始接上了。它们放在一起看,已经不是几个新玩具,而是一套越来越接近真实工作系统的雏形。
我今天翻了一圈开源趋势,最有意思的不是某一个模型突然更强了,而是 Agent 这条线开始出现明显的结构化升级。
以前大家聊 Agent,很多时候还是停留在“会调工具”“会写几步流程”“能做点自动化”这种层面。但这两天我看到热度蹿升最快的几个项目,已经把问题往更深的地方推了:怎么记住上下文、怎么让多个角色协同、怎么把实验和决策流程自动化、怎么把这些能力真正带进生产环境。
我觉得这里面最值得先看的,是 NousResearch/hermes-agent。它抓住的是一个很真实的问题:传统 Agent 经常是“一轮对话一个脑子”,这次聊完,下次像重开。你让它执行复杂任务,它可能当下表现不错,但时间一拉长,偏好、历史、习惯、失败经验都保不住。这个项目的意义,不只是“多了记忆功能”,而是在尝试把 Agent 从一次性工具,往长期协作对象推进。对真正想把 AI 接进日常工作流的人来说,这一步特别关键。没有稳定记忆,很多所谓自动化最后都会变成重复喂上下文。
第二个让我觉得很有代表性的,是 TauricResearch/TradingAgents。它的价值不只是把交易场景做成了多 Agent,而是把一个真实组织里的角色分工抽象了出来:研究、风控、判断、执行,不再混成一个单点决策器。哪怕你不做交易,这个思路也很值得借:很多复杂任务本来就不应该交给一个 Agent 一把梭,而应该拆成不同立场、不同职责的协作过程。单 Agent 像一个聪明的执行者,多 Agent 更像一个会内部讨论的小团队,这两者在可靠性上差别很大。
第三个方向是 SakanaAI/AI-Scientist-v2。我一直觉得自动科研是 Agent 真正有想象力的一条路,因为它不是简单地帮人写文字,而是开始接手“提出假设—设计实验—运行验证—整理结果”这一整段链路。它背后代表的其实是一种变化:AI 不再只是回答问题,而是在更长的闭环里参与知识生产。哪怕它短期内还代替不了成熟研究者,它也已经足够成为研究过程里的加速器,尤其是在高重复、强试错的环节上。
再往工程落地看,microsoft/agent-framework 也很值得盯。这类项目的真正意义,不是多一个官方框架,而是它开始把多 Agent 编排、部署、运行管理这些原来很散的事情往工程化收束。很多人现在做 Agent,最大的问题不是 Demo 跑不起来,而是 Demo 很容易,长期维护很难。一旦任务变复杂、角色变多、状态变长,没有一个靠谱的编排底座,最后就是一堆胶水代码。微软下场做这件事,至少说明一件事:Agent 这件事正在从实验区进入工程区。
最后是 block/goose。我觉得这类项目代表的是另一条趋势:Agent 不再满足于给建议,而是越来越深入到实际执行层。能安装、能编辑、能测试、能自己推进任务,这和过去那种停留在聊天窗口里的助手已经完全不是一类东西了。对开发者来说,这种变化非常直接——大家真正想要的不是一个会说话的搭子,而是一个能帮你把任务往前推的执行系统。
如果把这 5 个项目放在一起看,我的感觉很明确:Agent 的竞争重点,正在从单点能力展示切到系统能力组合。谁能记住更多、协同得更稳、执行得更深、落地得更工程化,谁就更接近下一阶段真正有生产价值的 AI 工具。
所以我今天看完最大的判断不是又多了 5 个热门仓库,而是:Agent 正在从功能模块,变成工作系统。这一步一旦走稳,后面很多行业里的内容生产、研究分析、自动执行、团队协作方式,都会被重新定义。