Published on

【AI Talk】02 敢问 Agent 路在何方

Authors

年初就在说的 Agent 元年,现在都已经第三季度了,除了昙花一现的 Manus, Minimax 等等营销向产品外,真正我用起来比较惊喜的就是以 Qwen Code 为代表的本地 CLI Agent。注:C 家的也很惊艳,但是创始人旗帜鲜明反华,我要抵制它。

在我看来,现在的 Agent 可以类比于 3D 打印,还没有找到最合适的场景和形态。其根本原因,当然有大家都在说的稳定性、幻觉、安全、隐私,但根本的矛盾点在于,Agent 并不符合经济学原理,即在现有的框架下,无法做到边际成本递减,因此只适合做探索类、小批量的工作。

不要小看这一点,这正是 n8n 异军突起的原因:所有需要重复多次定期执行的任务,最终的形态一定不会是 Agent,而是标准的自动化工作流,就像水往低处流一样,最终会流向成本最低的技术上。也就是说,哪怕现在 Agent 的主要挑战都被解决了,在可以标准化的工作上,还是不会大规模的应用,这一点我称之为 Agent 的成本悖论。

那么,Agent 下一步要怎么走呢?

从前面提到的成本悖论出发,结合大模型本身的发展趋势,答案就呼之欲出了:做标准的“非标”。这是什么意思呢,就是一部分流程是标准的,一部分流程是非标,用 Agent 把整个流程给串起来。举个例子:大部分的分析、咨询、调研和总结报告,在收集和处理数据这个环节,是标准的,标准的数据源,标准的查询方式,标准的数据结构(含结构化和非结构化数据)。而在分析的环节,也就是“看图写话”、“看数写话”的环节,是非标的,往往已经有一些假设和约束,要满足一定的分析目标。

拿着这个标准去套,相信你一定能找到其他适合的场景。记住这个公式:标准化工作流 + 个性化需求交付 = Agent

好了,这就是我认为的 Agent 未来的路了。最后附送几条来自一线的实践与观察,可以一年后看看是否预测准确:

  1. Broswer-use 是甜蜜的毒药,看起来无所不能,其实是无所能,反而把问题搞复杂了。
  2. 所有自动操作手机的 Agent 都是伪需求,只是给黑灰产提供解决方案。
  3. Agent 一定要注意的是人要参与画龙点睛的关键步骤,交互的模式是 C&C = Copilot & Coach。
  4. 业务和数据都需要尽量向 MCP/Function Call/Tool Use(随便叫啥都行)靠拢,不是说用 MCP 封装原子能力,而是要封装一个独立环节的能力,什么是独立环节?要看具体的业务场景。
  5. 目前越复杂的 Agent 框架越需要谨慎,大部分的学习曲线和开发成本都不如直接自己先手搓,不要提前付出过多的技术成本,因为本质上不那么复杂。
  6. Agent 的本质是 Context Engineering,这里做得最好最成熟的是 SillyTavern,因为 AI 角色扮演是被探索得非常充分的一个方向。这里我会单独写一篇,先挖个坑。

所以现在我可以回答标题的问题了:现阶段 Agent 的黄金公式是 标准化工作流 + 个性化需求交付。交互的方式是 C&C = Copilot & Coach。最值得研究的框架不是各种大厂开源,也不是 LangGraph,而是 SillyTavern