【AI Talk】02 敢问 Agent 路在何方

年初就在说的 Agent 元年，现在都已经第三季度了，除了昙花一现的 Manus, Minimax 等等营销向产品外，真正我用起来比较惊喜的就是以 Qwen Code 为代表的本地 CLI Agent。注：C 家的也很惊艳，但是创始人旗帜鲜明反华，我要抵制它。

在我看来，现在的 Agent 可以类比于 3D 打印，还没有找到最合适的场景和形态。其根本原因，当然有大家都在说的稳定性、幻觉、安全、隐私，但根本的矛盾点在于，Agent 并不符合经济学原理，即在现有的框架下，无法做到边际成本递减，因此只适合做探索类、小批量的工作。

不要小看这一点，这正是 n8n 异军突起的原因：所有需要重复多次定期执行的任务，最终的形态一定不会是 Agent，而是标准的自动化工作流，就像水往低处流一样，最终会流向成本最低的技术上。也就是说，哪怕现在 Agent 的主要挑战都被解决了，在可以标准化的工作上，还是不会大规模的应用，这一点我称之为 Agent 的成本悖论。

那么，Agent 下一步要怎么走呢？

从前面提到的成本悖论出发，结合大模型本身的发展趋势，答案就呼之欲出了：做标准的“非标”。这是什么意思呢，就是一部分流程是标准的，一部分流程是非标，用 Agent 把整个流程给串起来。举个例子：大部分的分析、咨询、调研和总结报告，在收集和处理数据这个环节，是标准的，标准的数据源，标准的查询方式，标准的数据结构（含结构化和非结构化数据）。而在分析的环节，也就是“看图写话”、“看数写话”的环节，是非标的，往往已经有一些假设和约束，要满足一定的分析目标。

拿着这个标准去套，相信你一定能找到其他适合的场景。记住这个公式：标准化工作流 + 个性化需求交付 = Agent。

好了，这就是我认为的 Agent 未来的路了。最后附送几条来自一线的实践与观察，可以一年后看看是否预测准确：

Broswer-use 是甜蜜的毒药，看起来无所不能，其实是无所能，反而把问题搞复杂了。
所有自动操作手机的 Agent 都是伪需求，只是给黑灰产提供解决方案。
Agent 一定要注意的是人要参与画龙点睛的关键步骤，交互的模式是 C&C = Copilot & Coach。
业务和数据都需要尽量向 MCP/Function Call/Tool Use（随便叫啥都行）靠拢，不是说用 MCP 封装原子能力，而是要封装一个独立环节的能力，什么是独立环节？要看具体的业务场景。
目前越复杂的 Agent 框架越需要谨慎，大部分的学习曲线和开发成本都不如直接自己先手搓，不要提前付出过多的技术成本，因为本质上不那么复杂。
Agent 的本质是 Context Engineering，这里做得最好最成熟的是 SillyTavern，因为 AI 角色扮演是被探索得非常充分的一个方向。这里我会单独写一篇，先挖个坑。

所以现在我可以回答标题的问题了：现阶段 Agent 的黄金公式是 标准化工作流 + 个性化需求交付。交互的方式是 C&C = Copilot & Coach。最值得研究的框架不是各种大厂开源，也不是 LangGraph，而是 SillyTavern。