- Published on
【AI Talk】01 等待戈多的 Manus 们
- Authors
- Name
- 小土刀
- @wdxtub_com
听闻 Manus 裁员,赶忙打开 Xsignal 的"奇异风口(Trend X)",三月份突兀的声量尖峰带我回到了那个疯狂的 Q1:DeepSeek 带来的狂潮让 AI 圈子每天都在"炸裂"。然而巅峰也是拐点,4 月和 5 月国内 AI 整体下跌的趋势不可阻挡,好在 6 月一举扭转了颓势,AI 全生态开始反弹,就看 "AI 牛市" 能坚持多久了。
注:这里卖个关子,6 月是什么带来了逆跌?上半年 AI 国内和海外全生态又有哪些从数据里挖掘出的秘密?请期待我们的“AI半载录”系列报告。
已经不太记得 Manus 是什么时候不用邀请码的,反正我第一时间就注册了账号,靠着每天的免费积分,时不时用它来做一些简单的任务。最近 Minimax 和 Kimi 也都有发力 Agent,海外御三家的 Deep Research 我也一直在用,但是这些 Agent 交付的结果,总是不令人满意,完全配不上这半年每天的“震惊”和“炸裂”。
于是我转过来头开始体验各种 OpenManus,他们八仙过海地把 computer-use(大模型操作电脑)、browser-use(大模型操作浏览器)、prompt 和各种大模型 API 用 Agent Loop 串到一起,至于这个 Loop(循环)的名称叫什么,怎么唬人怎么来,比如 PDCA、Sense-Plan-Act 等等。
卖家秀很美好:一句自然语言,Agent 就开始无休止干活,复杂任务、主动规划、自主行动、完美交付。买家秀很真实:步骤太多、执行太慢、Token爆炸、效果还不如 Chatbot + 联网搜索的直接回答。总结一下就是:越通用,越无效。
想要让 Agent 干活靠谱,需要高精度、场景化、结构化的数据集,而这类数据集的准备却是苦活、累活、慢活:
- 业务流程拆解梳理;
- 专家级的细致标注、审核;
- 持续不断地数据回流和 QA 校验;
- 充分挖掘和明确大模型的能力边界,特定任务适配特定模型;
这,实际上是一套精细的流水线工厂,需要强大的项目管理能力和工程优化能力。在我看来,快速进行数据质量迭代提升,才是 AI 产业真正的壁垒。这需要长期主义的耐心:沉淀数据,打磨系统,闭环用户体验,一步一个脚印构建垂直场景内精准可控的小 Agent。
也许梦想可以先小一点,不谈 AGI,而是“有用即智能”。在贝克特的剧本中,戈多终究没有出现。AI 行业或许也一样,戈多不是等出来的,而是干出来的。干那些看似不起眼的苦活,做那些非性感却扎实的数据集。
此时此刻脑海中响起国际歌:从来就没有什么救世主, 也不靠神仙皇帝! 要创造人类的幸福, 全靠我们自己!