在科技界的聚光灯下,一款名为Manus的产品于3月6日凌晨震撼登场,被誉为“全球首款通用型AI Agent产品”。凭借现场观众的热烈反响及一系列官方展示的成功案例,Manus迅速成为舆论焦点,吸引了众多媒体与营销号的密切关注。然而,随着用户测试的深入,邀请码的一票难求以及测试中暴露的卡顿、响应迟缓、任务未完成等问题,使得其口碑迅速分化,部分用户开始质疑其是否仅为“套壳”产品。
与此同时,国内两大团队metaGPT和开源社区CAMEL-AI迅速响应,几乎同时推出了Manus的开源复刻项目。metaGPT的Open Manus在GitHub上迅速积累了超过7000个星标,而CAMEL-AI打造的OWL则在智能体测试基准GAIA开源榜单上取得了57.7%的亮眼成绩。借助Manus的热度,这两个团队成功实现了破圈发展。
抛开流量炒作与营销造势不谈,仅从产品理念及其影响来看,Manus的此番抢跑无疑加剧了AI Agent领域的竞争态势,并预示着“GPTs类”智能体或将逐步退出历史舞台。一方面,AI Agent已被视为2025年AI竞争的核心领域,知名投行巴克莱在其最新研报中将“推理模型”与“Agent”视为新时代的引领者。Manus作为这一趋势中的先行者,有望激发科技巨头加速布局AI Agent。
进入2025年,OpenAI接连推出了Operator和Deep Research两款AI Agent。在Manus走红的同时,微软也发布了两个新的AI Agent,meta则为Facebook和Instagram推出了客服领域的AI Agent。亚马逊AWS据传也组建了一个专注于Agent开发的新团队,旨在帮助人们自动化日常生活中的部分事务。
另一方面,AI Agent的定位日益清晰,无论是开发者还是用户,都愈发重视其任务执行能力,而非定制化的聊天功能。这意味着,包括OpenAI在内的众多企业,都将逐渐放弃GPTs类智能体,转而探索提升AI Agent执行效率的新路径。Manus的推出,或将加速这一转型进程。
新的AI Agent竞争阶段将呈现出四大趋势:从与AI合作转变为监督Agent工作;优秀的Agent将成为合格的终端消费品;编程平权将带来更加灵活的执行方式;围绕Agent建设“统一市场”。
在过去,人们习惯将基于高级Prompt搭建的、具备专业背景的聊天机器人称为智能体。然而,这些智能体往往需要人与AI共同完成任务,无法真正提升用户效率。当大模型变得足够智能时,用户只需一句话即可召唤所需服务,无需再从众多智能体中选择。GPTs类智能体是基于当前技术现状设计的,而Manus则致力于打造一个能够承载未来技术的载体。
Manus之所以令人震撼,是因为它展现了用户发出命令后,无需对话引导,仅需监督Agent执行的未来雏形。这种模式下,用户无需针对不同场景进行设定,只需一句话即可启动不同领域的任务,极大提升了使用AI的效率。然而,面向未来技术能力的载体在当前技术条件下难免存在不足,Manus也因此遭受了质疑。
Manus的成功之处在于从C端用户需求出发,构建了一种高度灵活且低门槛的Agent服务模式。在B端市场,客户对Agent的可靠性有着更高要求,因此AI Agent的探索往往从垂直业务场景的优化切入。而在C端市场,好的消费品不仅要好用,还要简单。Manus通过让用户说出需求,由Agent进行分析拆解并分配不同任务,调用不同API完成任务,整个过程清晰可见,用户可介入调整。
然而,Manus在执行具体任务的准确度与精细度上仍有欠缺。OpenAI也有类似想法,但选择了先通过定制化模型训练出更适合执行具体任务的Agent。未来,这些Agent可能会成为ChatGPT手下的“员工”。
编程平权将为Agent执行任务带来更灵活的手段。一些公司构建Agent时,会选择由人来搭建整个工作流,重要节点由大语言模型掌控。但这种方式构建的Agent较为死板,难以灵活应对所有场景。因此,应利用先进的推理模型,赋予其人类使用的工具,直接针对期望结果进行优化。Manus强调“Less structure, more intelligence”,减少对AI的结构化限制,依赖大模型能力组建工作流。
在大模型指挥下,对编程能力的调用将带来解决复杂问题的更好方案。在Manus的演示案例中,可以看到根据搜集到的信息创作仪表盘的操作是通过编程解决的。编程平权带来了执行任务的更高可控性。
Agent需要一次“统一市场”的建设。用户在登录Manus后,若要充分发挥效用,需要一个连接范围广的联合登陆机制。然而,API无法帮助Agent克服移动互联网的孤岛效应。因此,需要构建一个以Agent为核心的操作系统,融合软硬件能力,协作不同模型。
在国内,尽管互联互通口号响亮,但实现联合登陆机制仍面临困难。因此,出现了GUI(图形用户接口)Agent,希望通过让AI读取屏幕信息,在更底层绕过App之间的壁垒。相比之下,Manus的AI+虚拟机方案虽然更安全、更易实现,但局限较多,不够底层。
长远来看,基于GUI Agent形成的以Agent为核心的操作系统将成为目标。这个操作系统本质上是一个融合软硬件能力、能协作不同模型的“大脑”,将推动AI Agent领域迈向新的发展阶段。