滚动资讯

Manus抢跑AI Agent竞赛，能否引领智能体新时代？

时间：2025-03-11 08:55 来源：ITBEAR作者：顾雨柔

在科技界的聚光灯下，一款名为Manus的产品于3月6日凌晨震撼登场，被誉为“全球首款通用型AI Agent产品”。凭借现场观众的热烈反响及一系列官方展示的成功案例，Manus迅速成为舆论焦点，吸引了众多媒体与营销号的密切关注。然而，随着用户测试的深入，邀请码的一票难求以及测试中暴露的卡顿、响应迟缓、任务未完成等问题，使得其口碑迅速分化，部分用户开始质疑其是否仅为“套壳”产品。

与此同时，国内两大团队metaGPT和开源社区CAMEL-AI迅速响应，几乎同时推出了Manus的开源复刻项目。metaGPT的Open Manus在GitHub上迅速积累了超过7000个星标，而CAMEL-AI打造的OWL则在智能体测试基准GAIA开源榜单上取得了57.7%的亮眼成绩。借助Manus的热度，这两个团队成功实现了破圈发展。

抛开流量炒作与营销造势不谈，仅从产品理念及其影响来看，Manus的此番抢跑无疑加剧了AI Agent领域的竞争态势，并预示着“GPTs类”智能体或将逐步退出历史舞台。一方面，AI Agent已被视为2025年AI竞争的核心领域，知名投行巴克莱在其最新研报中将“推理模型”与“Agent”视为新时代的引领者。Manus作为这一趋势中的先行者，有望激发科技巨头加速布局AI Agent。

进入2025年，OpenAI接连推出了Operator和Deep Research两款AI Agent。在Manus走红的同时，微软也发布了两个新的AI Agent，meta则为Facebook和Instagram推出了客服领域的AI Agent。亚马逊AWS据传也组建了一个专注于Agent开发的新团队，旨在帮助人们自动化日常生活中的部分事务。

另一方面，AI Agent的定位日益清晰，无论是开发者还是用户，都愈发重视其任务执行能力，而非定制化的聊天功能。这意味着，包括OpenAI在内的众多企业，都将逐渐放弃GPTs类智能体，转而探索提升AI Agent执行效率的新路径。Manus的推出，或将加速这一转型进程。

新的AI Agent竞争阶段将呈现出四大趋势：从与AI合作转变为监督Agent工作；优秀的Agent将成为合格的终端消费品；编程平权将带来更加灵活的执行方式；围绕Agent建设“统一市场”。

在过去，人们习惯将基于高级Prompt搭建的、具备专业背景的聊天机器人称为智能体。然而，这些智能体往往需要人与AI共同完成任务，无法真正提升用户效率。当大模型变得足够智能时，用户只需一句话即可召唤所需服务，无需再从众多智能体中选择。GPTs类智能体是基于当前技术现状设计的，而Manus则致力于打造一个能够承载未来技术的载体。

Manus之所以令人震撼，是因为它展现了用户发出命令后，无需对话引导，仅需监督Agent执行的未来雏形。这种模式下，用户无需针对不同场景进行设定，只需一句话即可启动不同领域的任务，极大提升了使用AI的效率。然而，面向未来技术能力的载体在当前技术条件下难免存在不足，Manus也因此遭受了质疑。

Manus的成功之处在于从C端用户需求出发，构建了一种高度灵活且低门槛的Agent服务模式。在B端市场，客户对Agent的可靠性有着更高要求，因此AI Agent的探索往往从垂直业务场景的优化切入。而在C端市场，好的消费品不仅要好用，还要简单。Manus通过让用户说出需求，由Agent进行分析拆解并分配不同任务，调用不同API完成任务，整个过程清晰可见，用户可介入调整。

然而，Manus在执行具体任务的准确度与精细度上仍有欠缺。OpenAI也有类似想法，但选择了先通过定制化模型训练出更适合执行具体任务的Agent。未来，这些Agent可能会成为ChatGPT手下的“员工”。

编程平权将为Agent执行任务带来更灵活的手段。一些公司构建Agent时，会选择由人来搭建整个工作流，重要节点由大语言模型掌控。但这种方式构建的Agent较为死板，难以灵活应对所有场景。因此，应利用先进的推理模型，赋予其人类使用的工具，直接针对期望结果进行优化。Manus强调“Less structure, more intelligence”，减少对AI的结构化限制，依赖大模型能力组建工作流。

在大模型指挥下，对编程能力的调用将带来解决复杂问题的更好方案。在Manus的演示案例中，可以看到根据搜集到的信息创作仪表盘的操作是通过编程解决的。编程平权带来了执行任务的更高可控性。

Agent需要一次“统一市场”的建设。用户在登录Manus后，若要充分发挥效用，需要一个连接范围广的联合登陆机制。然而，API无法帮助Agent克服移动互联网的孤岛效应。因此，需要构建一个以Agent为核心的操作系统，融合软硬件能力，协作不同模型。

在国内，尽管互联互通口号响亮，但实现联合登陆机制仍面临困难。因此，出现了GUI（图形用户接口）Agent，希望通过让AI读取屏幕信息，在更底层绕过App之间的壁垒。相比之下，Manus的AI+虚拟机方案虽然更安全、更易实现，但局限较多，不够底层。

长远来看，基于GUI Agent形成的以Agent为核心的操作系统将成为目标。这个操作系统本质上是一个融合软硬件能力、能协作不同模型的“大脑”，将推动AI Agent领域迈向新的发展阶段。

更多>同类内容