炒到10万,整夜爆火的Manus却不好用

发布日期:2025-03-12 13:26    点击次数:152

文|荣智谋

裁剪|向由

值班裁剪|宝珠

视觉 | 顾芗

近日,自称“全球第一款通用AI Agent家具”的Manus整夜之间爆火。

其声称性能“吊打”Open AI同款,邀请码被炒至天价,甚而能卖到9万、10万元一个。

Manus火得出其不备,但不算窘态其妙。

在二手平台上,Manus邀请码最贵已被炒至10万元级别

火的原因有两点,一是多家造势,风很大,但实测的东说念主少,精巧感强,重复“原土团队”光环,又是一个其后居上的案例;二是大模子的好,全球齐视力了,但一直停留在聊天上。当今急需趁手的团员式器具,把脑子里的想法变变现。

忽然,说曹操曹操就到,求仁得仁。

团员式器具也没那么微妙,杰出于“高德打车”吧。

Manus是什么?行内叫智能体(Agent),世俗点不错叫“器具东说念主”。这个器具东说念主就所以大模子为“大脑”,我方“脱手”使用器具来完成任务。Manus英文便是“手”的酷好。

有代表性的器具东说念主当属OpenAI的深度筹划(Deep Research)和Anthropic的计较机应用(Computer Use)。以实测戒指来看,Manus够不上宣传片里的成果:幻觉较多,任务基本以失败告终。

家具官网炫耀,在GAIA基准测试(评估通用AI助手搞定确凿宇宙问题的才调)中,Manus在扫数三个难度级别上,齐获得了新的开始进(SOTA)发扬

要害,是不是“器具东说念主”,要看它是不是确凿能自行决定奈何完成任务、挑什么器具,而不是靠编好的代码。

Manus当前未有任何信息能解说我方是确凿的智能体——莫得东说念主为想象的职责经由。因此,只可说它在宣传里呈现出“智能体”或通用东说念主工智能(AGI)的神情,并围绕这一主见作著作。

而Manus也绝非一无是处。当作一款应用,界面简易友好;大脑(念念考)、手(操作)、委派的档次相配阐明,组合起来亦然相对及格确现代“牛马”,照旧能帮你普及一丝分娩力。

下文将例如证据Manus怎么完成职责任务、上风和局限以及工夫逻辑是什么。省流版:别花好几万买什么邀请码,一个“毛坯房”不值得。

使用器具是大知识

“器具东说念主”毫不成纯聊天,不干活儿,专科器具东说念主齐是一边聊一边干:左靠近话框,右面操作台。Manus和Claude的界面齐是如斯。

证据“我有一个一又友”的实测,给Manus由表及里地提了几个寂然的条件,比如写演义,给苹果股价建模,写一个游戏等等,戒指不太乐不雅。

通盘经由是这么的:用户在对话框里发布提醒,Manus在操作台一顿输出,用户不错阐明地看到Manus使用器具的过程,并收受它的操作戒指。

Manus的操作经由展示

收到提醒后,Manus是这么使用器具的:

最初,竖立一个总文献夹写明“大指标”,再竖立多个清单式的子文献夹,将任务理会,临了一一完成子文献夹的“小指标”。完成小指标时,它可能在浏览器一通搜索,也可能写一段代码。

也便是说,Manus主要器具就三种,浏览器器具(Agent),计较机谈话Python和一部分号召行。

其次,欺诈超文本秀丽谈话HTML来输出“戒指”。

也便是说,Manus用网页呈现扫数的戒指。

有东说念主问,它不是作念了10页PPT给我了吗?这亦然Manus“理智”的所在,其实它莫得PPT器具,为了你的PPT,它用前端器具写了一大堆页面,通过号召行把前端页面打包成一个压缩包,下载下来是一堆前端网站,每个前端网站便是一页PPT——天然甲方很过分,但乙方照旧出色地完成了任务。

两个纰谬让Manus不好用

在具体测试Manus的过程中,有两个问题明显炫耀。

一是浏览器器具的局限。

碰到反爬虫网站或需要东说念主机考据的网站,它根底无法读取数据。比如,你想要在多个购物网站比价一款手机,进不去的网站它只可作罢,临了给出的是在搜索页标题里找出来的价钱的比拟。总之,股指配资它给出的戒指相配马虎,根底够不上你想要的戒指。

这亦然浏览器器具的通病。Open AI给出过统计数据,其浏览器Agent在数据集上只可完成58.1%的任务,而东说念主类能完成78.2%,差距是浩大的。

但是,Open AI的浏览器器具才调照旧不差的,能帮东说念主订餐厅,买机票。而Manus的浏览器器具只可掀开页面,下滑,少量数时刻点进某个网页。因此,Manus应该莫得检修我方的浏览器Agent,仅能作念一些初步的通俗职责。

Manus官方展示的买房案例

而况,Manus选拔器具也有局限。它未必相配股东地用Next.js写代码,这是一个全栈面容,前后端齐能用的那种。但是Manus又莫得部署后端的才调,各式报错之后堕入“深深的念念索”。

二是幻觉严重。

比如给苹果公司作念财务估值,Manus此次莫得欺诈浏览器搜索,而是写了一个Python剧本,在剧本里调用“雅虎金融”的接口来读取公司关统共据。

然则,在履行过程中,它并莫得提供确凿数据,而是撰写了一堆模拟数据——也便是我方编的数据。反查它的操作经由,如实莫得调用过任何API,也莫得任何搜索过程,幻觉是比拟严重的。

它临了给出的证明,天然亦然彻底不成用的。

Manus不错掀开Python进行分析,并生成HTML网页文献

在处理任务时,Manus大齐将大模子和Python剧本混在一说念操作,凹凸文极长,更容易产生无理。用户如若不堤防或枯竭辞别才调,也更容易被“蒙骗”。

模子即家具

Manus AI首创东说念主肖弘在接受采访时,提到了联合智能体的中枢:捏造机。

其实,智能体应该是一个“DeepSeek”+“我”的东西。这里的“我”是实施变装。

在莫得智能体之前,我嘱托任务,大模子念念考指标、理会举止,“我”来实施并拿到戒指。有了智能体之后,我嘱托任务,智能体胜利给我戒指。

就像我需要10页PPT,DeepSeek给我写好每一页内容,“我”复制到PPT里。当今,我需要10页PPT,智能体就给了我10页PPT。

底本需要我使用电脑(作念PPT),当今是大模子在使用我的电脑(作念PPT)。

这便是智能体的本色。

如若用的是软件搭出来的硬件系统,那么这个智能体便是大模子+捏造机。

如若胜利调用现实中的电脑,那么这个智能体便是大模子+计较机。一年前Claude就能拿用户的电脑作念网页了。

这是因为当今大模子还较难确凿接入物理宇宙,只可在“真假”计较机凹凸功夫。如若万物互联,“大模子+锅碗瓢盆”可能胜利把餐饮业干倒闭了,天然倒闭的确定也不单一个行业了。这是后话。

智能体的背后,是“模子即家具”的念念路。

正如Open AI的深度筹划,Anthropic的计较机应用,齐不再套用自家的通用模子,而是证据应用场景,检修全新的强化模子,这个强化模子本人便是一个好用的家具。

反过来看Manus,天然是莫得自家的大模子,也枯竭非常检修的关系器具,但是团员的念念路和发扬样子很见效,也将大模子“纯文本职责”——写代码、写翰墨的上风,通过网页委派阐明地展示了出来。

在检修模子的逻辑上,Manus可能也并莫得扫尾Claude东说念主、大模子、环境三者即时反映的简易模式,而如故效率之前东说念主、大模子、任务理会、器具使用、程度演化、指标达成等复杂结构。

Manus AI搭伙东说念目的涛在支吾平台回话称,“当前收受邀请码机制,是因为此刻就业器容量如实有限”

在DeepSeek相配见效的今天,发展智能体是妥当了场面的需要、专家的需求。各家AI公司齐但愿收拢这个契机来发力。霸占流量亦然发力的一部分。

关于相通消耗者而言,最进犯的照旧多不雅察,多了解,别急着掏钱。东说念主工智能不会废弃你的糊口,但是浮躁会。