关闭广告

测Manus 1.5:丝滑,超预期,Manus独特上下文工程的一次关键展示

硅星人505人阅读


作者 | 周一笑
邮箱 | zhouyixiao@pingwest.com

过去半年多保持低调的Manus,进行了一次值得关注的更新,Manus直接从1.0版本跨越到1.5,中间没有经历小版本发布,团队似乎在憋一个大招。

事实是Manus团队花了7个月时间专注于架构级改进,最终交出了Manus1.5,根据官方数据任务完成速度提升近4倍,从平均15分钟缩短到不到4分钟;任务质量提升15%,用户满意度提高 6% 。

根据官方的介绍,Manus1.5版本最大的亮点在于全栈Web应用开发能力。现在你可以通过对话来构建和部署生产级Web应用,包括后端服务器、数据库、用户认证系统、自定义域名、内置分析,甚至版本控制,所有这些都不需要离开Manus平台。此外,新增的协作功能和 Library 资料库,让团队可以在同一空间共享会话、版本和资产。

作为一个曾经测试过多款AI Coding工具的用户,我对“AI 生成网站”这类功能早已不陌生。当我看到据传是有人用Gemini 3.0复刻macOS的演示后,我决定用Manus 1.5来试试,看它能做到什么程度?

1

实测:一句话,十分钟,复刻MacOS


更新后的Manus1.5可以切换1.5和1.5 Lite,免费用户只能使用Lite。我们选择Manus 1.5来进行测试。

输入Prompt:帮我做一个网页版的复古 Mac OS 桌面。 1、外观风格:要像经典的 Mac OS 9 系统,有标志性的顶部菜单栏和可以拖动的窗口。 2、内置软件:桌面需要包含三个基本软件:一个可以打字的“记事本”,一个能用 AI 画画的“AI 画家”,以及一个“计算器”功能。 3、账户系统:这个网站必须有账户系统。

开始测试,可以看到Manus的界面没什么变化,左边是对话框,右边可以看Manus操作云电脑的过程、预览代码和项目。


输入指令之后,Manus没有问我更多问题,它的第一步是初始化全栈Web项目,搭建后端、数据库和账户系统。像一个专业工程师那样,先打好地基再盖房子。


接着Manus开始设计系统架构和技术方案,并且创建了一个DESING文件。从技术栈、数据库表,到UI细节,甚至可能的技术挑战都提前想好并给出了解决方案。



然后就是开发过程,有点像进入了心流状态的程序员,开始了没有中断的开发,它会自己安装依赖包、重启服务、修正代码中的类型错误。

大概10分钟后,它交作业了!


从视觉上看,Manus确实抓住了一些精髓。标志性的青色桌面背景、顶部的菜单栏、以及三个小巧的应用图标,都颇有几分经典Mac OS 9的神韵。同时好像也抓住了一些Windows复古界面的味道。


不过,看起来不错是一回事,真正能用又是另一回事。我们来试试三个内置的应用:记事本、AI画家和计算器

在测试过程中,我发现这个os像真正的桌面系统,是支持多窗口的,并且各个应用的窗口都可以流畅的点选、拖动和关闭,毫无“网页感”。


最基础的记事本开始,我测试了新建文档,编辑内容,保存这些基本功能都没有问题。


然后是计算器,只有基础的加减乘除,且只能顺序计算,经过测试没有问题。


最后是难度最高的,加入了AI功能的“AI画家”应用,我们来画一只猫咪坐在月亮上。


完全超出预期的真能生图,输入的Prompt中我把“一只”打成了“一直”,不过不影响生成效果,it just work!


注意这里我是没给Manus提供api的,应该是就像Manus在design.md文件里写的,调用了Manus Built-in Image Generation API。只是不知道消耗的token算谁的,扣积分吗?

生成的图片长这样:



关闭后重新打开应用,生成的记录能够正常保存。


接下来测试一下账户系统。默认是登陆状态,我们点击右上角的登出,就进入到了登陆界面。


点击登陆,可以看到它是具备账号系统的,powered by Manus。这个系统应该是直接使用了Manus内置的系统,功能非常完善。


测试一下是否可以用其他账号登陆。我们用一个新的邮箱注册,邮箱顺利收到了验证码,并且成功注册登陆。


登录后,看到的是一个全新的桌面。我在里面进行了几次操作,然后登出,再用第一个账号登录回来,之前的所有历史记录都保存了,两个账户的数据是隔离开的。

应用测试和功能测试都通过了验收,下一步可以选择发布这个网页版的复古版的Mac OS,也可以继续对项目进行修改,Manus还提供了一些推荐追问。这里我们选择发布。


Manus为这个项目生成了一个网页链接,有兴趣的同学可以点击体验:https://retromacos-cnt7elud.Manus.space

1

开始接近“靠谱”的Agent

这次Manus1.5的发布中,官方宣传的一个点是“无限上下文”,这里的无限不是物理上的无限token窗口,而是指通过可逆压缩、结构化摘要、依赖文件系统的快速卸载与检索以及分层动作空间等多种策略,使得Agent能够长期运行,有效管理超长的任务。

在 LangChain 与 Manus 团队的深度访谈中,团队解释了他们的“上下文工程”策略,通过可逆的“压缩”(剥离可重构信息,只保留路径)和不可逆的“摘要”(用结构化模式提取关键信息),再配合上下文卸载到文件系统,让 Agent 可以长期运行而不会因为上下文过长导致“上下文腐败”。这也解释了为什么我这次测试的 macOS 复刻能够流畅完成几十个步骤。


Manus创始人肖弘提到,他们选择的是先构建强大的通用内核,让各种场景自然涌现的路径,“Manus 首先是一个 Agent architecture,然后才是一个产品”。对于一家创业公司来说,不做基础模型,而是把精力放在工程、架构和产品打磨上,做出顶尖的 Web 开发能力,这本身就证明了在 AI 时代,创业公司依然可以通过工程创新找到位置。

最后,坦白说,现阶段的大多数“一句话生成”类 AI Agent产品,对大部分用户来说更多还是做玩具、做Demo的阶段。至少从这次体验来看,Manus 1.5 算是把“玩具”这件事做的更进一步了,整一句Prompt,产出的完成度让人惊艳。当然它也不完美,比如一直被吐槽的积分消耗快这些槽点都存在,以及我们这次没有加入更复杂的测试。但关键在于方向,如果 AI Agent 能从偶尔能用进化到基本靠谱,那距离它真正改变我们的工作方式就不远了。


点个爱心,再走 吧

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

谁说每年都要穿新衣服?准备一些基础款,百搭耐看又不过时

静儿时尚达人 浏览 31

埃安 UT super 国民好车下线,广汽、京东、宁德时代联合打造

IT之家 浏览 493

加法院禁止一名中国学生入境 声称其或从事"间谍活动"

环球时报国际 浏览 3404

卡里克向拉爵承诺带曼联重返欧战!赢曼城秘诀曝光,弗爵为之鼓掌

罗米的曼联博客 浏览 312

羽绒服+阔腿裤:今年冬天最火搭配,松弛又时髦!

LinkFashion 浏览 316

市场震荡下均衡配置成“关键手”,资金为何青睐中证500指数?

时代周报 浏览 476

俄反对派人士狱中放风后失去知觉身亡 拜登发表讲话

红星新闻 浏览 3636

科创板主题基金规模突破三千亿元 “上新”的指数如何参与创新和成长?

金证研 浏览 470

剑桥大学团队揭秘:如何让计算机像管家一样聪明地分配工作

科技行者 浏览 282

终于来了!山东签约新大外弥补内线隐患,但陈培东感冒将缺席一场

篮球资讯达人 浏览 308

中国色特别策划 | 故宫技艺与古意新生

时尚COSMO 浏览 459

李嘉格点赞祝车澈越来越好,和男友冰岛过生日

眼底星碎 浏览 277

50+女性秋冬穿搭指南,4个让年龄法则成为加分项,越穿越优雅

静儿时尚达人 浏览 254

图片报:皇萨塔、曼联、拜仁、药厂、多特等球队关注艾希霍恩

懂球帝 浏览 148

U23亚洲杯狂欢夜:日本5-0造惨案 韩国平伊朗 中国队首轮战伊拉克

侃球熊弟 浏览 328

演员任敏生理期南极跳海,回船喝酒

失宠的小野猪 浏览 362

俄国防部发布视频 称摧毁乌军部署在顿涅茨克防空系统

环球网资讯 浏览 3476

女星陈匡怡怒斥台媒毁人名节,自曝写了遗书,拒绝富商追求遭抹黑

萌神木木 浏览 359

短上衣配半身裙,这才是中年女人适合的打扮,夏天穿优雅大气

静儿时尚达人 浏览 3179

靠老婆出圈,成名后过河拆桥,这4位实在绝情!

丹妮观 浏览 457

沙特大幅下调旗舰原油溢价至五年低点,全球供应过剩压力显现

华尔街见闻官方 浏览 417
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2024,版权所有 xingchentong.com
沪ICP备20017958号-8