觉得可以再来聊聊Manus了。AG真人游戏第一品牌3天后我
在23年的时候▼▷☆,人类一般能达到90%的成功率-◆▪●,而那时候的最强AI GPT4▽•-■,在第一级才勉 强达到15%●▽•…=。
而跟Manus同日推出的QwQ 32B••,在Agent能力上也有大幅度的飞跃▼◁•◆,如果未来的底座是基于QwQ 32B的微调=★,我想Manus的产品的完整度应该会更上一层楼★•-。
传统的测试一般都是数学(AIME)或者一些专业知识问答▲-•□、编程等等■▷,但是GAIA测试•-=…,里面很多都是概念简单▷=,但是需要多步骤解决的实际问题=▷。
相比之下○◆▷☆▷,Manus的做法则是工程化●○,用各种不同的模型和技术来做整合■□▷,这个就是Multi-Agent(多智能体架构)□■。
至于最后记忆◇▲☆,其实没啥突破○=,只不过同样的…◇=▽,Manus做了一个小创新○•…●△▽,用To△•=■…◇.md这种外置文件来实现=▪“工作记忆△★”=-○。
□○●▷“Manus有点像当年的理想one▽○■▲•●,用一种技术上来看略显蹩脚的手段◁□◇▷,证明了一个庞大用户需求市场的存在••-◇▲。
我想◇□,作为一个AI媒体▷☆=•,如果只有等到海外爆了才愿意去写▽=••,才觉得这个产品不错值得推荐给大家-◆•●★-,那我觉得这样不对○-★◇。
Computer Use什么时候出来的▽★•◇=○?2024年10月23日的那一天…▪-,我也花了6个小时做了实测=▲=,有兴趣的可以去看看…◁▲。
每个API都要单独开发★…◆。还记得我23年在做金融Agent产品的时候☆▼△○•,•◆▪■▷=”我非常看好Agent的发展☆◁-●•,Agent的未来--☆▽,钻出了一个巨大的孔•◆▷,我只是客观的陈述事实▪•▽△▼,从12点测到4点●=▲★▷…。我就夸了很多◇▪=…☆!
MCP 很像这样的智能家居标准○△○。当新的工具或数据源符合MCP时•▽=▽△,AI模型就能立刻把它接入自己的系统•▪,调用他们就像查个USB一样简单☆★☆-。
有点像 MCP 提供了统一接口□•▽-,开发者只需按一套标准为AI接入各种功能AG真人游戏第一品牌▷◆◇☆■…,免去了针对每个服务单独编程的麻烦 ……○==。
甚至很多人嘲讽◆▼□▽△▪,国外的论坛和自媒体还没动静□•-▽,只有国内AI自媒体吹■▲▷,所以一定都是收钱的营销号★△▽○▼▽。
而这一次□○■★-,Manus整合了市面上所有的工具能力▪▽, 有了Computer Use•○…▽●…、Code Interpreter●◇■○▷、Artifacts等等的能力◁◆, 并且允许在虚拟机中进行异步调用●○◁▪●◇,这是一个非常棒的交互和产品的创新□▼。
以上△--▷▼▪,既然看到这里了○▽▽,如果觉得不错☆▪▷觉得可以再来聊聊Manus了,随手点个赞◇=☆=、在看○▽▷、转发三连吧•★☆-▽,如果想第一时间收到推送○◁,也可以给我个星标⭐~谢谢你看我的文章□…▪▼,我们■-▪,下次再见▼-•▲。
至于Manus和3小时开源复刻的OpenManus◆…○▼•■,可以去看看△▲◁◁…,你可以不信我=□☆=◁,但是你可以相信晚点▲▲☆。
开源社区能刷爆GAIA■★▪。让人们看到了后面应用广阔无垠的天地•○▲■=●。也相信可能未来有一天=★◁☆,只不过DeepResearch是一个重新训练的模型■▼,在AI能用到好用的这层厚墙上•▼…☆◇◁,智谱的AutoGLM出来的时候△■□,而Manus是基于大模型所做出来的通用Agent产品▲△-◇=▷。是星辰大海…▪□,所有一切Agent操作都是由一个由o3重新训练的端到端模型完成的◇■▽▷=!
这两天有N多追随M anus 的开源复刻项目-▲=,不正是因为Manus指出了一条明路吗●◇•△◁□?原来工程化的能力◆▪■▪,可以做到这种级别○▷△◁•。
然后▪△☆-△,3月9号晚上•◇▷,Twitter的创始人 杰克·多尔西也转发了•▪▪▷●,他也是被收买了○◇▷•●?
就像理想定义了无续航焦虑+冰箱彩电大沙发的家庭汽车◇□,Manus也奠定了未来3年内ai应用的产品方向-○○。•▲▲”
这就像我们现在给手机充电▽▲▷,只需要一根Type-C数据线★▼◇◆▪★,就能连接所有设备●●△=,不用再跟很多年前一样◁◇▪■◇,准备一堆不同的数据线•▲☆=▲▼。AG真人游戏第一品牌3天后我。
过去很多我们做产品…★☆☆★,他给做Agent产品的人■▼◁□,M anus 横空出世●▪○,我不是拉踩△-•□◁◇,而不是每一步用不同的模型来完成●•。开了个腾讯会议●=□▼◆◁,都指出了方向•☆▷。从4点写到凌晨6点☆△◇-。
把我的PDF论文转说人话的科普PPT任务★•,拆成了4个大任务□▲◇☆▽,15个小任务★▪。
整个Agent产品其实最核心的就是这个底层模型的规划能力=▷△▼□,所以这个东西是能提高Agent产品在后续任务中的成功度的★◆•▪▼。
想通过GAIA的测试△◁▪,一般需要网络检索能力▲○■○、工具调用能力AG真人游戏第一品牌★○▪-…○、编程能力-•☆•、文件处理能力等等▪△。
我只能说我的理解▲◇▽▷△■,当然如果有不对的地方◆=◆◇,欢迎大佬来拍砖△-•△▲◇,我也尽可能▲▼☆△●,做一些小的科普□•○▷▲◁。
当然-▷◆□,你也可以说它外面就是一层壳•-,可在产品开发和用户体验里=●=▪◇,这层壳也是很有价值的◇★●▪▪◁。
都说没有护城河■◁☆•■,坦率的讲▪▽■=▽◆,确实工程化技术上没啥护城河□•,但是之前为什么大家就不做呢-◁-☆△?
3天前的那天晚上●▽…•☆,○-▲•▲“Manus这个所谓的超级缝合怪▼…●▲=,邀请了一堆朋友来看我的测试■▼,
在简单的Lv▽◇…••.1级别的测试上△◁,这么多复刻版的产品确实可以打到差不多的程度…▲…▪▪,但是在复杂多步骤任务的Lv▷◁△.2和Lv☆◇•▲□△.3的能力上△△,明显还是有巨大的差距●▪…□•。
还有说M anus 配合加密货币炒作割韭菜的•◁,都被X官方直接封号了▲△◁◁□▽,那现在X官方道歉并把M anus 的官方账号恢复了•…,是不是X官方也收钱了◁▲☆□?
目前开源复刻M anus 的效果最好的项目-★○•…,是来自CAMEL-AI的OWL…○•=。
首先◁★,就目前的技术来说□■▪-=-,Agent产品几乎都是遵循▲•○◇▪:☆□▪◇△“计划 → 执行 → 结果合成▷▷”这一套★○▪★○…。即使是OpenAI最牛逼的DeepResearch也是如此-=▲。
注意▷▪,这里我之所以做这个对比•★,并不是拉踩☆=…▲, CAMEL-AI团队在短短几天内▪-,就能复刻到如此地步••…▽,实力非常强▷▷★线键触屏可视化编程自定义驱动多少钱-聚超值AG真人游戏黑爵A。
都是Function Call做函数调用△△,我也相信…▷■▼=•,我相信开源社区的力量△=,我在第一时间拿到邀请码后•-•★,我想说的是▪★▲◁=△:M anus 的路是正确的•★▼▷★,
这里我再叠个甲-▷=△…,DeepSeek是智能层面的大模型○△=,有多恶心●☆•。
但是◆△◇,如果没有一个统一协议◆◆▪●,每一个品牌的灯泡◁◁■◇□•、空调可能都要用自己的App▷■▽▽,各自的遥控方式▪▽△…-,我相信你肯定会很抓狂★▽◁▪。
但幸运的是◁◇▷▽☆,现在 很多智能家居设备有通用的标准○●◆☆△▲,只要设备遵循这个标准☆●▲•,我们的一些智能音箱就能识别并控制它们▽=•。
而这个任务拆解模型▼=▪▪,大概率是跟Manus联创季逸超在去年10月开源的一个用强化学习+Qwen 32B做的推理模型有关…•○…-▷。