Manus真的是AGI曙光嗎?
近日,一家創(chuàng)業(yè)公司推出了他們的AGI產(chǎn)品——Manus。這款產(chǎn)品具備多種調(diào)用工具的能力,從生成PPT到安排面試,再到開發(fā)小游戲,無所不能。在鋪天蓋地的自媒體宣傳下,Manus似乎成了AI新時(shí)代的曙光。本文將冷靜分析Manus的進(jìn)步與局限,探討它是否真的能改變世界。
GPT3.5在轟動(dòng)世界之初,奧特曼就指出他們的目標(biāo)是通用人工智能,即改變世界的AI力量;24年初OpenAI內(nèi)部的一系列人員動(dòng)蕩,被外界小道消息解讀為GPT迎來了AGI,內(nèi)部爭(zhēng)斗是因?yàn)锳I到了影響人類安全的地步,一度引起業(yè)內(nèi)緊張和躁動(dòng);而隨著事件的平息,AGI又逐步褪去了聚光燈;
2025年3月6日凌晨,武漢(北京亦有分部)一家創(chuàng)業(yè)公司發(fā)布視頻介紹,推出了他們內(nèi)部打磨許久的AGI產(chǎn)品”Manus“,從介紹視頻中能看到,Manus具備調(diào)用工具的能力,可以生成PPT、做面試安排、開發(fā)小游戲、生成旅行規(guī)劃等等,相比我們用習(xí)慣了的對(duì)話產(chǎn)品,讓人眼前一亮;
借助鋪天蓋地的自媒體信息,Manus被推上神壇,冠以”有一次改變國(guó)運(yùn)“的稱號(hào)??吹組anus介紹的第一個(gè),我想到了Copilot,而過去1年多,我所在團(tuán)隊(duì)也一直在深入探索和嘗試金融終端的Copilot助手模式落地。所以,今天我們冷靜分析下,Manus,這個(gè)AGI時(shí)代的曙光。
Manus的進(jìn)步意義
絕大多數(shù)人接觸AIGC是從GPT3.5、文心一言、豆包等chat對(duì)話類產(chǎn)品開始,他們把AI想象成一個(gè)類人,能傾聽和理解,并給出回復(fù)。隨著抖音AI特效的推廣,又逐漸有人接觸活照片(DID)、文生圖/視頻(text2img、img2vid)等AIGC應(yīng)用。對(duì)于分從業(yè)人員來說,可能很多人難以把大模型與AI應(yīng)用區(qū)別看。
雖然,越來越多的AI對(duì)話產(chǎn)品,如文心一言、豆包等,都集成了文生圖、PPT生成、音樂生成等技能,但操作流程不便(需要手動(dòng)切換并選中相關(guān)技能),導(dǎo)致使用者少,未充分發(fā)揮AI的效用;在Manus介紹視頻推出的瞬間,大家被AI編排工具、調(diào)用工具和整合產(chǎn)出結(jié)果的能力所震撼,似乎看到了AI規(guī)劃、執(zhí)行和落地的想象空間。絕大多數(shù)人被這種臆想的未來所鼓舞,加之無法親身驗(yàn)證,才有了如此轟動(dòng)的效果。
總結(jié)一下,Manus在Agent規(guī)劃上邁出了一步,將大眾對(duì)于AI的”聊天“這一產(chǎn)品形態(tài)認(rèn)知,推向了更廣闊的”應(yīng)用“這一領(lǐng)域,大模型從 “通用對(duì)話” 邁向 “解決實(shí)際問題”,勢(shì)必加快AIGC在各垂直領(lǐng)域的落地;
Manus的核心價(jià)值
ChatGPT在推出時(shí),曾轟轟烈烈推廣過AppStore計(jì)劃,開放API生態(tài),廣泛接入X(Twitter)等各大應(yīng)用,借助chat形態(tài),調(diào)用相關(guān)APP實(shí)現(xiàn)發(fā)文、定外賣等操作,實(shí)現(xiàn)AI助理的雛形;
然而,GPT的Plugin有頭無尾(私以為技術(shù)驅(qū)動(dòng)型公司,缺乏運(yùn)營(yíng)和商業(yè)策略),偉大構(gòu)想未能有效落地。自23年開始,Microsoft、Apple、Honor、Vivo、HUAWEI等一眾擁有應(yīng)用生態(tài)的廠商,加碼手機(jī)AI助手的研發(fā),這些都是基于Agent模式,與Manus的產(chǎn)品規(guī)劃無異。
如果一定有差異,那就是Manus缺乏可調(diào)用的工具(手機(jī)和PC生態(tài)廠商是贏家),從演示視頻和官方介紹中能看出,Manus接觸前沿模型實(shí)現(xiàn)Agent規(guī)劃能力,借助工程鏈路調(diào)用搜索、瀏覽器訪問、現(xiàn)有的AIGC工具,完成用戶任務(wù)。根據(jù)我團(tuán)隊(duì)過去一年多的經(jīng)驗(yàn),我們70%的精力在工具建設(shè)、30%的精力在Agent模型訓(xùn)練。并且隨著工具集的不斷擴(kuò)大,對(duì)Agent模型的挑戰(zhàn)也迅速上升(AI需要不斷認(rèn)識(shí)和理解新工具)。
從一定程度上來說,工具集(FunctionCall)越小,Agent準(zhǔn)確率越高,技術(shù)難度越??;Manus如若定位通用助手,勢(shì)必不斷豐富工具集,提升Agent的規(guī)劃和調(diào)用能力,從而實(shí)現(xiàn)任務(wù)解決;
AGI面臨的困難
前面介紹了我對(duì)Manus的理解,作為Copilot的一部分,Manus脫離了工具界面,小小地實(shí)現(xiàn)了用戶問題解決,但其背后的Agent能力還有待前身驗(yàn)證。
AGI作為圣杯,目前仍有不小的差距。從跨領(lǐng)域能力、自主推理和決策、持續(xù)學(xué)習(xí)這3大特點(diǎn)來看,跨領(lǐng)域能力依賴Agent規(guī)劃和工具集建設(shè),自主推理和決策在deepseek模式上已看到曙光,持續(xù)學(xué)習(xí)可能是最重要,也是最難的一步。可能依賴模型架構(gòu),也可能從量變到質(zhì)變導(dǎo)致完全的不可控,繼而引發(fā)倫理災(zāi)難。
我們可以大膽暢享,未來的AGI一定不是單一超大模型可以實(shí)現(xiàn)和解決的,必定由一個(gè)超級(jí)Agent,輔以海量工具及其對(duì)應(yīng)模型組成,形成一個(gè)覆蓋生活工作方方面面的完備生態(tài)系統(tǒng)。換個(gè)角度,Apple手機(jī)的成果離不開千千萬萬的iOS應(yīng)用開發(fā)者。
以上內(nèi)容限于2025.3.8前的個(gè)人知識(shí)和經(jīng)驗(yàn),如有不足接受批評(píng),歡迎探討,謝謝!
本文由 @Ma.x 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評(píng)論,等你發(fā)揮!