Manus,為何是他們做出來了?

0 評論 2535 瀏覽 0 收藏 11 分鐘

本文將深入探討Manus背后的故事:從AI瀏覽器的探索到云端代理的轉(zhuǎn)變,從團(tuán)隊的默契合作到產(chǎn)品的驚艷表現(xiàn),以及它所面臨的機(jī)遇與挑戰(zhàn)。Manus的成功,或許正是AI行業(yè)未來發(fā)展的縮影。

故事從去年10月26日說起,在那天,黃叔非常喜歡的Arc瀏覽器被創(chuàng)始人Josh Miller決定戰(zhàn)略性放棄,開始開發(fā)新的AI Agent瀏覽器Dia: 

同一天,HideCloud和Peak剛從武漢飛回北京,落地后,HideCloud震驚的發(fā)現(xiàn),打開手機(jī)刷的第一條推特就是上面這條,因為,此前的兩天,他們在武漢決定了終止AI瀏覽器的研發(fā)工作,莫名其妙的中美兩只團(tuán)隊在同一刻達(dá)成了共識?!?/p>

為何放棄AI瀏覽器? 

其實去年做AI瀏覽器還是挺容易理解的決定,Arc也是2023年P(guān)roduct Hunt年度產(chǎn)品的第二名(第一是GPT4): 

但是在實踐中,團(tuán)隊發(fā)現(xiàn)個AI瀏覽器有一些問題,首先是瀏覽器是給單用戶用的,那一旦AI要開始干活,咱們就只能眼睜睜的看著它,變成AI要和我們搶瀏覽器用了,這肯定不對?!?/p>

對的應(yīng)該是:AI需要用瀏覽器,但不是在瀏覽器里面用,AI Should use browser,not in browser,那在哪用呢?在云端用!The browser should be in cloud?!?/p>

所以我們現(xiàn)在看Manus,會發(fā)現(xiàn)右側(cè)AI在自己操控瀏覽器: 

在做AI瀏覽器的過程中,團(tuán)隊主營業(yè)務(wù)自己也基于很多場景做Post-training,在這個過程中發(fā)現(xiàn)基座模型越來越強(qiáng)大,其中有一個非常重要的信號: 

“Less structure,more intelligence” 

這句話很重要,對內(nèi)構(gòu)成了整個團(tuán)隊的凝聚力,讓Manus團(tuán)隊頂過了過去的三個月,最終把它做了出來,也是Manus和其他產(chǎn)品不一樣的關(guān)鍵: 

Manus盡量減少人工對模型的控制,只需要做好鋪墊,讓AI自己發(fā)揮,反過來讓AI教我們做人?!?/p>

(這句話在Manus官網(wǎng)的底部) 

這樣,只需要基礎(chǔ)模型能力提升,數(shù)據(jù)增加,很多能力會自然演化出來,不需要通過workflow的方式強(qiáng)行教會AI。 

這個非常反常識,也確實因為這樣,初期很多投資人看完演示后會問:你們團(tuán)隊有多少人做workflow? 

Manus的團(tuán)隊會說:沒人,是模型自己做的!結(jié)果投資人都不相信?!?/p>

但這是Manus的底層信仰!也是AI Agent Manus誕生的契機(jī)! 

在這個信仰之上,做好Manus,需要給它三個東西: 

第一:Give it a computer 

就像招一個員工,入職就得給他配電腦,不然他沒法辦公呀!電腦有了,權(quán)限也給配上! 

第二:Give it data access 

有了電腦,還要讓他能上網(wǎng),能看公司的知識庫,于是給接入了大量的私有API,這樣才能獲得權(quán)威的結(jié)構(gòu)化的數(shù)據(jù),后面才能處理?!?/p>

第三:Give it some training 

再做一個入職培訓(xùn),包括有個mentor帶著(對Manus來說就是我們用戶啦),時不時給它反饋! 

這樣,Manus就可以開始干活了,隨著在我們手下打工,還能持續(xù)進(jìn)化! 

簡單說完上面的故事后,為何Manus是這個團(tuán)隊率先做出來了?這就是天時地利人和了。 

天時:前面說了,整個公司在做產(chǎn)品過程中,發(fā)現(xiàn)了一個很關(guān)鍵的非共識:“Less structure,more intelligence”,這里很重要的是:模型的intelligence開始進(jìn)化到了可以做Agent的階段! 

這是技術(shù)成熟度,開始和市場需求可以進(jìn)行契合的時間點(diǎn)! 

地利:此前正好做AI瀏覽器,很多前置探索都已經(jīng)積累下來了,包括整個初創(chuàng)公司很扁平,決策可以很快貫徹下來,資源協(xié)調(diào)非常快! 

人和:這個我感受最深刻,HideCloud和Peak兩人在分享時配合非常默契,經(jīng)常有無聲的配合,這種有共同目標(biāo),一起沖刺的團(tuán)隊真的令人羨慕! 

不光配合默契,兩人的能力也到了能駕馭這款產(chǎn)品的水準(zhǔn),1+1>2?!?/p>

誠然,現(xiàn)在的Manus還是個preview的版本,確實不建議對它抱有過于樂觀的預(yù)期,Manus團(tuán)隊也坦言有很多工作可以優(yōu)化,但每一次Manus還是會驚艷到大家。 

黃叔的測試?yán)?,看到它確實會用多模態(tài)看完視頻,基于畫面分析后給出正確答案,海辛分享的一個案例,在找一個轉(zhuǎn)繪的教程的時候,Manus看著看著網(wǎng)頁就點(diǎn)了舉報?!?/p>

對于深度搜索,可以直接生成帶交互的網(wǎng)頁,讓人印象深刻: 

也會發(fā)現(xiàn)不少失敗的案例,比如下面這個Manus提示需要登錄Youtube,但我接管后操作被Youtube提示需要換瀏覽器,我和Manus說過后,它無法實現(xiàn)這個操作,最后用觀看視頻的描述文字做總結(jié),變通的完成了任務(wù)?!?/p>

也有讓生成文字游戲無法實現(xiàn)預(yù)期目標(biāo),多次修復(fù)陷入死循環(huán)的case: 

回到Manus發(fā)布的當(dāng)晚,黃叔陷入了一種虛無的情緒:如果Manus真的這么牛,那AI編程還有價值么?現(xiàn)場我問了Peak,他很肯定的告訴我,價值很大! 

再到今天,這件事情也很清晰了,在底模能力沒有顯著突破的前提下,Agent類產(chǎn)品可以達(dá)到的邊界,還是可以預(yù)期的,Manus離真正的通用Agent還有距離,但依然很驚艷! 

2025年,很值得期待。 

說幾個花絮,今天黃叔受邀到北京線下參加了人數(shù)極少的交流會,原定10點(diǎn)半開始的活動,我9點(diǎn)半就到了,于是我提前見了兩位核心成員:HideCloud和Peak 

HideCloud說,昨晚3點(diǎn)半才回酒店,回去的時候手機(jī)電量說80%,早上起來手機(jī)被震動到?jīng)]電。。?!?/p>

我問Peak產(chǎn)品發(fā)布后興奮不?他說比起興奮,現(xiàn)在更多是疲憊。確實最近太辛苦了! 

現(xiàn)場是在一個類似于K歌房的多功能會議室里進(jìn)行的,確實非常的小,最后總共到場的就幾個人,都是Manus團(tuán)隊的朋友,黃叔在受邀之列也是與有榮焉: 

開場時,兩位引領(lǐng)了25年Agent創(chuàng)新的精神小伙,擺出了姿態(tài):和老朋友們聊聊?!?/p>

最后回應(yīng)一下爭議:沒有給媒體費(fèi),都是朋友,是自來水?!?/p>

本文由人人都是產(chǎn)品經(jīng)理作者【Super黃】,微信公眾號:【AI產(chǎn)品黃叔】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!