Manus 炸醒 AI 圈,這是我關(guān)于 AI 落地的 3 條預(yù)判

1 評論 4379 瀏覽 9 收藏 15 分鐘

Manus的出現(xiàn)如同一顆炸彈,瞬間炸醒了整個(gè)AI圈。這款能夠自主操控電腦、拆解任務(wù)并自動(dòng)執(zhí)行的Agent,不僅展示了AI在實(shí)際落地和應(yīng)用場景拓展方面的巨大潛力,也引發(fā)了關(guān)于AI未來發(fā)展的諸多思考。本文從Manus的技術(shù)特點(diǎn)出發(fā),深入分析了其背后的工作邏輯,并對未來AI落地的趨勢做出了三個(gè)重要預(yù)判,供大家參考。

Manus 一夜刷屏,我的朋友圈都在瘋傳這款能自主操控電腦的 Agent。它不僅能夠幫助用戶回答問題,甚至可以根據(jù)用戶的問題,來拆解任務(wù),制定解決問題的規(guī)劃,并自動(dòng)執(zhí)行。

Manus 不算是在基座大模型上的技術(shù)突破,而是在 AI 實(shí)際落地、增加應(yīng)用場景和適用人群方面的創(chuàng)造。

業(yè)內(nèi)普遍認(rèn)為,對答式的聊天機(jī)器人,最多能夠提供一些簡單的工作幫助,執(zhí)行復(fù)雜工作,最終還是需要通過搭建 AI Agent 的工作流。

但,Agent 的搭建,有門檻,不僅有技術(shù)上的門檻,更有認(rèn)知思維、結(jié)構(gòu)化能力上的門檻,并不是所有用戶,都有把工作拆解成詳細(xì) SOP 的能力。在 Manus 的邏輯下,創(chuàng)建工作流 SOP 這個(gè)最難的事情,由 AI 來完成,于是,每一個(gè)用戶,通過簡單的自然語言對答,就能獲得接近于 Agent 的產(chǎn)出結(jié)果,幾乎就是直接可用的程度。

今天全網(wǎng)刷屏的文章,主要還都是 Manus 功能的簡單介紹,熟悉我的朋友們都知道,我一貫主張不僅要分析產(chǎn)品,也要深挖產(chǎn)品背后的邏輯,以及其對應(yīng)著的趨勢。所以這篇文章,我們就基于 Manus,對 AI 產(chǎn)品和 AI 落地,進(jìn)行深度分析和預(yù)判。

Agent 進(jìn)入第三階段,生產(chǎn)力變革即將到來

Manus 的特點(diǎn)是,它能夠自主進(jìn)行工作流的拆解,然后按照拆解的順序,每一步都調(diào)用最合適的大模型,進(jìn)行任務(wù)處理。

就好像一個(gè)非常卷的 J 人同事,每一項(xiàng)工作,都提前拆出詳細(xì)的執(zhí)行計(jì)劃表,然后按照計(jì)劃表嚴(yán)格執(zhí)行,最終做出來的效果,肯定不會差。

比如讓 Manus 整理一份 OpenAI 的組織架構(gòu)圖,它不會直接去貿(mào)然干這個(gè)事兒,而是會先進(jìn)行一個(gè)任務(wù)拆解,來明確,做好這個(gè)事情,都需要哪些具體的細(xì)致的步驟,然后根據(jù)自己拆解的步驟,再逐項(xiàng)自動(dòng)執(zhí)行任務(wù),最終產(chǎn)出用戶“直接可用”的結(jié)果。

這個(gè)“直接可用”太重要了,如果過去真的深度使用過 AI,都知道,之前的聊天式 AI,看起來洋洋灑灑一大段回復(fù),但是實(shí)際要用,就發(fā)現(xiàn)很多地方不符合現(xiàn)實(shí),還得人工大改。

所以 Manus 的工作邏輯,其實(shí)就是 Agent,通過完成工作流的拆解,解決具體實(shí)際的問題。

Agent 中文名叫做 AI 代理或者智能體,說白了就是一個(gè)能按照工作流,執(zhí)行實(shí)際的、專業(yè)的工作的機(jī)器人,解決實(shí)際的具體問題,讓它按照適配公司業(yè)務(wù)的流程,進(jìn)行各種具體的工作,就好像一個(gè)真正的同事一樣。

如果只是在 AI 對話框中進(jìn)行簡單的對話,AI 能夠進(jìn)行的工作很有限,AI 的產(chǎn)出物也不太可控?;貧w到我們實(shí)際的工作中,任何工作都有一個(gè)流程和標(biāo)準(zhǔn)的限制,才能讓產(chǎn)出的結(jié)果,達(dá)到預(yù)定的標(biāo)準(zhǔn)。

比如「為公司業(yè)務(wù)寫一條小紅書」這項(xiàng)工作,如果讓 AI 直接進(jìn)行工作,產(chǎn)出的結(jié)果基本是不可用的,因?yàn)槊}太大了,小紅書運(yùn)營包含著多種不同的工種環(huán)節(jié),很難通過一句話,就完成一個(gè)復(fù)合度相對較高的工作。

那如果想要 AI 完成好這項(xiàng)工作,其實(shí)得給 AI 規(guī)定好工作步驟:

  • 學(xué)習(xí)公司業(yè)務(wù)的知識庫,了解公司的業(yè)務(wù)情況和過往內(nèi)容
  • 通過可聯(lián)網(wǎng)的大模型,收集與業(yè)務(wù)相關(guān)的今日熱點(diǎn)新聞
  • 通過大模型分析有哪些可以和業(yè)務(wù)結(jié)合的選題
  • AI 為選題生成文案
  • 通過大模型為文案的配圖,創(chuàng)作一個(gè)生圖的 Prompt
  • 調(diào)用文生圖的大模型,使用 Prompt,生成配圖
  • 將文案和圖片手動(dòng)發(fā)布至小紅書
  • 通過發(fā)布的筆記鏈接,抓取點(diǎn)贊收藏評論數(shù)據(jù),進(jìn)行數(shù)據(jù)分析

在每個(gè)環(huán)節(jié),AI 都只解決一個(gè)具體的問題,然后把許多個(gè) AI 的工作串起來,成為 AI 工作流。

所以,對話聊天的 AI,最多只是提供些靈感,真正要解決生產(chǎn)力的問題,就必須得靠融合了 SOP 的 AI Agent。

這也是我一貫的觀點(diǎn),協(xié)作體系是人類社會改變生產(chǎn)力的利器,AI 只有通過工作流,才能夠完美融入人類的生產(chǎn)關(guān)系中。

Manus 的出現(xiàn),意味著 Agent 的發(fā)展,實(shí)際上進(jìn)入第三階段:

在第一個(gè)階段,ChatGPT 這樣的對答式機(jī)器人,通過一問一答的方式,逐一解決問題。這個(gè)過程中,人類依然是主導(dǎo),能否把 AI 用好,取決于提問人的水平,只有思路非常清晰、結(jié)構(gòu)化能力非常強(qiáng)的提問人,才能讓 AI 解決實(shí)際問題。

第二個(gè)階段,通過“扣子”這樣的智能體平臺,搭建分步驟執(zhí)行的 Agent,這一階段也是當(dāng)前 AI 應(yīng)用層落地的主要方式。既然不是所有人都能通過 AI 問答,解決實(shí)際問題,那我們就把能解決問題的步驟,固定下來,讓 AI 每次都按照驗(yàn)證過的步驟逐一執(zhí)行,并且集成多種不同能力的 AI,讓 AI 只在自己最擅長的環(huán)節(jié)做事,這樣一來,只要有一個(gè)人成功,那么其他人不需要結(jié)構(gòu)化能力,也能夠達(dá)到同樣的效果。

第三個(gè)階段,在今天早上看到了黎明,就是以 Manus 為代表的通用 Agent。拆解工作流這個(gè)環(huán)節(jié),也讓 AI 替代,用戶又回到了簡單的問答模式。但問題簡單,AI 執(zhí)行的過程并不簡單,通用 Agent 能夠按照工作流的方式,高質(zhì)量完成問題,讓產(chǎn)出結(jié)果,達(dá)到可用狀態(tài)。

如果說過去 AI 大模型的火爆,大多數(shù)人只能湊個(gè)熱鬧的話,毫無疑問,通用 Agent 是讓所有普通人,也能夠在具體工作中,用上易用的 AI,解決真實(shí)世界的實(shí)際問題。只有解決實(shí)際問題,AI 對于生產(chǎn)力和生產(chǎn)關(guān)系的變革,才會真正來臨。

分發(fā) AI 的 AI,將成為 AGI 的入口

在 Manus 開發(fā)團(tuán)隊(duì)的介紹中,Manus 被稱為“多智能體系統(tǒng)”。

什么是“多智能體系統(tǒng)”?其實(shí)就是一個(gè)系統(tǒng)里面,集成了多個(gè)大模型,然后由一個(gè)調(diào)度中心,根據(jù)不同的任務(wù),調(diào)用最合適的大模型。

幾家頭部大模型公司,都在不斷推出更強(qiáng)的 AI 大模型,前一天某個(gè)大模型剛剛登頂?shù)谝?,轉(zhuǎn)天就被下一個(gè)大模型超越,城頭變幻大王旗,你方唱罷我登場。

但是,單純的堆參數(shù)和跑分,其實(shí)與真實(shí)使用,還是有很大的差距。實(shí)際上,每一家的大模型,都有自己所擅長的領(lǐng)域,比如 Claude 極為擅長編碼、DeepSeek 的推理模型對于中文的控制很強(qiáng)、豆包大模型對于語音識別獨(dú)步世界、可靈的視頻模型非常領(lǐng)先。

既然短期之內(nèi),很難有樣樣都強(qiáng)的“水桶模型”,那何不根據(jù)任務(wù)的實(shí)際情況,讓大模型協(xié)作起來,讓他們只做自己擅長的工作?這便是“多智能體”思路的來源。

事實(shí)上,在之前的探索和嘗試中,就有過這樣的先例。

前不久,Berkeley 伯克利搞了只有 7B 參數(shù)的小模型,在 Arena 全球模型排行中拿到了 1400 分,這個(gè)分?jǐn)?shù),用了 20 萬張顯卡訓(xùn)練的 Gork3,就也才剛達(dá)到這個(gè)水平。

這個(gè) 7B 的小模型,其實(shí)就是一個(gè)分類器,它只做一件事,就是把用戶發(fā)給他的提問,進(jìn)行分類篩選,然后去指揮 GPT、Gemini、DeepSeek 這些”大模型”干活,堪稱 AI 屆的牛馬領(lǐng)導(dǎo)。

這其實(shí)也是 Manus 的邏輯,通過一個(gè)超強(qiáng)的分類系統(tǒng),集合擅長不同領(lǐng)域的大模型,一起處理,最大限度解決用戶的實(shí)際問題。

AGI 的未來,一定不是單一模型一統(tǒng)天下,而是做好分工,融匯貫通。本質(zhì)上,現(xiàn)代公司的組織結(jié)構(gòu),就是在構(gòu)建如同機(jī)器一般的協(xié)作結(jié)構(gòu),指望一個(gè) AI 來完成所有工作,無異于指望一個(gè)員工就撐起整個(gè)公司。

在這場變革中,中國將站在世界中心

這不是營銷號那種無腦亂吹,而是邏輯推理后的判斷。

邏輯是兩個(gè):

1.中國有無窮多的應(yīng)用場景和商業(yè)模式的積累,首先,AI 只有落地應(yīng)用才有真正的價(jià)值,其次,最開始的 AI 可能誕生于實(shí)驗(yàn)室,但只有真實(shí)實(shí)踐中,才能創(chuàng)造越來越強(qiáng)的 AI。

2.幾十年辛苦播種,今朝終于開花結(jié)果。國民基礎(chǔ)教育,縱觀歷史幾千年,從未有過現(xiàn)在的高度和深度。而 AI 的根本,依然是人才,經(jīng)過幾十年的基礎(chǔ)教育,中國的人才密度,已經(jīng)超越世界上大多數(shù)國家,完全能和美國掰一掰手腕。

很多事情,都是量變引發(fā)質(zhì)變的結(jié)果。

2022 年底,ChatGPT 橫空出世,驚爆世界。同時(shí),這也意味著,AI 技術(shù)的大模型路線,完全替代了過去規(guī)則算法和知識圖譜的 AI 路線。

中國嘩然,大洋彼岸的美國,在 AI 軍備競賽上,居然領(lǐng)先這么多。當(dāng)時(shí),大多數(shù)人對于中國的 AI 發(fā)展持悲觀態(tài)度,算力顯卡、技術(shù)封鎖,中國 AI 技術(shù)的前途,確實(shí)陰晴不定。

但站在 2025 年早春,這種陰霾已經(jīng)一掃而光,中國 AI 的發(fā)展全球矚目,代表基座大模型能力的 DeepSeek 讓世界側(cè)目,如今,在應(yīng)用層大放光芒的 Manus,同樣來源于中國。

Manus 背后的創(chuàng)始人肖弘,是華中科技大學(xué) 2015 屆畢業(yè)生,在之前創(chuàng)業(yè)做過「壹伴助手」和「微伴助手」。

這個(gè)團(tuán)隊(duì)還有一款更知名的產(chǎn)品,就是去年火爆全網(wǎng)的 AI 助手 Monica。這是一款瀏覽器插件起家的 AI 應(yīng)用,通過非常敏銳的需求洞察,讓用戶在瀏覽器中,使用 GPT 4o、DeepSeek R1、Claude 3.7 等模型,進(jìn)行一些非常具體的工作。

有人說這是套殼 AI,可 Monica 的理念,就是將 AI 前沿技術(shù),找到應(yīng)用層的落地方式,實(shí)現(xiàn) AI 的真正落地。極致的套殼,同樣也是牛??!在這樣的理念下,這支團(tuán)隊(duì),又搓出了 Manus。

我們很欣喜地看到,Manus 的出現(xiàn),是讓普通人也用好 AI 的又一個(gè)大進(jìn)步。

我下午看到,有不少人對于 Manus 的指責(zé),指責(zé) Manus 在宣傳和推廣方面的積極,認(rèn)為 Manus 所謂的超強(qiáng)能力,是在營銷,想要成為下一個(gè) DeepSeek。

但事實(shí)上,Manus 和 DeepSeek 本身就是兩個(gè)不同的產(chǎn)品,一個(gè)專注于更好的落地應(yīng)用,一個(gè)專注于基礎(chǔ)模型的技術(shù)突破,這都很有價(jià)值。我想起在我在幾年前寫過的一句話:

科學(xué)普及與科技創(chuàng)新同等重要?!?/strong>

這只是一個(gè)理念,只是一個(gè)起點(diǎn),保持謙遜,多往前看。

作者:亨哼;公眾號:產(chǎn)品變量(ID:hengpaper)

本文由 @亨哼 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖由作者提供

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 跑出來的代碼怎么本地保存?

    來自廣東 回復(fù)