邀請碼炒到10萬?OpenManus深夜開源打臉!Manus X賬號遭凍結,平替光速上線

0 評論 536 瀏覽 2 收藏 16 分鐘

離了個大譜,Manus全網邀請碼一票難求?激動人心的是,開源界凌晨來了一場核爆攻擊,用3小時代碼量開源了平替項目——OpenManus,免費體驗不要邀請碼!同時發(fā)布的還有另一個「Manus同款」OWL,直接干到GAIA基準測試開源最強!

昨天,所有人都被Manus刷屏了,一個邀請碼已經被炒到了天價。

雖然被Manus強勢刷屏,很多人卻只能眼睜睜地看著,沒法親自上手體驗,只因一碼難求。

最新消息,就在剛剛,Manus AI的官方X賬號已被平臺凍結。

不過就在此時,開源界以迅雷不及掩耳之勢上演了一波速度與激情——有這樣一個項目,僅憑三小時的代碼量,就掀翻了AI的高墻。

昨天晚上,GitHub開源了一個無需邀請碼的OpenManus項目,剛剛開源不到一天,Star數(shù)就已經破千。

項目地址:https://github.com/mannaandpoem/OpenManus

現(xiàn)在,所有開發(fā)者都可以實測了。

其中最亮眼的,莫過于這句「只需修改config.toml即可開玩」,直接對封閉生態(tài)公開打臉。

創(chuàng)建環(huán)境,克隆項目并CD到目錄,改一下config/config.toml里的大模型信息,再輸入一行命令,就可以愉快地在terminal里體驗了。

conda create -n open_manus python=3.12conda activate open_manus
git clone https://github.com/mannaandpoem/OpenManus.gitcd OpenManus
pip install -r requirements.txt
cp config/config.example.toml config/config.toml
# Global LLM configuration[llm]model = "gpt-4o"base_url = "https://api.openai.com/v1"api_key = "sk-..."  # Replace with your actual API keymax_tokens = 4096temperature = 0.0
# Optional configuration for specific LLM models[llm.vision]model = "gpt-4o"base_url = "https://api.openai.com/v1"api_key = "sk-..."  # Replace with your actual API key
python main.py

開源界3小時復刻Manus,跟邀請碼說再見

來自國內的這支團隊宣布:晚餐后2小時,OpenManus的核心功能直接開源!

沒有邀請碼,沒有壁壘,這支團隊用3小時的代碼量,就把邀請碼機制掃進歷史垃圾堆,跟饑餓營銷徹底說拜拜!

OpenMunus的作者均為MetaGPT的核心貢獻者。

OpenManus的實現(xiàn)很簡單,使用到了computer use、基本的智能體和規(guī)劃。

就像在Manus中那樣,任何人都可以使用OpenManus,把自己的想法變?yōu)楝F(xiàn)實。

無論在手機上還是OS上,如果想做Deep Research,只要提交你的問題,它就可以幫你實現(xiàn)了。

比如,我們可以給OpenManus這樣一個任務:「對Karpathy的網站(https://karpathy.ai/)進行全面的SEO審核,并提供詳細的優(yōu)化報告,包括可執(zhí)行的改進建議?!?/p>

OpenManus會展開思考,將自己的任務分解為如下幾步。

  1. 首先,檢查網站并收集基本信息
  2. 然后,分析關鍵的SEO要素
  3. 第三,檢查技術性SEO方面的問題
  4. 最后,整理優(yōu)化建議

明確任務細節(jié)后,OpenManus就打開Karpthy的網站,開始收集信息、展開詳細分析。

整個思考過程,每一步都清晰可見。

最終,它生成了一份完整、詳實的Karpathy個人網站優(yōu)化報告。

其中,它提出的高優(yōu)先級任務如下:Meta標簽優(yōu)化(如優(yōu)化頁面標題,使其包含相關關鍵詞)、技術設置(如創(chuàng)建并提交XML站點地圖)、內容優(yōu)化(如為所有圖片添加alt文本、在個人網站上實施Schema標記等)。

OpenManus的核心,就是一個革命性的模塊化Agent系統(tǒng),由高度智能的專業(yè)團隊,組成了一個協(xié)作網絡。

  • Manus主代理:項目經理,能理解用戶需求,協(xié)調各個專業(yè)團隊的工作。
  • PlanningAgent:戰(zhàn)略專家,將復雜的任務分解為清晰可執(zhí)行的步驟。
  • ToolCallAgent:技術專家,掌握各種強大工具的使用方法。

由此,開發(fā)者可以根據自身需要,自由組合不同的功能模塊,創(chuàng)造出自己獨有的AI助手。

OpenManus無縫集成了包括Claude 3.5、Qwen VL Plus在內的多個頂級大模型,開發(fā)者能充分利用各個模型的優(yōu)勢。

為何只用短短3小時,團隊就能打破Manus的高墻壟斷?

原因就在于,OpenManus其實源于MetaGPT的開源積累。

我們只是把瀏覽器工具鏈嫁接到過去代碼上,配合沉淀的Agent工具包,核心系統(tǒng)1小時就完成了。

OpenManus的另一強大功能,就是它的實時反饋機制。

LLM思維鏈的過程,會被可視化地呈現(xiàn)出來。無論是任務執(zhí)行進度的實時更新、思考過程日志、文件的即時通知等,都隨時可見。

此外,OpenManus還配備了一套強大的工具鏈,能處理各種復雜任務。

  • Python代碼執(zhí)行器:實時生成和執(zhí)行代碼
  • 網絡搜索工具:自動獲取和分析網絡信息
  • 瀏覽器自動化:模擬人類操作進行網頁交互
  • 文件處理系統(tǒng):自動生成和管理各類文檔

其中,這些工具都不是簡單的獨立模塊,而是被精心設計的協(xié)同系統(tǒng),在處理任務時能默契配合,高效完成任務。

實測生成一份關于Manus的報告

問題來了:OpenManus能成為Manus的平替嗎?

OpenManus的開發(fā)者HKUST(GZ)博士生Jiayi Zhang上傳了一段實測視頻。

視頻中他給出了這樣一段提示:

深度調研和Manus這個Agent有關的信息,自己整理信息,然后寫一個新聞html頁面介紹它,你寫的html應該盡可能美觀。

接著OpenManus就開始干活了。它將這個任務分步進行,首先使用GoogleSearch搜索Manus Agent的相關信息。

在這個過程中還不斷打出思考過程:「好的,讓我們繼續(xù)深入調研Manus,我會逐步訪問搜索到的重要鏈接,收集信息,然后創(chuàng)建一個精美的HTML網頁?!?/p>

它開始不斷調用工具「browser_use」,訪問不同的文章來搜集信息。

整理完信息,OpenManus再次輸出:「現(xiàn)在讓我們使用正確的完整路徑來打開HTML文件:」渲染完后,它就給出了網頁的鏈接。

打開后可以看到完整的報告。然而,OpenManus的能力還不止于此,在視頻中,它被人要求繼續(xù)完善這個頁面,添加更多具體的技術細節(jié)和實際應用案例。

接著它就又開始調用起「google_search」以及「browser_use」這些工具,很快就重新給出了一個新的頁面網址。

可以看出,OpenManus給出的這份關于Manus的報告,包括了Manus的誕生與發(fā)展、技術架構與創(chuàng)新以及實際應用案例與未來展望等。

雖然這份報告的結構看上去比較完整,但是細節(jié)還是有點乏善可陳。

Browser-use:讓智能體直接操作瀏覽器

在OpenManus項目中,很重要的一項功能就是Browser-use。

Browser-use是一種使AI智能體能夠操作瀏覽器的簡單方式。它在GitHub上開源,許多項目都使用了它的功能,目前已經獲得有超過35.8k個星星了。

項目地址:https://github.com/browser-use/browser-use

它通過提取網站的交互元素(如按鈕、表單等),使AI能夠自動化執(zhí)行瀏覽器操作,例如填寫表單、搜索信息或導航網頁。這對于開發(fā)AI驅動的網絡代理非常有用。

比如,它可以將商品添加到你的購物車,并完成結賬。

甚至是閱讀你的簡歷,然后幫你找工作!中途如果有需要,還會遵從你的指示。

作者團隊

OpenManus的作者團隊,此前就憑MetaGPT受到大量關注。

MetaGPT是一款開源的AI智能體框架,將多個AI模型整合在一起,模仿現(xiàn)實世界公司的運作,在模擬軟件開發(fā)流程方面表現(xiàn)出色。

當時一經開源,MetaGPT就火爆全網,如今在GitHub上已經收獲了49.1k stars。

向勁宇

向勁宇,研究方向為LLM智能體,強化學習和NLP,曾獲得阿里巴巴數(shù)學競賽AI賽道全球第二名。此前,他在西南交通大學獲得學士學位。

于兆洋

于兆洋,研究方向是LLM智能體及其推理,此前在中國人民大學高瓴人工智能學院獲得學士學位。

張佳釔

張佳釔,香港科技大學(廣州) 的博士生。研究興趣是LLM智能體,尤其關注其推理能力以及適應多種環(huán)境的智能體構建范式。此前,他在中國人民大學信息學院獲得學士學位。

洪思睿

洪思睿,研究興趣是LLM、NLP和多智能體系統(tǒng)。此前在暨南大學獲得學士學位,在香港科技大學獲得碩士學位。

One More Thing:0天復刻Manus,OWL完全開源

不僅如此,另一個來自CAMEL AI團隊的0天復刻Manus通用智能體,也被開源了。

這個名為OWL的項目,直接干到開源界GAIA的性能天花板,達到57.7%,超越Hugging Face提出的Open Deep Research 55.15%的表現(xiàn)。

項目地址:https://github.com/camel-ai/owl

簡單來說,OWL是一個頂尖的多智能體協(xié)作框架,致力于突破任務自動化的界限。

在GAIA基準測試中,OWL取得了58.18的平均分,并在開源框架中排名第一。

在這個任務中,OWL智能體非常絲滑地完成了任務:調研總結GitHub倉庫里都有什么。

另外,它還能自動幫我們查找今天在倫敦有什么電影。

在這個過程中,CAMEL AI對Manus的技術路線做了一波逆向工程,啟動了深度復刻計劃。

首先,是把Manus的核心工作流拆成6步。

  1. 啟動一個Ubuntu容器(Agent遠程工位就位)
  2. 知識召回(把之前學過的內容撿起來用)
  3. 連接數(shù)據源(數(shù)據庫、網盤、云存儲全覆蓋)
  4. 把數(shù)據掛載到Ubuntu(Agent的搬磚時刻)
  5. 自動生成todo.md(規(guī)劃任務+寫待辦清單)
  6. Ubuntu工具鏈+外接工具組合拳,執(zhí)行全流程任務

然后,所有Manus里智能體用到的操作,團隊都會給OWL配齊。

啟動一個Ubuntu容器,OWL就能隨時隨地遠程辦公了。

在項目描述中,團隊表達了對AI智能體的愿景:

我們的愿景是徹底改變AI智能體協(xié)作解決現(xiàn)實世界任務的方式。通過利用動態(tài)的智能體交互,OWL能夠在多個領域中實現(xiàn)更自然、高效和穩(wěn)健的任務自動化。

相信我們還將不斷見證各類復現(xiàn)項目,打破「邀請碼」的壟斷。

參考資料:

https://github.com/mannaandpoem/OpenManus

https://x.com/didiforx/status/1897675038972883408

https://github.com/camel-ai/owl

https://mp.weixin.qq.com/s/0AWaSNynyjjY5TpdtKN-3w

編輯:編輯部 JHNZ

本文由人人都是產品經理作者【【新智元】,微信公眾號:【新智元】,原創(chuàng)/授權 發(fā)布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!