智譜的AtuoGLM實(shí)測(cè)–通用agent到來(lái)
智譜清言近期發(fā)布的AutoGLM沉思,作為一款對(duì)標(biāo)OpenAI Operator的智能體產(chǎn)品,引發(fā)了廣泛關(guān)注。本文將為你帶來(lái)AutoGLM沉思的深度使用體驗(yàn),從其核心功能、實(shí)際應(yīng)用場(chǎng)景到操作感受,全方位剖析這款產(chǎn)品的優(yōu)勢(shì)與不足。
智譜在agent走的不快,但是很穩(wěn)!
3月31日,智譜在中關(guān)村上發(fā)布了它們的auto glm沉思,我也是第一時(shí)間使用,及時(shí)給大家更新這篇產(chǎn)品使用體驗(yàn),告訴大家這款對(duì)標(biāo)open AI的operater的GLM到底怎么樣
說(shuō)到這,智譜其實(shí)在去年就發(fā)布了它們的glm產(chǎn)品,在發(fā)布會(huì)上,我們可以看到智譜可以幫助用戶(hù)導(dǎo)航、自動(dòng)購(gòu)物或者寫(xiě)好評(píng)等等,看起來(lái)十分炫酷。不過(guò)當(dāng)時(shí)還是處于內(nèi)測(cè)階段并沒(méi)有對(duì)外發(fā)布,只知道看完發(fā)布會(huì)的我是很震驚的,心想這么快已經(jīng)有這樣的產(chǎn)品出現(xiàn)了,讓我一度以為AGI真的不遠(yuǎn)了。
先說(shuō)第一點(diǎn),智譜在這次發(fā)布會(huì)上,一共發(fā)布了兩個(gè)產(chǎn)品,第一個(gè)是沉思,第二個(gè)是沉思glm,嗯…….,聽(tīng)上去差不多,但其實(shí)并不一樣
首先呢,沉思版本你可以理解為deep research,就是類(lèi)似于Google和open AI的深度調(diào)研功能,用戶(hù)提出問(wèn)題之后,它會(huì)根據(jù)用戶(hù)的問(wèn)題不斷調(diào)用所需要的函數(shù)信息,來(lái)滿(mǎn)足用戶(hù)信息的需要,最大化使模型的回答質(zhì)量更佳的優(yōu)質(zhì),當(dāng)然了,這種也會(huì)更加的耗時(shí),因?yàn)槟P蜁?huì)根據(jù)用戶(hù)的問(wèn)題來(lái)分析,然后不斷的尋找最優(yōu)解,什么意思呢?
比如,你現(xiàn)在想去西湖旅游,但是你根本不知道旅行路線(xiàn),傳統(tǒng)方法你肯定要去各大平臺(tái)去挨個(gè)搜取信息,比如去抖音看博主怎么玩的,去小紅書(shū)看出行路線(xiàn)圖,然后在這個(gè)過(guò)程中你還需要不斷的翻用戶(hù)評(píng)論,深怕自己踩坑了或者被宰了,最后你經(jīng)過(guò)長(zhǎng)達(dá)一個(gè)小時(shí)或者一天的時(shí)間,你終于規(guī)劃出來(lái)一條自己認(rèn)為還不錯(cuò)的旅行路線(xiàn),但是你已經(jīng)累趴了,就說(shuō)你看到下面這種情況,你會(huì)不會(huì)窒息?反正我是直接b潰住了
但是現(xiàn)在,你只需要把這個(gè)問(wèn)題,交給智譜的沉思或者任何帶有deep research的功能的大模型,它們會(huì)幫你解決這個(gè)問(wèn)題,我這里現(xiàn)場(chǎng)實(shí)操一下
dangdangdangdang,一個(gè)智能版西湖旅游攻略就出來(lái)了,當(dāng)然了我覺(jué)得還是不足的,包括吃什么,咋哪里吃,怎么規(guī)劃時(shí)間路線(xiàn)和交通工具等等,不過(guò)這也是因?yàn)槲覜](méi)有具體的prompt,如果大家想要有更好的出行計(jì)劃選擇,就需要給出完整的信息,比如預(yù)算啊,出發(fā)地啊什么的,這樣的效果會(huì)更好一些,而且從我使用體驗(yàn)來(lái)看,如果你想要選擇酒店的時(shí)候,你也可以利用沉思功能,根據(jù)目的地選擇便宜并且距離近的酒店,把它放在規(guī)劃里面。(友情提示:圖片里的一日游路線(xiàn)不要嘗試,這完全是把人類(lèi)當(dāng)猴耍……)
另外,從深思的過(guò)程來(lái)看,它確實(shí)在很努力的搜集信息,看它不斷的查找,又不斷的否定自己,真的有在很努力的工作,是個(gè)和負(fù)責(zé)的打工人,甚至讓我有點(diǎn)心疼。
值得一提的是,盡管你要求它在抖音和小紅書(shū)里面搜索,但是它還會(huì)在別的平臺(tái)盡可能調(diào)用一些信息,我猜測(cè),可能智譜優(yōu)先地插件是知乎,因?yàn)槲以诿恳淮蔚脑囉盟暮瘮?shù)都有知乎,另外一方面可能是因?yàn)樗畲蠡瘽M(mǎn)足信息源所帶來(lái)結(jié)果的客觀性,避免過(guò)擬合。
沉思版本就將到這里,下面來(lái)講一講這次的重頭戲“沉思GLM”。
所謂沉思GLM,就是一個(gè)具有自主規(guī)劃、思考和行動(dòng)能力的agent,我相信大家對(duì)于agent都一定不陌生,我在這里列出了一個(gè)清單,結(jié)合目前市面上所有的agent,然后給出一個(gè)分類(lèi)
需要提醒的是,這個(gè)分類(lèi)是根據(jù)agent類(lèi)目的一個(gè)整理,和我們之前看到的那種l1級(jí)別的AI劃分并不一樣,做這個(gè)表格的初衷是因?yàn)?,我發(fā)現(xiàn)agent這個(gè)詞在被濫用,行業(yè)內(nèi)可能都知道agent是什么意思,但是我身邊還有很多用AI的人,對(duì)于agent這個(gè)詞熟悉又陌生,在他們看來(lái)豆包的agent和manus好像都是一樣的,但為什么后者看上去難度就更大呢?
比如,我們說(shuō)的agent一般都指第三種,也就是l3級(jí)別的,能基于大模型加上工具鏈,從而實(shí)現(xiàn)端到端的專(zhuān)業(yè)任務(wù)執(zhí)行,它的核心是規(guī)劃和執(zhí)行,這也是我們最近的研究和商業(yè)的重點(diǎn),市面上很多人工智能公司都在往這個(gè)方向發(fā)展,簡(jiǎn)單來(lái)說(shuō)無(wú)論是manus還是智譜的glm本質(zhì)上都是一樣的,具備這種規(guī)劃和行動(dòng)能力,在未來(lái)無(wú)非就是朝著不斷的優(yōu)化發(fā)展,這里面有,速度響應(yīng)更快、幻覺(jué)更少、插件調(diào)用更多等等,所以這些工具給我們一個(gè)框架,證明這種模式行得通并且有效,也為以后的agent發(fā)展提供了一個(gè)清晰的路徑。
至于我們現(xiàn)在都在說(shuō)的通用agent,我個(gè)人感覺(jué)是非常模糊的,主要是因?yàn)檫@個(gè)詞被大家用爛了,manus出來(lái)的時(shí)候我們說(shuō)它是通用agent,現(xiàn)在誰(shuí)家出來(lái)一個(gè)產(chǎn)品大家都要說(shuō)是通用agent,就是在l3和l4之間來(lái)回徘徊,因?yàn)闆](méi)有準(zhǔn)確的定義,或者公眾對(duì)于agi的期待太高,導(dǎo)致這個(gè)詞一直在被濫用
因此,拋開(kāi)這些定義來(lái)看的話(huà),結(jié)合這些agent的功能,我們可以給這些市面上agent工具做了一個(gè)區(qū)分,也是為了讓大家有一個(gè)更加清晰明了的認(rèn)知。
回到正題,來(lái)說(shuō)一下這一次智譜的agent,根據(jù)官網(wǎng)所說(shuō)這一次的,它們給其命名為auto glm,其核心突破在于實(shí)現(xiàn) “邊想邊干” 的自主任務(wù)執(zhí)行能力,推動(dòng) AI 從 “信息處理” 升級(jí)為 “目標(biāo)驅(qū)動(dòng)的行動(dòng)者”。
主要功能有三個(gè):
1,深度思考:基于 GLM-Z1-Rumination 沉思模型,模擬人類(lèi)復(fù)雜決策過(guò)程。例如,處理 “分析 2025 年 Q2 互聯(lián)網(wǎng)大廠(chǎng) AI 動(dòng)向” 時(shí),能自主規(guī)劃 “技術(shù)熱點(diǎn)梳理→網(wǎng)頁(yè)檢索→信息整合→報(bào)告生成” 的全流程,平均思考步驟超過(guò) 20 步。類(lèi)似于open AI的o1.
2,感知世界:突破傳統(tǒng) API 限制,通過(guò)純前端視覺(jué)感知方案模擬人類(lèi)操作。例如,可自動(dòng)登錄知網(wǎng)、小紅書(shū)等平臺(tái),抓取圖文信息并分析用戶(hù)真實(shí)評(píng)論,生成香港旅行攻略時(shí)能突破封閉內(nèi)容生態(tài)的信息壁壘。
這一點(diǎn)是比較有意思的,官方說(shuō)的這種GUI閱讀能力,可以讓模型不斷的閱讀網(wǎng)頁(yè)內(nèi)容,擺脫傳統(tǒng)的API鏈接,什么意思呢?簡(jiǎn)單來(lái)說(shuō),以前我們做一個(gè)agent,想要獲取外部鏈接有以下幾種困難:
第一,你需要一個(gè)插件,如果沒(méi)有這個(gè)插件,你很難獲取到完整且合格的內(nèi)容,就拿扣子(coze)來(lái)說(shuō),我每次工作流都需要用到它的網(wǎng)頁(yè)插件來(lái)調(diào)取內(nèi)容,這就造成什么問(wèn)題呢,不方便,比如你需要不斷的提醒a(bǔ)gent,再遇鏈接問(wèn)題,要及時(shí)去調(diào)動(dòng),否則它可能會(huì)直接忽略,不具備自主能力。
第二,我們都知道人工智能時(shí)代,數(shù)據(jù)飛輪(數(shù)據(jù)飛輪是一種基于數(shù)據(jù)驅(qū)動(dòng)的業(yè)務(wù)增長(zhǎng)模型,其核心概念是通過(guò)不斷地收集、分析和利用數(shù)據(jù),來(lái)推動(dòng)業(yè)務(wù)各個(gè)環(huán)節(jié)的優(yōu)化和提升,從而形成一個(gè)正向循環(huán),促進(jìn)業(yè)務(wù)持續(xù)增長(zhǎng)。)的重要性,但是獲取數(shù)據(jù)是沒(méi)有那么簡(jiǎn)單的。
人工智能時(shí)代尤其是gpt出現(xiàn)的這幾年幾乎把互聯(lián)網(wǎng)20多年的數(shù)據(jù)跑完了,未來(lái)像小紅書(shū)、知乎、貼吧、抖音這種平臺(tái)的數(shù)據(jù)會(huì)越來(lái)越有價(jià)值,但是它們不會(huì)把這些數(shù)據(jù)給你的,那怎么辦呢?有同學(xué)說(shuō),爬蟲(chóng),先不說(shuō)技術(shù)上能不能實(shí)現(xiàn)的同,即便你爬到了你也要面臨及其嚴(yán)峻的法律風(fēng)險(xiǎn),之前openai爬去烏克蘭一家電商公司,直接給對(duì)方網(wǎng)站整崩潰了,所以這在道道德上也說(shuō)不過(guò)去,肯定不利于商業(yè)的長(zhǎng)期發(fā)展。
所以,智譜的使用方法是,我不調(diào)用,我也不爬蟲(chóng),我就直接看,我一邊瀏覽一邊抄,比如我就用它跑了幾個(gè)小紅書(shū)的案例,它就瘋狂的去幫我打開(kāi)小紅書(shū)的網(wǎng)頁(yè),中間除了讓我掃碼登陸(為了防止你不是真人),其他的都由他自主完成,完全沒(méi)有考慮我的感受,這家伙壞的很。
我這里隨便放一張圖,大家自行感受一下……..
3,工具使用:整合智譜自研的 AutoGLM 設(shè)備操作能力,支持網(wǎng)頁(yè)瀏覽、郵件發(fā)送、文檔生成等跨平臺(tái)任務(wù)。例如,接收到 “賺取 100 元” 的任務(wù)時(shí),能自主完成征稿啟事搜索、稿件撰寫(xiě)、郵件投稿等操作。這點(diǎn)看上去很誘人,但是實(shí)際效果我們需要測(cè)試才知道。
那如何才能使用auto glm呢?
首先你需要打開(kāi)官方網(wǎng)站,我把鏈接放在這里
https://autoglm-research.zhipuai.cn/#get_started
打開(kāi)之后你會(huì)看到官方給出很多案例,感興趣的小伙伴可以觀看一下
接著你只需要看到下方的開(kāi)始體驗(yàn)就行,很遺憾的事,目前autoglm是只能支持Google插件才能使用的,其他版本后續(xù)可能還會(huì)更新,所以google這一步需要大家自己解決。
這里提醒一下,大家在客戶(hù)端或者網(wǎng)頁(yè)端都是可以使用智譜的沉思的,無(wú)論你有沒(méi)有g(shù)oogle插件,只是說(shuō)你想要用autoglm的話(huà),你還需要進(jìn)行下一步地操作。
其實(shí)也很簡(jiǎn)單,就是你惦點(diǎn)擊下載之后,再把點(diǎn)擊google,選擇擴(kuò)展程序,點(diǎn)擊開(kāi)發(fā)者模式,然后把這個(gè)文件拖入到google里面進(jìn)去,就可以了。
完成之后,你就可以在google的任何界面去隨時(shí)使用智譜,甚至在使用chatGPT的時(shí)候也可以(逆天了)
然后,這個(gè)時(shí)候你再打開(kāi)智譜的時(shí)候,你就會(huì)神奇的發(fā)現(xiàn),你的頁(yè)面有一個(gè)新的功能,你可以點(diǎn)擊旁邊的沉思使用他們最新的研究功能,也可以點(diǎn)擊autoglm沉思,體驗(yàn)他們的agent。
那他們的智譜agent到底怎么樣呢?
我一共跑了5個(gè)case左右,實(shí)話(huà)講,效果一般,不如發(fā)布會(huì)和廣告那樣效果好,我身邊的幾個(gè)伙伴都測(cè)試了一下,幾乎都對(duì)其變現(xiàn)能力給出一般的評(píng)價(jià)。
但是人家其實(shí)也說(shuō)了,目前是preview版本,很多功能還在測(cè)試,我個(gè)人覺(jué)得智譜的對(duì)agent的思考是有的,起碼這樣的一個(gè)框架是實(shí)現(xiàn)了的,規(guī)劃、思考和行動(dòng),都能鏈接在一起,只是說(shuō)綜合起來(lái)可能還差點(diǎn)意思,但是不妨礙它仍然是一個(gè)很優(yōu)秀的作品。
比如,它的思考能力確實(shí)很好,前文我說(shuō)過(guò)了,當(dāng)你在輸入問(wèn)題的時(shí)候他會(huì)不斷的進(jìn)行分析,然后篩選信息,在進(jìn)行自動(dòng)化操作,這一部分就是相當(dāng)于深度思考?深度研究?agent了。
比如,我下面這個(gè),我讓智譜去幫我搜集open AI的最近一周的相關(guān)帖子,它就真的在不斷的大量閱讀,不斷的翻,而不像我們說(shuō)的那樣,走馬觀花似得
這里可以看出來(lái),它在瘋狂的閱讀小紅書(shū)內(nèi)容。
順便把我的prompt放進(jìn)來(lái),供大家參考
##你是一位OpenAI的公關(guān)團(tuán)隊(duì)人員,你現(xiàn)在閱讀最近一周關(guān)于小紅書(shū)的帖子,找出一位情緒化最嚴(yán)重的帖子,然后進(jìn)行友好的用戶(hù)回復(fù)
這里面,智譜autoglm一共進(jìn)行了這幾個(gè)步驟,先去分析問(wèn)題,確定用戶(hù)想要問(wèn)的是什么,然后執(zhí)行命令,打開(kāi)小紅書(shū),請(qǐng)求登陸,閱讀相關(guān)文章,然后判斷哪一個(gè)情緒化最嚴(yán)重,再代入人物視角,進(jìn)行回復(fù)
然后呢,它會(huì)選擇一篇帖子進(jìn)行回復(fù),你只需要點(diǎn)擊確定,然后就可以評(píng)論了,不過(guò)我目前使用起來(lái),這個(gè)功能不穩(wěn)定,起碼我有一半的case都沒(méi)有自動(dòng)回復(fù)
其次來(lái)說(shuō)一下,autoglm的插件調(diào)用功能還是很豐富的,就我目前使用下來(lái),是可以打開(kāi)地圖、天氣以及小紅書(shū)、抖音等等軟件內(nèi)容的,這里面需要提醒一下,即便你電腦沒(méi)有下載小紅書(shū),你的autoglm照樣可以打開(kāi)它,因?yàn)樗皇侵苯哟蜷_(kāi)小紅書(shū)客戶(hù)端的,可以簡(jiǎn)單理解為不在一個(gè)圖層,所以影響不大。
比如,我用這個(gè)它去操作一下這個(gè)天氣功能
還不錯(cuò),我以為他會(huì)打開(kāi)一些商業(yè)天氣網(wǎng)站,結(jié)果直接跳出來(lái)了中央氣象臺(tái),還是很官方的
我這里還是建議大家多跑跑case,也許會(huì)有一些新的發(fā)現(xiàn),畢竟還是免費(fèi)的,沒(méi)有限制使用!??!光這一點(diǎn)就是最大的優(yōu)點(diǎn),直接點(diǎn)贊!??!
但是,我還是要說(shuō)一下autoglm的問(wèn)題的,算是一些小建議:
首先,插件的調(diào)用問(wèn)題很混亂,比如我想要智譜去在小紅書(shū)和抖音去找信息,但是它還是會(huì)跳轉(zhuǎn)到知乎或者別的平臺(tái),這就很不方便,萬(wàn)一有些用戶(hù)在做需求調(diào)研的時(shí)候,只想看個(gè)別平臺(tái),而忽略某些平臺(tái),這樣就很不方便。
其次,當(dāng)autoglm在行動(dòng)的時(shí)候,用戶(hù)在使用別的軟件或者智譜的時(shí)候,會(huì)造成其后臺(tái)停止,這就很雞肋了,因?yàn)榧热皇亲灾餍袆?dòng),那我在進(jìn)行別的操作應(yīng)該完全不受限制,起碼glm需要有一個(gè)單獨(dú)獨(dú)立的窗口
最后,也就是這種agent通用的一個(gè)毛病,也是我最頭疼的,速度太慢,比如,我想要選找路線(xiàn),明明只需要一個(gè)高德地圖的事,它卻拐彎抹角幾十分鐘,甚至還沒(méi)有解決好,那這樣我還不如自己導(dǎo)航來(lái)的快
起初我還以為我的prompt不夠明確,但是即便我提示它怎么做,它還是會(huì)照樣那樣做。。。。。。
我想要的是,belike,請(qǐng)你跟我這樣做,我就跟你這樣做的那種效果
最后的最后,希望大家積極嘗試,還是那句話(huà),早用早享受,解放生產(chǎn)力,起碼讓glm去給我進(jìn)行一些需求分析和用戶(hù)調(diào)研,還是很方便的,畢竟我們刷抖音也是只是想刷抖音,工作這種事還是給AI比較好。
原來(lái)這才是打工人真正的護(hù)眼神藥,媽媽再也不用擔(dān)心我的眼睛了!
本文由 @施拉格e 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)
- 目前還沒(méi)評(píng)論,等你發(fā)揮!