大模型不需要眼前的共識(shí)

0 評(píng)論 962 瀏覽 3 收藏 17 分鐘

大模型領(lǐng)域還未能形成一致的市場(chǎng)共識(shí),而這種“沒(méi)有共識(shí)”的狀態(tài),或許不算什么壞事。

確定性的機(jī)會(huì)指向的往往是需求場(chǎng)景,需要實(shí)干家,不斷優(yōu)化體驗(yàn);而不確定的機(jī)會(huì)往往依托于技術(shù)創(chuàng)新,需要冒險(xiǎn)家,探索出一條通向應(yīng)用的路徑。這也是為什么人們不會(huì)驚訝于雷軍下場(chǎng)造車的決心,卻很難完全相信楊植麟在月之暗面創(chuàng)業(yè)過(guò)程中表現(xiàn)出來(lái)的技術(shù)理想主義。

在大模型領(lǐng)域,并沒(méi)有形成像新能源車一樣的市場(chǎng)共識(shí)。企業(yè)在確定性和不確定性之間進(jìn)行的權(quán)衡,是引發(fā)行業(yè)分歧的主要原因。選擇確定性還是擁抱不確定性,決定了企業(yè)是優(yōu)先賺到錢,還是優(yōu)先做好技術(shù);是堅(jiān)持做閉源大模型,還是賭開(kāi)源大模型一定會(huì)迎頭趕上;是要依靠通用模型催生引爆行業(yè)的超級(jí)應(yīng)用,還是要通過(guò)小模型先占領(lǐng)細(xì)分市場(chǎng)。

當(dāng)前的環(huán)境下,企業(yè)和投資人都會(huì)從更現(xiàn)實(shí)的角度去做考量,活下去、掙到錢,比一個(gè)不確定的理想愿景更能說(shuō)服人。但人們對(duì)大模型的期待是給行業(yè)帶來(lái)更徹底地改變。從長(zhǎng)遠(yuǎn)來(lái)看,現(xiàn)在很多企業(yè)的大模型應(yīng)用,還是在對(duì)原有工具進(jìn)行小修小補(bǔ),很難產(chǎn)生引爆技術(shù)的應(yīng)用,也很難抵御未來(lái)大模型技術(shù)迭代帶來(lái)的洗牌。

泛濫的「智能體」是最明顯的一個(gè)例子。國(guó)產(chǎn)大模型的落地催生出各種被冠以智能體名號(hào)的聊天機(jī)器人和「XX助手」。百度文心一言中充斥著大量伏地魔、繁花-爺叔這樣的模擬對(duì)話機(jī)器人;kimi+上也出現(xiàn)了公文筆桿子、i人嘴替等個(gè)人助理;字節(jié)豆包在抖音上的推廣也都依靠批改作業(yè)、練習(xí)英語(yǔ)口語(yǔ)等簡(jiǎn)單的功能點(diǎn)來(lái)吸引用戶。

很難想象這樣的聊天機(jī)器人能有多強(qiáng)大的生命力。如果我們對(duì)于大模型的期待僅停留在追求確定性的階段——利用其提升智能客服的對(duì)話體驗(yàn),提高資料搜集整理的效率以及擴(kuò)充某些圖像或生成某些代碼,那么大模型能夠產(chǎn)生的實(shí)際價(jià)值或?qū)⑦h(yuǎn)不及我們現(xiàn)在的預(yù)期。

大模型殺手級(jí)應(yīng)用的出現(xiàn)一定是要革掉某個(gè)現(xiàn)有體驗(yàn)的命?,F(xiàn)在來(lái)看,沒(méi)有共識(shí)就是最好的消息,至少說(shuō)明這個(gè)市場(chǎng)上,不是所有人都只滿足于眼前的利益,還有人在沿著另一條邏輯路線前行,在不確定中尋找更大的可能,去打一場(chǎng)持久戰(zhàn)。

一、大模型的兩種邏輯

中局和終局是大模型領(lǐng)域目前比較有代表性的兩種發(fā)展邏輯。

中局的邏輯以朱嘯虎(金沙江創(chuàng)投主管合伙人)為代表,包括一部分聚焦應(yīng)用層的創(chuàng)業(yè)者在內(nèi),致力于利用開(kāi)源大模型快速構(gòu)建服務(wù)于細(xì)分需求的小模型,然后通過(guò)數(shù)據(jù)積累和模型迭代,建立競(jìng)爭(zhēng)門檻;終局的邏輯以月之暗面為代表,傾向繼續(xù)投入于大模型能力的提升,等待技術(shù)迭代引爆超級(jí)應(yīng)用。

在中局的邏輯里,大模型的理解、決策能力被融合到既有的場(chǎng)景中,讓這些場(chǎng)景能夠應(yīng)用大模型的生成能力,提升解決方案的性能,從而產(chǎn)生新的商業(yè)化可能性。這種邏輯受到青睞的原因是,有確定性需求,可以迅速見(jiàn)到成效,用戶付費(fèi)意愿更強(qiáng)。

在朱嘯虎的介紹中,一家利用開(kāi)源大模型做AI視頻面試的企業(yè)2023年的收入比2022年翻了一倍;利用開(kāi)源大模型做AIGC視頻廣告的公司2023年收入做到了5000多萬(wàn)元,比2022年漲了四五倍。

朱嘯虎追求的機(jī)會(huì)是,利用LLaMA這種快速提升的開(kāi)源大模型,結(jié)合垂直場(chǎng)景的數(shù)據(jù)積累和人工微調(diào),在幾個(gè)月內(nèi)提升某一垂直場(chǎng)景的效率,在大模型發(fā)展過(guò)程中先賺到第一桶金。

朱嘯虎對(duì)大模型的發(fā)展持悲觀預(yù)期,對(duì)應(yīng)用場(chǎng)景的開(kāi)發(fā)保持樂(lè)觀,主張從實(shí)際出發(fā),把能賺的錢先賺到。

月之暗面的創(chuàng)始人楊植麟的理念則更具技術(shù)理想主義色彩,他相信大模型會(huì)逐步完成對(duì)世界的建模,并在這個(gè)過(guò)程中自然涌現(xiàn)出殺手級(jí)應(yīng)用。

楊植麟的終局邏輯下,大模型是一種解釋世界的工具,就像人會(huì)用語(yǔ)言描述世界、理解世界一樣,大模型用數(shù)學(xué)為語(yǔ)言建模,讓AI也能夠理解世界,描述世界。AI依靠這種學(xué)習(xí)能力,逐步實(shí)現(xiàn)像人一樣使用工具,讓AGI成為幫助人鏈接和管理細(xì)分場(chǎng)景的「助理」。

AI能夠使用工具,也就意味著很多場(chǎng)景的運(yùn)作方式將會(huì)迎來(lái)巨大改變??赡芷髽I(yè)未來(lái)并不需要有一個(gè)專門的視頻面試工具,也不需要有獨(dú)立的AI客服,而是統(tǒng)合到一個(gè)大模型主導(dǎo)的企業(yè)級(jí)智能體中,依靠智能體打通和掌控企業(yè)的不同環(huán)節(jié)。

在即將被OpenAI帶火的AI搜索中,真正的難點(diǎn)不是搜索結(jié)果到底要以網(wǎng)頁(yè)列表的形式顯示,還是以經(jīng)過(guò)AI整合的一段話來(lái)顯示,而是如何利用AI的理解能力,把被APP分解的信息重新鏈接成為一個(gè)整體。在Kimi+中,可以看到什么值得買、小紅書(shū)的相關(guān)內(nèi)容可以借助個(gè)人助理「什么值得買」和「美好生活指南」來(lái)進(jìn)行喚醒。

但隨著楊植麟2個(gè)月套現(xiàn)4000萬(wàn)美元的消息傳出,市場(chǎng)對(duì)他的這種終局邏輯產(chǎn)生了質(zhì)疑。月之暗面直接面向C端用戶的思路,獲客成本高且營(yíng)收前景低。在沒(méi)有新的變化出現(xiàn)前,月之暗面商業(yè)化前景的不明朗被認(rèn)為是楊植麟信心不足,急于套現(xiàn)的原因。

二、聊天機(jī)器人發(fā)揚(yáng)不了大模型

從目前來(lái)看,國(guó)內(nèi)的大模型應(yīng)用給到嘗鮮者的總體感覺(jué)還處于大而無(wú)當(dāng)階段,提出問(wèn)題之后獲得的答案很難讓人滿意。這一方面受限于大模型自身的技術(shù)能力不足,另一方面則受限于用戶對(duì)大模型應(yīng)用使用經(jīng)驗(yàn)的不足。

很多大模型應(yīng)用推出之初,都僅有一個(gè)對(duì)話框,用戶可以在對(duì)話框中提出任何問(wèn)題并獲得答案。而利用精準(zhǔn)的Prompt充分開(kāi)發(fā)大模型的現(xiàn)有能力,成為大部分用戶難以在短時(shí)間內(nèi)逾越的門檻。

目前充斥在文心一言、豆包等大模型應(yīng)用中的智能體,很多都是為了降低大模型的使用門檻而打包的Prompt,也就是將一些用戶的使用經(jīng)驗(yàn)沉淀為可以被分享的智能體,讓用戶可以按照需求找到不同的智能體,獲得更具針對(duì)性、更有效的回答。

Prompt門檻的出現(xiàn)本質(zhì)上還是大模型在語(yǔ)言理解能力上存在欠缺。用戶即便利用現(xiàn)成的Prompt獲得了有效信息,也依然要面對(duì)不成熟的體驗(yàn)。Prompt或者所謂的智能體,可以解決初次溝通的效率問(wèn)題,但解決不了復(fù)雜對(duì)話的效果問(wèn)題,大模型應(yīng)用往往都不止一輪對(duì)話。

這也是為什么智能體面向B端的商業(yè)化運(yùn)作依然停留在客服、營(yíng)銷領(lǐng)域,并沒(méi)有能推進(jìn)到其他生產(chǎn)生活領(lǐng)域中。因?yàn)榭头?、營(yíng)銷領(lǐng)域在大模型應(yīng)用之前就已經(jīng)實(shí)現(xiàn)了基礎(chǔ)的智能對(duì)話體驗(yàn),大模型的理解能力可以讓互動(dòng)變得更加靈活、自然。

從李彥宏(百度創(chuàng)始人)演講中提到的案例可以看到,百度在企業(yè)智能體方面的實(shí)踐是提供了一套結(jié)合大模型的無(wú)代碼客服機(jī)器人生成工具。企業(yè)可以上傳私域知識(shí),自動(dòng)形成對(duì)話語(yǔ)料,也可以過(guò)濾不在自己經(jīng)營(yíng)范圍內(nèi)的內(nèi)容,還能關(guān)聯(lián)第三方的工具。

被包裝為智能體的客服機(jī)器人,會(huì)服務(wù)于百度的搜索生態(tài)。當(dāng)用戶在百度APP搜索「什么時(shí)候去新加坡人最少」時(shí),會(huì)在最前面顯示新加坡旅游局AI分身給到的答案,點(diǎn)擊可以進(jìn)行更多對(duì)話。這種智能體本質(zhì)上和之前的百家號(hào)、小程序一樣,是百度為售賣搜索營(yíng)銷、云服務(wù)等產(chǎn)品的新切入點(diǎn)。

但無(wú)論是to B的客服機(jī)器人,還是to C的各種Prompt,都不具備獨(dú)特性,很難成為大模型的引爆應(yīng)用?,F(xiàn)在呈現(xiàn)在用戶面前的智能體、大模型應(yīng)用,都還是只停留在優(yōu)化工具的階段,只不過(guò)是讓搜索變得智能了一點(diǎn)。就像王小川(百川智能創(chuàng)始人兼首席執(zhí)行官)所說(shuō),是在聚焦于搜索如何使用大模型,而不是大模型如何學(xué)會(huì)用好搜索。

理想狀態(tài)下,智能體應(yīng)該能夠調(diào)用工具,完成更為復(fù)雜的任務(wù),而不僅僅是聊天。這里需要提到,無(wú)論Rabbit R1是否只是一個(gè)安卓App的套殼產(chǎn)品,但其結(jié)合大語(yǔ)言模型和所謂大動(dòng)作模型對(duì)APP使用體驗(yàn)的創(chuàng)造性升級(jí),似乎更接近于一個(gè)智能體理想中的狀態(tài)——通過(guò)不斷學(xué)習(xí)理解人的復(fù)雜意圖,模仿人的動(dòng)作執(zhí)行復(fù)雜操作。

我會(huì)比較贊同楊植麟所說(shuō)的,技術(shù)是這個(gè)時(shí)代唯一新變量。無(wú)論是在to B還是to C場(chǎng)景中,在其他變量都沒(méi)有變的情況下,技術(shù)對(duì)語(yǔ)言的理解越來(lái)越精準(zhǔn),對(duì)人類意圖、行為的理解越來(lái)越精準(zhǔn),其能夠處理的任務(wù)就會(huì)越來(lái)越復(fù)雜,智能體的能力才會(huì)越來(lái)越強(qiáng)大。

Kimi的走紅,已經(jīng)證明大模型應(yīng)用具備了被引爆的市場(chǎng)基礎(chǔ)。Kimi于2023年10月上線,2024年2月日活訪問(wèn)量已經(jīng)在國(guó)內(nèi)排到前三,在3月將無(wú)損上下文長(zhǎng)度從最初的20多萬(wàn)字增加到200萬(wàn)字后,Kimi關(guān)注度繼續(xù)走高,連續(xù)五次擴(kuò)容,訪問(wèn)量環(huán)比增長(zhǎng)321.58%。

三、沒(méi)有共識(shí)就是最好的共識(shí)

當(dāng)下還未解決的是,何時(shí)會(huì)出現(xiàn)一款讓大眾用戶保持高頻使用的超級(jí)應(yīng)用。就大模型的應(yīng)用現(xiàn)狀來(lái)看,國(guó)內(nèi)和國(guó)外都還處于工具優(yōu)化階段,只是取決于大模型不同的性能,效果上會(huì)有所不同。比如,Adobe對(duì)AI的最新應(yīng)用仍聚焦于AI圖像編輯功能的創(chuàng)新和改進(jìn),文生圖功能的推出,以及視頻內(nèi)容的換頭、延長(zhǎng)和輔助鏡頭的生成。

面向未來(lái),讓大模型學(xué)會(huì)使用工具,而不依賴人工微調(diào),是技術(shù)發(fā)展的又一個(gè)節(jié)點(diǎn)。扎克伯格說(shuō),「對(duì)于Llama-3,當(dāng)我們開(kāi)始進(jìn)入更多這些類似于智能體的行為時(shí),我認(rèn)為其中一些將是更多手工設(shè)計(jì)的。我們對(duì)Llama-4的目標(biāo)將是將更多這樣的東西納入模型?!?/p>

最終能力的大幅提升,依然有賴于大模型本身的進(jìn)步。但是,大模型的每一次進(jìn)步,都需要耗費(fèi)一筆相當(dāng)龐大的資金。根據(jù)THE DECODER披露,GPT-4一次訓(xùn)練成本為6300萬(wàn)美元。而根據(jù)AI Index的估算,OpenAI的GPT-4估計(jì)使用了價(jià)值7800萬(wàn)美元的計(jì)算資源進(jìn)行訓(xùn)練,谷歌的Gemini Ultra 的計(jì)算成本則高達(dá)1.91億美元。

高昂的訓(xùn)練成本也是國(guó)內(nèi)在大模型方面沒(méi)有形成共識(shí)的原因之一。國(guó)內(nèi)大模型的融資額度要低于國(guó)外。月之暗面在2月獲得了10億美元A輪投資,Minimax3月被傳獲得6億美元戰(zhàn)略投資。相較于亞馬遜向Anthropic追加的27.5億美元投資,都不算多。而且國(guó)內(nèi)的環(huán)境并不利于大模型的進(jìn)一步融資。

對(duì)大模型技術(shù)未來(lái)發(fā)展的差異化預(yù)期是另外一個(gè)原因。一部分開(kāi)源大模型的支持者會(huì)認(rèn)為,開(kāi)源大模型與閉源大模型的發(fā)展會(huì)受到大模型技術(shù)發(fā)展坡度的影響,坡度越陡,閉源的優(yōu)勢(shì)越大,一旦坡度變緩,開(kāi)源會(huì)很快追趕上來(lái)。

等待開(kāi)源大模型追趕上來(lái)的人,都預(yù)期大模型技術(shù)發(fā)展的坡度會(huì)在短時(shí)間內(nèi)變緩。這樣閉源大模型與開(kāi)源大模型的差距就會(huì)相對(duì)縮小。而提前深耕場(chǎng)景,積累了一定數(shù)據(jù)的企業(yè)則能夠利用開(kāi)源大模型構(gòu)筑不低于閉源大模型企業(yè)的場(chǎng)景壁壘。

對(duì)于小企業(yè)而言,以應(yīng)用場(chǎng)景為目標(biāo)訓(xùn)練小技能,然后不斷根據(jù)技術(shù)進(jìn)步重新「練號(hào)」,可以在這個(gè)大技術(shù)趨勢(shì)下不斷抓到小風(fēng)口,甚至在大風(fēng)口到來(lái)時(shí),以插件的形式參與其中。對(duì)于巨頭企業(yè)來(lái)說(shuō),其優(yōu)勢(shì)是多場(chǎng)景的融合,是對(duì)核心入口的爭(zhēng)搶,「重開(kāi)新號(hào)」的代價(jià)太高,技術(shù)的迭代往往意味著一場(chǎng)淘汰賽的開(kāi)啟。

基于融資能力的不同、對(duì)技術(shù)應(yīng)用前景預(yù)期的不同、自身體量的不同,企業(yè)之間的共識(shí)并沒(méi)有形成。

這是一個(gè)好消息,說(shuō)明大模型領(lǐng)域還遠(yuǎn)未像新能源車一樣進(jìn)入到市場(chǎng)成熟階段。雖然不確定性會(huì)增加失敗的風(fēng)險(xiǎn),但其中也蘊(yùn)藏著的機(jī)會(huì)也更大,足以說(shuō)服一部分企業(yè)冒險(xiǎn)前行,追求技術(shù)的高峰。

可以理解中局的無(wú)奈,卻不應(yīng)放棄對(duì)終局的堅(jiān)持。

本文由人人都是產(chǎn)品經(jīng)理作者【窄播】,微信公眾號(hào):【窄播】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!