大語(yǔ)言模型下的趨勢(shì)預(yù)測(cè):大模型的形態(tài)預(yù)測(cè)、交互變化、應(yīng)用趨勢(shì)
自從ChatGPT發(fā)布之后,大語(yǔ)言模型一時(shí)成為新的風(fēng)口,不論國(guó)內(nèi)國(guó)外,大家都在部署自己的LLM模型。本質(zhì)上LLM是一個(gè)可以在眾多領(lǐng)域使用的模型,但大家都這么玩,容易成為垂直領(lǐng)域的產(chǎn)品。還是說(shuō)有更好的發(fā)展方向呢?這篇文章,作者為我們解讀,希望對(duì)你有所幫助。
本篇圍繞大模型在生態(tài)中的形態(tài)預(yù)測(cè)、大模型帶來(lái)的交互變化、應(yīng)用層產(chǎn)品可能性、投身 AI 產(chǎn)品的建議聊了聊~歡迎閱讀交流~
一、大模型未來(lái)會(huì)成為?
關(guān)于 LLM 的猜想眾多,有說(shuō)大模型可能成為下一代操作系統(tǒng)的,有說(shuō)可以成為新一代底層技術(shù)設(shè)施、有說(shuō)可以成為萬(wàn)物終端的。這里的出發(fā)點(diǎn)主要在于對(duì)大模型未來(lái)形態(tài)的思考。
我的判斷是首先 LLM 帶來(lái)的能力會(huì)作為底層通用技術(shù)對(duì)上層軟硬件產(chǎn)生影響,同時(shí)會(huì)出現(xiàn)一群圍繞大模型基礎(chǔ)能力構(gòu)建的生態(tài),也就是很多文章中說(shuō)的「中間件」和「Apps」。
這里順帶解釋下很多文章中出現(xiàn)的「中間件」和「AI Infra」的含義。
AI中間件,是指在AI應(yīng)用程序和底層基礎(chǔ)設(shè)施之間提供中介服務(wù)的軟件,包括模型訓(xùn)練框架、推理引擎、數(shù)據(jù)處理工具等,它們可以提供人工智能應(yīng)用程序所需的功能和服務(wù),同時(shí)簡(jiǎn)化了開(kāi)發(fā)和部署過(guò)程。
Infra(Infrastructure),是指基礎(chǔ)設(shè)施或基礎(chǔ)架構(gòu),在大模型的生態(tài)系統(tǒng)中,Infra通常指的是為支持大模型訓(xùn)練和部署而構(gòu)建的各種底層技術(shù)設(shè)施,包括處理器、操作系統(tǒng)、存儲(chǔ)系統(tǒng)、網(wǎng)絡(luò)基礎(chǔ)設(shè)施、云計(jì)算平臺(tái)等等。
AI Infra 是提供 AI 中間件所需要的底層基礎(chǔ)設(shè)施的一部分。
一些公司的大模型會(huì)作為終端能力接入各種軟硬件設(shè)備,這里最容易實(shí)現(xiàn)的有 Google、微軟、蘋(píng)果(雖然還沒(méi)有自己的大模型)、華為、百度這樣的公司。
大模型的競(jìng)爭(zhēng)也將帶來(lái)操作系統(tǒng)、軟件市場(chǎng)、終端市場(chǎng)(特別是極度依賴(lài)多模態(tài)交互輸入、輸出的設(shè)備,如音箱、手表、車(chē)載 HMI、MR)的競(jìng)爭(zhēng)格局變化,
但 LLM 本身很難獨(dú)立成為 OS 級(jí)別的系統(tǒng),這受限于幾點(diǎn):
- 純 CUI/VUI 的交互輸入局限性、人們還是需要鼠標(biāo)、(軟、硬)鍵盤(pán)這樣的設(shè)備輔助輸入;
- 輸入產(chǎn)生精力消耗,娛樂(lè)性質(zhì)的刷推薦 feeds、訂閱流仍會(huì)是大部分人的主要訴求;
- 來(lái)自當(dāng)前 OS 系統(tǒng)的防御,也就是上面提到的巨頭公司們;
- 開(kāi)放的平臺(tái)和生態(tài)建立難:成為 OS 級(jí)別的系統(tǒng)需要有足夠的開(kāi)放性和可擴(kuò)展性,以支持不同類(lèi)型的應(yīng)用和場(chǎng)景。需要有完善的生態(tài)系統(tǒng)和開(kāi)發(fā)者社區(qū)的支持,才能吸引開(kāi)發(fā)者輕松地創(chuàng)建和集成;
- 短時(shí)間內(nèi)難以形成一家獨(dú)大的局勢(shì):不論國(guó)內(nèi)還是國(guó)外,投身LLM戰(zhàn)場(chǎng)廝殺的巨頭有很多,未來(lái)幾年內(nèi)很難如 PC、手機(jī)操作系統(tǒng)形成部分頭部穩(wěn)定主導(dǎo)的場(chǎng)面,開(kāi)發(fā)者也就不會(huì)專(zhuān)注在一個(gè)模型上做能力補(bǔ)充,而是更傾向于做獨(dú)立的,不完全依附單個(gè)LLM能力的產(chǎn)品(也就是傾向于做 API 可換甚至接入多個(gè) API 的應(yīng)用而非為單個(gè) LLM 建立 Plugin)
Perfect Prompt — 能夠給出不同模型在同一場(chǎng)景下的回復(fù)。
也許會(huì)有人做這個(gè)方向,純 LLM 的 OS 系統(tǒng) 受眾和應(yīng)用場(chǎng)景都比較受限。
以上判斷基于當(dāng)前的 AI 能力,也僅代表個(gè)人見(jiàn)解,如有不同看法歡迎討論~
二、大模型帶來(lái)的交互變化
判斷的基本邏輯在于:
- 交互的本質(zhì)是輸入和輸出,大模型并沒(méi)有帶來(lái)信息格式的變化,而是加速了信息的生產(chǎn)和交流。
- 大模型帶來(lái)的能力強(qiáng)化主要有文本(這里如果不局限于LLM,就還有圖像、視頻)理解能力、文本生成能力、總結(jié)和歸納能力、翻譯能力等。
1. 交互鏈條變短
這也是自然語(yǔ)言交互被增強(qiáng)帶來(lái)的最顯著優(yōu)勢(shì),這點(diǎn)能夠直接打破現(xiàn)有產(chǎn)品交互的局限性。或者輔助用戶(hù)決策、完成機(jī)械的流程化任務(wù)。
表現(xiàn)1 – 輸出結(jié)果:不用通過(guò)搜索在眾多的反饋中找目標(biāo),而是直達(dá)結(jié)果。
對(duì)應(yīng)場(chǎng)景:任何使用搜索的任務(wù),機(jī)票、酒店、某個(gè)解決問(wèn)題的答案等。
表現(xiàn)2 – 輸入內(nèi)容:多個(gè)意圖能夠被一次性處理,縮短中間流程。
對(duì)應(yīng)場(chǎng)景:總結(jié)所有參會(huì)人的空閑時(shí)間,尋找合適的會(huì)議室,生成一場(chǎng)新的會(huì)議邀請(qǐng)。
也就是說(shuō),傳統(tǒng)設(shè)計(jì)領(lǐng)域致力于在有限的條件下幫助用戶(hù)梳理到達(dá)目的地的最佳路徑,為用戶(hù)清除流程上的障礙。而現(xiàn)在可以通過(guò)AI技術(shù)去大幅優(yōu)化現(xiàn)有產(chǎn)品的交互流程,同時(shí)縮短輸入和輸出過(guò)程,對(duì)傳統(tǒng)的交互方案帶來(lái)顛覆性的改善。
不過(guò)我對(duì)「產(chǎn)品 CUI 化」也保持謹(jǐn)慎,CUI 只是降低了一定的門(mén)檻,“持續(xù)對(duì)話(huà)”其實(shí)非常耗費(fèi)腦力和精力,如果能點(diǎn)個(gè)按鈕就完成的事情,要 CUI 反而會(huì)將問(wèn)題復(fù)雜化。
2. 改變輸入方式
更多場(chǎng)景可以轉(zhuǎn)變?yōu)?CUI、甚至 VUI 。
案例1:在一些政務(wù)服務(wù)場(chǎng)景,如果能夠通過(guò)對(duì)話(huà)的方式一步步引導(dǎo)填寫(xiě),對(duì)老年群體會(huì)更友好,同時(shí)填寫(xiě)方式可以簡(jiǎn)化成語(yǔ)言輸入;
復(fù)雜表單填寫(xiě)中的一些錯(cuò)誤提示也許可以通過(guò)對(duì)話(huà)的方式引導(dǎo)補(bǔ)充。
案例2:Prompt 命令生成圖像/視頻/音樂(lè)
Adobe firefly beta
但是目前看來(lái),受限于大模型應(yīng)用的理解能力,用戶(hù)輕松駕馭 Prompt 還存在門(mén)檻(即弄清楚自己的需求 并懂得如何用 prompt 表達(dá)需求),輸入方式還沒(méi)有得到極致的簡(jiǎn)化和易用。不過(guò)已經(jīng)有一些應(yīng)用開(kāi)始補(bǔ)齊這方面的體驗(yàn)。
Hayo —— 米哈游旗下AI社區(qū)
3. 信息反饋更多維
Chat GPT 已經(jīng)可以將信息組成新的格式,如表格、代碼等;GPT 4 能夠直接理解并處理圖像上的文本信息。
而 Meta 最新開(kāi)源的 ImageBind,綁定了文字、聲音、圖像、深度、溫度、IMU 六種數(shù)據(jù)。可實(shí)現(xiàn)音頻生成圖像、圖像生成音頻等,未來(lái)應(yīng)用的想象空間應(yīng)該會(huì)更大。(不過(guò)官網(wǎng)并沒(méi)有看到溫度、IMU 相關(guān)的案例…)
Meta ImageBind
4. 終端能力得到加持
這點(diǎn)也是基于前兩點(diǎn)即信息輸入方式和信息反饋的。未來(lái)大模型在音箱、手表、車(chē)載 HMI、MR 這些設(shè)備上的使用價(jià)值巨大。
最直接的價(jià)值則是強(qiáng)化語(yǔ)音助手的能力。
另外就是和具體的應(yīng)用結(jié)合,比如結(jié)合 Camera :通過(guò)檢測(cè)畫(huà)面信息,給出照片拍攝改進(jìn)建議(角度、構(gòu)圖、參數(shù)設(shè)置等),不會(huì)拍照的男朋友們?cè)僖膊挥脫?dān)心被罵了…
大模型能力和傳感器能力的整合也更值得期待,比如根據(jù)實(shí)時(shí)運(yùn)動(dòng)信息、心率給出接下來(lái)的運(yùn)動(dòng)規(guī)劃。
5. 對(duì)工具類(lèi)產(chǎn)品的沖擊大于內(nèi)容消費(fèi)型產(chǎn)品
這點(diǎn)是從用戶(hù)信息獲取訴求上來(lái)判斷的,畢竟娛樂(lè)內(nèi)容消費(fèi)場(chǎng)景更多的考慮不是效率而是多巴胺,而對(duì)于生產(chǎn)、工作場(chǎng)景,提升效率是核心指標(biāo)。
從 Notion、釘釘?shù)葢?yīng)用中,大模型已經(jīng)開(kāi)始對(duì)人們的工作流程產(chǎn)生正向影響,逐步減輕知識(shí)記憶、寫(xiě)作、摘要、信息查找等流程化的工作。
6. 豐富C端場(chǎng)景
場(chǎng)景1:私人助理也許會(huì)成為可能,大模型通過(guò)調(diào)用所有應(yīng)用接口(日歷、郵件、行程等)獲取個(gè)人信息,成為私人顧問(wèn)。
場(chǎng)景2:CUI 生成圖像/視頻/音樂(lè)的能力可以在各種活動(dòng)玩法中發(fā)揮作用。
也許以后的網(wǎng)易云年度總結(jié)就會(huì)根據(jù)聽(tīng)歌習(xí)慣生成一首符合你個(gè)人品味的音樂(lè)。加入一些簡(jiǎn)單的用戶(hù)操作,人人都是「網(wǎng)易云音樂(lè)人」。
7. 廣告推薦形態(tài)產(chǎn)生變化
搜索、信息流為主的場(chǎng)景,變?yōu)槿谌雴?wèn)答,做到更精準(zhǔn)、高效的廣告分發(fā)。
就拿比較好商業(yè)化的美妝行業(yè)來(lái)說(shuō),假設(shè)淘寶對(duì)李佳琪做直播內(nèi)容分析和訓(xùn)練,做出了個(gè) AI 版李佳琪,支持用戶(hù)通過(guò)問(wèn)答的形式獲得商品推薦。專(zhuān)業(yè)背景+人設(shè)背書(shū),一定不缺用戶(hù),品牌商也會(huì)更愿意砸錢(qián)。
三、 這波大爆發(fā)中看到產(chǎn)品的哪些可能性?
判斷邏輯是,應(yīng)用前景、用戶(hù)需求程度、成本和商業(yè)化能力??深A(yù)見(jiàn)的是大模型研發(fā)成本太高,中小企業(yè)或團(tuán)隊(duì)會(huì)專(zhuān)注在 AI 中間件、AI 應(yīng)用上發(fā)力。
這里我們聚焦應(yīng)用層看看。
1. 和現(xiàn)有產(chǎn)品的結(jié)合,快速且可預(yù)見(jiàn)的收益大
近期所有工具類(lèi)產(chǎn)品都在發(fā)力,比較實(shí)用的有 Notion、釘釘。
2. 部分方向值得基于LLM的能力重構(gòu)
如搜索、語(yǔ)音助手(近期出現(xiàn)最多的 C 端應(yīng)用就是不同 character 的 Chatbot )、翻譯工具(可以舉例插件)、教育產(chǎn)品(語(yǔ)言、課程的私教方向很快就能出現(xiàn)頭部應(yīng)用)。
3. 助力超級(jí)個(gè)體,提升知識(shí)生產(chǎn)效率
如果說(shuō)面向大眾的 AI 產(chǎn)品難商業(yè)化,那么考慮為第一批使用AIGC產(chǎn)品的人群提供服務(wù)也是個(gè)不錯(cuò)的想法,受眾群體更聚焦,服務(wù)更剛需,也更容易產(chǎn)生付費(fèi)轉(zhuǎn)化。這個(gè)方向近期已經(jīng)涌現(xiàn)了一批此類(lèi)產(chǎn)品,比如協(xié)助開(kāi)發(fā)、快速接入大模型 API、快捷創(chuàng)作 AI 產(chǎn)品、為自己的網(wǎng)站接入客服等。
此外,做輔助文字、圖像、視頻、音樂(lè)生產(chǎn),提高文字、設(shè)計(jì)、創(chuàng)作者的生產(chǎn)效率也是不錯(cuò)的方向。游戲領(lǐng)域已經(jīng)有很多產(chǎn)品輔助 AI 生成角色、視頻、音樂(lè)、腳本提升游戲開(kāi)發(fā)效率。
4. To C 個(gè)性化定制變得更重要
旅行、學(xué)習(xí)、購(gòu)物、讀書(shū)等領(lǐng)域可以根據(jù)用戶(hù)訴求量身定做。
應(yīng)用層的詳細(xì)案例將在下一篇《番外篇》中展示。
四、投身 AI 產(chǎn)品的建議
1. 大量產(chǎn)品服務(wù)會(huì)持續(xù)涌現(xiàn),原因是個(gè)人開(kāi)發(fā)者能力得到了第一批 AIGC 產(chǎn)品的加持,未來(lái)同賽道將涌現(xiàn)多個(gè)相似解決方案,做產(chǎn)品會(huì)逐漸從拼創(chuàng)意到拼速度、產(chǎn)品服務(wù)質(zhì)量和拼持久力。
2. 加深產(chǎn)品壁壘:
- 場(chǎng)景和訴求的準(zhǔn)確洞察仍應(yīng)被擺在首要位置,這將決定產(chǎn)品起跑線(xiàn)。
- 考慮規(guī)模效應(yīng)帶來(lái)的價(jià)值,比如一些 Prompt 文案、AI 圖片分享平臺(tái)未來(lái)有成為AI社區(qū)的潛質(zhì)。
- 考慮該場(chǎng)景用戶(hù)規(guī)模、使用頻次、消費(fèi)時(shí)長(zhǎng),大模型能力出現(xiàn)前是否已經(jīng)有較成熟的解決方案。
- 提前考慮商業(yè)化問(wèn)題(瞄準(zhǔn)剛需人群和場(chǎng)景解決問(wèn)題)。
- 避免功能受到大模型能力升級(jí)帶來(lái)的沖擊。
3. 當(dāng)精力和資源不足時(shí),先深入某個(gè)場(chǎng)景解決小問(wèn)題也是不錯(cuò)的選擇,熟悉的領(lǐng)域扎根深挖反而能發(fā)現(xiàn)與眾不同的視角(如 Figma 插件 Magician ,只解決 UX 設(shè)計(jì)場(chǎng)景,提供文字描述生成圖標(biāo)、UX 文案優(yōu)化能力)
相關(guān)參考文章推薦:
這篇寫(xiě)的很好,我深度看了兩遍:
https://mp.weixin.qq.com/s/PDHWfclMVQrS-2MLCbDm0g?from_wecom=1
「超級(jí)應(yīng)用出現(xiàn)和平臺(tái)的新特性息息相關(guān)」的一些結(jié)論可以引發(fā)思考:
https://mp.weixin.qq.com/s/RXgiIb7oqWmTysffMYim9Q?from_wecom=1
https://mp.weixin.qq.com/s/kjWScZshPAS61053GopJhg
關(guān)于 AI 產(chǎn)品商業(yè)化:
https://mp.weixin.qq.com/s/k16ZtaA-b0fPh-25ftDddg
https://mp.weixin.qq.com/s/wWWG
作者:Bay,騰訊體驗(yàn)設(shè)計(jì)師,公眾號(hào):Bay的設(shè)計(jì)奧德賽
本文由 @Bay 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!