AI如何支棱起來(lái)?
在人工智能的浪潮中,我們?nèi)绾巫孉I真正成為我們的得力助手,而不僅僅是一個(gè)冰冷的工具?本文以一種輕松幽默的方式,探討了AI在信息接收與輸出、不確定性降低、交互效率提升等方面的最新進(jìn)展和應(yīng)用實(shí)踐。
本來(lái)這篇文章想用《最近有關(guān)AI的感悟和總結(jié)》來(lái)做標(biāo)題的,但寫(xiě)上的時(shí)候,就感覺(jué)沒(méi)有意思,很無(wú)聊,也不夠酷。那怎么樣才能讓這篇寫(xiě)AI感悟的文章變得有趣呢?
1、得用梗圖,有了,各個(gè)領(lǐng)域的AI小助理來(lái)幫我,這可不就是專(zhuān)業(yè)團(tuán)隊(duì)嘛~
2、標(biāo)題得通俗易懂,其實(shí)分享的感悟都是AI怎么樣才能變得更好來(lái)幫助我們,也就是AI怎么樣才能支棱起來(lái)?
ok,那這就是今天的文章,我們一塊往下看!
1. 人會(huì)通過(guò)AI接收信息以及通過(guò)AI輸出信息
之前是人類(lèi)自己接收信息和輸出信息,現(xiàn)在的一個(gè)發(fā)展趨勢(shì)是人還在中間,但是我們會(huì)通過(guò)AI來(lái)接收總結(jié)的信息以及通過(guò)AI來(lái)更好、更快的輸出。
怎么形容呢?就有點(diǎn)像是之前是單層肉漢堡,現(xiàn)在還是一片肉,但是在肉的周?chē)恿藘善卟?,變成多層蔬菜肉漢堡,就像下面這張圖一樣。
來(lái)個(gè)接收信息的案例吧:谷歌的NotebookLM可以把上傳的PDF通過(guò)播客的形式對(duì)外輸出,舉個(gè)例子,這在之前是一本書(shū)在網(wǎng)上,人直接看大部頭的書(shū),現(xiàn)在AI在里面加了一道轉(zhuǎn)換,把它轉(zhuǎn)變?yōu)橛懻摃?shū)的播客,之前人們還從來(lái)沒(méi)見(jiàn)過(guò)能把書(shū)自動(dòng)轉(zhuǎn)為播客的軟件,那這個(gè)就很驚喜。
其實(shí)帶著這個(gè)思路我們可以想象有哪些可以做的嘗試,比如說(shuō)把難啃的大部頭教科書(shū)、無(wú)聊的研報(bào)或者項(xiàng)目白皮書(shū),換成一種另外一種人們有興趣的信息接收方式。
那什么形式更讓人能接受呢?視頻、音頻、圖文的信息相比于文字都更讓人可以接受,如果再考慮到適用的場(chǎng)景,那可視化圖文就是最好的方式了,因?yàn)樗m用于幾乎所有場(chǎng)景,又一目了然,napkin就在做這件事。
例如下面我想介紹napkin,然后把上面這段文字給復(fù)制進(jìn)去讓它理解,它就可以從里面找到我想對(duì)比的一個(gè)是大部頭書(shū)本的無(wú)趣,另外一個(gè)是視覺(jué)內(nèi)容的吸引力,總之,用napkin就是很搭。
輸出信息的案例:這個(gè)就比較多了,比如說(shuō)我最近在做的一個(gè)項(xiàng)目——AI報(bào)告,很多分析師需要寫(xiě)行業(yè)深度報(bào)告,這在之前可能需要分析師寫(xiě)上個(gè)好幾天來(lái)從行業(yè)簡(jiǎn)介、競(jìng)爭(zhēng)格局、行業(yè)政策這些方面輸出,但是現(xiàn)在可能AI能夠自動(dòng)收集信息來(lái)幫你實(shí)現(xiàn)這一部分的輸出總結(jié),你可以在這個(gè)基礎(chǔ)上加以人工的校驗(yàn)和修改就行了。
2. AI給出的答案是不確定的,但我們通過(guò)(prompt、流程、交互)可以把不確定性降低。
這個(gè)可以鏈接到我之前的文章:涉過(guò)真實(shí)的AI浪潮,在做AI會(huì)議助理這款產(chǎn)品的時(shí)候,就是通過(guò)類(lèi)似于建房子的方式一步步達(dá)到客戶(hù)想要的會(huì)議總結(jié)效果。
只不過(guò)對(duì)于大模型來(lái)說(shuō),提示詞寫(xiě)的好是最簡(jiǎn)單也是最有效的步驟,也是建房子的第一步,先做好地基。
第二步,往往就是微調(diào)了,微調(diào)就是在這座房子打好地基,然后砌上磚瓦后,再鋪上一層水泥,這時(shí)候就有大致的形狀了。微調(diào)會(huì)讓文本總結(jié)/生成這種更趨向于客戶(hù)想要的標(biāo)準(zhǔn),但還是存在一定的波動(dòng)和不確定。
第三步,有些房子的形狀我就是想這樣或者是那樣!比如我就想要中式建筑的屋頂,或者西式建筑的穹頂,這樣才好看,才是我的style。ok,滿(mǎn)足你,這里就是固定的流程,可能就是結(jié)合了簡(jiǎn)單的程序,比如固定取數(shù)和固定生成某段文字(例如財(cái)報(bào)會(huì)議中的數(shù)據(jù)整理)。
3. 單從效率來(lái)看,文字對(duì)話(huà)的反饋還是太慢了
就說(shuō)一個(gè)體驗(yàn)上的問(wèn)題,你吭哧吭哧打字半天,然后點(diǎn)擊發(fā)送,再接著等AI的反饋,如果再碰到慢AI,一來(lái)一回都5秒有了吧,而語(yǔ)音交互這一塊反饋就及時(shí)多了。
人類(lèi)之間的對(duì)話(huà)也更傾向于語(yǔ)音對(duì)話(huà),就像在工作中,我們遇到緊急問(wèn)題還是會(huì)用電話(huà)甚至線(xiàn)下見(jiàn)面說(shuō)。
很多AI情感陪伴類(lèi)的app都有打語(yǔ)音視頻這個(gè)功能,而且沒(méi)準(zhǔn)還是收費(fèi)的。這也側(cè)面驗(yàn)證了語(yǔ)音對(duì)話(huà)這個(gè)功能,相比聊天打字還是體驗(yàn)更好的,不然誰(shuí)會(huì)付費(fèi)啊。
近期一些大廠AI app在語(yǔ)音對(duì)話(huà)上也開(kāi)始有動(dòng)作了,例如豆包的語(yǔ)音對(duì)話(huà),現(xiàn)在就可以聯(lián)網(wǎng)搜索一些話(huà)題,阿里的通義現(xiàn)在可以在語(yǔ)音聊天的同時(shí)上傳文件對(duì)話(huà),而最早的場(chǎng)景英語(yǔ)口語(yǔ)助教更是每家必有。
那有沒(méi)有一種更快的交互方式呢?有的,一種就是我們每天都在用的觸摸和點(diǎn)擊這種(其實(shí)互聯(lián)網(wǎng)時(shí)代的觸摸點(diǎn)擊給出反饋是快于語(yǔ)音交互的);另外一種可能就是腦機(jī)交互了,等待馬斯克這些大佬去突破了。
4. AI時(shí)代最有想象力的產(chǎn)品——畫(huà)布
畫(huà)布可以容納和承載幾乎所有內(nèi)容形式:文字、表格、圖片、音頻甚至是視頻,而AI又可以全部生成以上內(nèi)容形式,所以理論上AI+畫(huà)布的上限是無(wú)窮高的(max)。
鋼鐵俠和賈維斯對(duì)話(huà)也是在一個(gè)畫(huà)布/面板上(咳…鋼鐵俠的頭盔面板),上面可以實(shí)時(shí)反饋出任何信息。我還有一個(gè)臆想,我想讓AI在畫(huà)布上復(fù)刻一個(gè)二維地球,上面會(huì)無(wú)限平鋪所有地球上的三維物體。對(duì)!那這個(gè)畫(huà)布就是《三體》里面的二向箔。
百度文庫(kù)也在近期宣布將上線(xiàn)“自由畫(huà)布”這一款軟件,但一直處于內(nèi)測(cè)中,也沒(méi)有人體驗(yàn)到。其實(shí)AI畫(huà)布這種產(chǎn)品技術(shù)上實(shí)現(xiàn)可能難度為3顆星,但是算力消耗應(yīng)該是最高的5顆星;多模態(tài)對(duì)于算力消耗巨大,估計(jì)目前也只有大廠能燒得起了。
5. AI也得揣摩人類(lèi)甲方的意圖
又懶又不想多打字的人類(lèi),你不多揣測(cè)一下它想問(wèn)的是什么意思,怎么可能答的好?肯定會(huì)給你差評(píng)的!
這個(gè)我調(diào)研過(guò)chat類(lèi)問(wèn)答的用戶(hù)數(shù)據(jù),你會(huì)發(fā)現(xiàn),能夠問(wèn)問(wèn)題超過(guò)10個(gè)字的已經(jīng)很牛了,因?yàn)橛幸话氲娜藛?wèn)問(wèn)題都不超過(guò)10個(gè)字的,我稱(chēng)之為“打字要錢(qián)型用戶(hù)”,當(dāng)然我也是其中一員,10個(gè)字符以?xún)?nèi)一般能問(wèn)啥問(wèn)題呢?我舉個(gè)例子:
- 你今天吃了沒(méi)?(7個(gè)字)
- 總結(jié)這個(gè)報(bào)告(6個(gè)字)
- 寫(xiě)一份小紅書(shū)營(yíng)銷(xiāo)文案(10個(gè)字)
這3個(gè)例子,大家就應(yīng)該明白,我們大部分人讓AI辦事都是妥妥的大甲方。AI需要根據(jù)這些僅有的只言片語(yǔ),來(lái)完成你給它布置的模棱兩可的任務(wù),如果AI不能滿(mǎn)足你的期待,你就會(huì)像上面一樣給它來(lái)個(gè)差評(píng)——點(diǎn)踩。
所以,AI還是需要會(huì)一點(diǎn)讀心術(shù)的,通過(guò)簡(jiǎn)簡(jiǎn)單單的幾個(gè)字就能讀懂你我的心,知道我們想干嘛,這才是支棱起來(lái)(終于扣題了)的AI,也是我們最喜歡的乙方和員工。
寫(xiě)這一點(diǎn)也是因?yàn)樵谑忻嫔衔乙呀?jīng)看到有比較好的產(chǎn)品案例了,螞蟻的支小助就是這樣一個(gè)能懂你心的AI助理。
因?yàn)楣ぷ髟?,我可能用的投研支小助?huì)比較多(還有其他類(lèi)型,例如保險(xiǎn)、營(yíng)銷(xiāo)、理財(cái)?shù)模?,比如我?wèn)它:A股最近怎么樣?(8個(gè)字)
其實(shí)這問(wèn)題要是別人問(wèn)我,我肯定會(huì)回答:什么怎么樣?你說(shuō)大盤(pán)走勢(shì)嗎,上周的,還是最近一個(gè)月的?很模糊的問(wèn)題,我都搞不懂你想問(wèn)的啥?
支小助這個(gè)會(huì)懂你心的AI助手,就會(huì)把“A股最近怎么樣?”這個(gè)問(wèn)題再“揣摩”一下,解讀出6個(gè)相關(guān)的問(wèn)題,如果你覺(jué)得它揣摩的不對(duì),你還可以幫它改,相當(dāng)于跟員工說(shuō):不是你想的這樣,你得先這樣,然后再那樣…
之后再根據(jù)“揣摩”出來(lái)的6個(gè)解讀,集中回答你的問(wèn)題,所以就會(huì)比較全面,因?yàn)檫@6個(gè)解讀總有一款適合你。
當(dāng)然,一個(gè)硬幣有正反兩面——回答也就比較長(zhǎng),不夠簡(jiǎn)短,你問(wèn)它“1+1等于幾”,支小助可能會(huì)給你扯出“1+1的哲學(xué)意義、1+1=2的數(shù)學(xué)原理”,所以也就有了快速解讀這樣一個(gè)功能。
按照支小助官方的解釋就是,支小助內(nèi)部嵌有很多的專(zhuān)家框架。它會(huì)根據(jù)你提問(wèn)的問(wèn)題去匹配對(duì)應(yīng)的框架,例如剛才問(wèn)的A股的問(wèn)題,就會(huì)匹配股票分析、市場(chǎng)分析下面很多對(duì)應(yīng)的框架。
這些框架你可以把它們理解為一個(gè)個(gè)專(zhuān)業(yè)的老師,當(dāng)你帶著同樣一個(gè)問(wèn)題比如:我該怎樣好好學(xué)習(xí),天天向上呢?
去問(wèn)各科老師,那英語(yǔ)老師就會(huì)說(shuō):你肯定要學(xué)好英語(yǔ)啊,學(xué)好英語(yǔ)才能看到更大的世界!數(shù)學(xué)、物理、化學(xué)老師齊刷刷的說(shuō):學(xué)好數(shù)理化,走遍天下都不怕!
所以支小助內(nèi)部其實(shí)是有一個(gè)專(zhuān)業(yè)團(tuán)隊(duì)在做事情,怎么能不強(qiáng)大呢?
如果你喜歡這種有趣又帶有干貨的文章,不要忘了點(diǎn)贊加關(guān)注,我們下一篇再見(jiàn)!
本文由 @雨辰的夢(mèng)語(yǔ) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)
AI如何支棱起來(lái)?不斷學(xué)習(xí),深度訓(xùn)練,創(chuàng)新應(yīng)用,AI的潛力無(wú)窮無(wú)盡!
通過(guò)具體的案例來(lái)展示AI的實(shí)際應(yīng)用,比如你提到的谷歌NotebookLM,可以更詳細(xì)地描述這個(gè)案例,讓讀者感受到AI的實(shí)際價(jià)值。