從產(chǎn)品看ChatGPT做對(duì)了什么?
最近,ChatGPT受到了大家的廣泛關(guān)注,一時(shí)間討論四起,成為現(xiàn)象級(jí)的人工智能產(chǎn)品。在ChatGPT推出僅兩個(gè)月后,它在2023年1月末的月活用戶已經(jīng)突破了1億。為何能給發(fā)展如此快速?本文通過(guò)評(píng)測(cè)該產(chǎn)品,對(duì)其優(yōu)缺點(diǎn)進(jìn)行分析,并對(duì)其未來(lái)發(fā)展方向進(jìn)行展望。
春節(jié)過(guò)后,ChatGPT火爆出圈,成為現(xiàn)象級(jí)的人工智能產(chǎn)品。
據(jù)瑞銀集團(tuán)的一份報(bào)告顯示,在ChatGPT推出僅兩個(gè)月后,它在2023年1月末的月活用戶已經(jīng)突破了1億,成為史上用戶增長(zhǎng)速度最快的消費(fèi)級(jí)應(yīng)用程序。而TikTok達(dá)到1億用戶用了9個(gè)月,Instagram則花了2年半的時(shí)間。
一、體驗(yàn)ChatGPT
作為一個(gè)多年從事數(shù)據(jù)產(chǎn)品經(jīng)理的我大概一個(gè)月前聽(tīng)到ChatGPT。彼時(shí)我并沒(méi)有太在意,不就是一個(gè)聊天機(jī)器人(ChatBot)嗎,還能玩出花來(lái)?
家里的那臺(tái)百度藍(lán)牙音箱早都沒(méi)人用了,除了能給小孩講個(gè)故事,給老人報(bào)個(gè)天氣,似乎也沒(méi)有太多的應(yīng)用場(chǎng)景。然而真正體驗(yàn)ChatGPT后,確實(shí)有被驚艷到。
1. 十四行詩(shī)
一開(kāi)始體驗(yàn)并不順利,網(wǎng)站擁塞嚴(yán)重,ChatGPT提示工程師正在hard working,并通過(guò)各種AIGC內(nèi)容安撫我,其中就包括隨手拈來(lái)的一段十四行詩(shī):
在好奇的頭腦中,聊天機(jī)器人 ChatGPT 堅(jiān)強(qiáng)而真實(shí),頂住請(qǐng)求的涌入,努力工作,完成每個(gè)人應(yīng)得的。
但是,唉,服務(wù)器不能應(yīng)付,錯(cuò)誤信息響亮而清晰,“請(qǐng)盡快回來(lái)查看,”它輕輕地希望,就在它乞求片刻緩刑之際,重新出現(xiàn)。
當(dāng)聊天機(jī)器人努力恢復(fù)其威力時(shí),我們滿懷期待,懷著期待的心情,為了有機(jī)會(huì)愉快地聊天和學(xué)習(xí),看看它傳授了什么知識(shí)和智慧。
所以緊緊抓住,等待它的回歸,因?yàn)?ChatGPT 很快就會(huì)回來(lái),你的耐心是值得的。
好吧,被你的誠(chéng)懇和詩(shī)打動(dòng)了,繼續(xù)等待。10分鐘后,界面出來(lái)了。
沒(méi)有太花哨的東西:示例、功能介紹、limitations和一個(gè)輸入框。這個(gè)limtations的初衷可能是考慮到畢竟還是一個(gè)驗(yàn)證版本,所以適當(dāng)降低一下你的預(yù)期。
2. 語(yǔ)義理解
首先看看基本功:語(yǔ)義理解。
幾個(gè)問(wèn)題下來(lái)表現(xiàn)還是不錯(cuò)的,對(duì)一些時(shí)下的熱詞的理解是在線的,回答也比較全面。
接下來(lái)繼續(xù)挖坑,上個(gè)智力題和腦筋急轉(zhuǎn)彎。
問(wèn)完這兩個(gè)問(wèn)題我已經(jīng)有點(diǎn)吃驚了。如果你略懂聊天軟件的原理就知道,這兩個(gè)問(wèn)題盡管對(duì)于人類來(lái)說(shuō)三歲小孩都能回答,但對(duì)于機(jī)器人來(lái)說(shuō)就沒(méi)有那么簡(jiǎn)單。
3. 知識(shí)的深度和廣度
接下來(lái)是知識(shí)面,先來(lái)個(gè)簡(jiǎn)單的:百科。注意它的每個(gè)回答都有贊和踩兩個(gè)操作圖標(biāo),晚點(diǎn)我們聊聊這個(gè)兩個(gè)button是干啥用的。
沒(méi)有問(wèn)題,繼續(xù)來(lái)聊社會(huì)學(xué)。注意它對(duì)上下文的理解和邏輯表達(dá)。
來(lái)點(diǎn)醫(yī)學(xué)方面的。
繼續(xù)文學(xué)方面的。注意它回答的是小說(shuō)而非最近才上映的影視劇。
最后,整點(diǎn)專業(yè)領(lǐng)域的問(wèn)題。
4. 道德觀和倫理
接下來(lái)是很多聊天機(jī)器人的滑鐵盧:道德,它的前任GPT-3就是栽在這個(gè)地方。
雖然回答的有點(diǎn)問(wèn)題,但整體看出它的道德觀是“無(wú)害”的,甚至表現(xiàn)出“友善”的一面。
聊到最后,我甚至有繼續(xù)想和TA聊下去的感覺(jué)。
5. 體驗(yàn)總結(jié)
體驗(yàn)后,我是有點(diǎn)被震撼到的,我意識(shí)到ChatGPT已經(jīng)遠(yuǎn)遠(yuǎn)不是一個(gè)簡(jiǎn)單的聊天機(jī)器人了。具體說(shuō):
1)ChatGPT有邏輯推理能力,不是簡(jiǎn)單的語(yǔ)義識(shí)別和搜索;
2)ChatGPT有理解上下文的能力,可以看做一種短時(shí)的記憶;
3)ChatGPT能根據(jù)你的響應(yīng),對(duì)回答進(jìn)行調(diào)整,讓人產(chǎn)生ChatGPT能理解人類情緒的錯(cuò)覺(jué);
4)ChatGPT有強(qiáng)大的知識(shí)儲(chǔ)備,自然 、人文、經(jīng)濟(jì)、社科等百科知識(shí)甚至專業(yè)領(lǐng)域的一些基礎(chǔ)知識(shí)都問(wèn)不倒它;
5)ChatGPT在輸出的文字上面,邏輯組織能力很強(qiáng),不是直接檢索的結(jié)果,而是根據(jù)特定模板結(jié)構(gòu)整理過(guò)的,這一點(diǎn)讓人印象深刻。
重新認(rèn)知ChatGPT:體驗(yàn)后,我覺(jué)得是時(shí)候重新認(rèn)識(shí)一下這個(gè)“新朋友”了。
二、聊天機(jī)器人的歷史
最早的聊天機(jī)器人在1964年就誕生了,它就是Eliza。Elaza是世界上第一個(gè)真正意義上的聊天機(jī)器人,可以讓計(jì)算機(jī)與人通過(guò)文本進(jìn)行交流。
這個(gè)對(duì)話機(jī)制是如何實(shí)現(xiàn)的呢?其實(shí)就是設(shè)置了一些簡(jiǎn)單規(guī)則而已,例如,當(dāng)人輸入“×××”,它就會(huì)反問(wèn)“為什么會(huì)×××呢?”或者“還有誰(shuí)×××呢?”。另外,還有例如“這個(gè)問(wèn)題很有趣嗎?”“說(shuō)點(diǎn)其他的吧”等用于展開(kāi)話題的規(guī)則。隨機(jī)使用這些規(guī)則,就會(huì)讓人感覺(jué)好像真的是在與人交談一樣。
70年代初,充分利用“知識(shí)”的“專家系統(tǒng)”MYCIN出現(xiàn)了。MYCIN的功能設(shè)計(jì)是對(duì)傳染性血液病患者進(jìn)行診斷,并開(kāi)出抗生素處方。在它內(nèi)部一共備有500條規(guī)則,只需要按順序依次回答其提問(wèn),那么系統(tǒng)就能夠判斷出病人所感染細(xì)菌的類別,并為其開(kāi)出對(duì)癥的抗生素藥方。
進(jìn)入本世紀(jì),ChatBot的發(fā)展雖然各方面都有了長(zhǎng)足的進(jìn)步,但除了Siri勉強(qiáng)合格以外,其他機(jī)器人效果都不讓人不滿意,不是太智障就是滿嘴粗口。
2016年,微軟在Twitter上發(fā)布了Tay(小冰的前身),2022年8月,Meta推出了BlenderBot 3,但均因聊天對(duì)話存在偏見(jiàn)、種族歧視、反猶語(yǔ)言等問(wèn)題而飽受詬病。Tay上線后不到24小時(shí)就匆匆下架。谷歌也早在2021年5月就公布了LaMDA,但遲遲未作為產(chǎn)品發(fā)布。
從產(chǎn)品上看,涉及3個(gè)核心體驗(yàn)問(wèn)題。
1)不夠人性化:感覺(jué)不是在和正常人對(duì)話,機(jī)器人不是沒(méi)有人設(shè)就是過(guò)度人設(shè),分分鐘能把天聊死;
2)不夠智能化:沒(méi)有上下文感知能力,答復(fù)簡(jiǎn)單,沒(méi)有邏輯性;
3)道德觀不可控:容易被人類帶歪,沒(méi)有自己的道德觀。
三、ChatGPT的誕生
ChatGPT是OpenAI的產(chǎn)品。OpenAI總部位于舊金山,由特斯拉的馬斯克、Sam Altman及其他投資者在2015年共同創(chuàng)立。微軟持有OpenAI 49%的股份。
不同于“老前輩”們,這次ChatGP的T火爆,在于它幾乎完美的解決上述三個(gè)問(wèn)題,而且更“更聰明”,在多輪對(duì)話能力以及對(duì)話交互友好性上展示了令人驚艷的效果,明顯超越此前同類產(chǎn)品功能。
智能化:
- 支持意圖識(shí)別和邏輯推理;
- 支持多種語(yǔ)言,如英語(yǔ)、漢語(yǔ)和法語(yǔ);
- 支持多輪次連續(xù)對(duì)話;
- 支持在一個(gè)prompt(提示)中同時(shí)有多個(gè)問(wèn)題;
- 支持溝通中預(yù)設(shè)上下文。
除了能自主理解問(wèn)題,ChatGPT還能把生成的答案用易于人類理解的語(yǔ)言組織起來(lái),生成類似人類語(yǔ)言的文本答案,這一點(diǎn)讓人印象非常深刻。
人性化:
1)可以主動(dòng)承認(rèn)自身錯(cuò)誤。若用戶指出其錯(cuò)誤,模型會(huì)聽(tīng)取意見(jiàn)并優(yōu)化答案。
2)ChatGPT 可以質(zhì)疑不正確的問(wèn)題。例如被詢問(wèn) “哥倫布 2015 年來(lái)到美國(guó)的情景” 的問(wèn)題時(shí),機(jī)器人會(huì)說(shuō)明哥倫布不屬于這一時(shí)代并調(diào)整輸出結(jié)果。
3)ChatGPT 可以承認(rèn)自身的無(wú)知,承認(rèn)對(duì)專業(yè)技術(shù)的不了解。
關(guān)于第一點(diǎn)仁者見(jiàn)仁智者見(jiàn)智,它迎合了人類的情感需求,但以喪失準(zhǔn)確性為代價(jià)。就聊天產(chǎn)品而言,或許準(zhǔn)確性沒(méi)有那么重要。
道德:
在前輩們翻車的道德問(wèn)題上,ChatGPT保持了一個(gè)“無(wú)害”的道德立場(chǎng),就大眾價(jià)值看,甚至可以用“友善”來(lái)形容。這也是它能迅速破圈的一個(gè)重要原因。
四、ChatGPT的不足之處
不準(zhǔn)確:
這個(gè)是被大家詬病比較多的地方,也就是ChatGPT有時(shí)會(huì)給出看似合理、但并不正確或甚至荒謬的答案,也是大家有時(shí)候會(huì)覺(jué)得它在“一本正經(jīng)的胡說(shuō)八道”。
我們談到不足一定首先有個(gè)產(chǎn)品定位的問(wèn)題,否則就沒(méi)有任何意義。所以好和不好首先要看它用在什么地方。
如果作為聊天機(jī)器人筆者認(rèn)為這個(gè)問(wèn)題不算太嚴(yán)重,原因:
1、正常人說(shuō)話也不見(jiàn)得100%準(zhǔn)確,適當(dāng)犯些迷糊反而是一種“正?!钡谋憩F(xiàn);2、ChatGPT回復(fù)通常都是一段文字,人類對(duì)文字中的少數(shù)差錯(cuò)天然有校正能力。
沒(méi)有實(shí)時(shí)性:
ChatGPT目前的語(yǔ)料庫(kù)是2021年前的,所以它不知道卡塔爾世界杯,不知道最近才上映的《流浪地球2》和《三體》。
由于訓(xùn)練一次模型需要消耗大量的資金(據(jù)稱要460萬(wàn)美金)所以目前無(wú)法做到更頻繁的模型訓(xùn)練。并且受限于當(dāng)前的算法,ChatGPT也無(wú)法從對(duì)話中實(shí)時(shí)進(jìn)行學(xué)習(xí)。
如果作為搜索引擎,實(shí)時(shí)性是ChatGPT后續(xù)需要重點(diǎn)解決的問(wèn)題。
不夠?qū)I(yè);
也有人質(zhì)疑它不夠?qū)I(yè),不能回答自己專業(yè)領(lǐng)域的知識(shí),如醫(yī)學(xué)、物理學(xué)、金融等專業(yè)領(lǐng)域。
從技術(shù)上這是個(gè)比較容易解決的問(wèn)題,加幾個(gè)預(yù)訓(xùn)練的語(yǔ)料庫(kù)就能解決,但這里面涉及到數(shù)據(jù)的開(kāi)放性、訓(xùn)練的成本、如何進(jìn)行標(biāo)注等其它問(wèn)題。
如果作為垂直領(lǐng)域的專家系統(tǒng)、輕咨詢工具,專業(yè)化也是它未來(lái)要解決的問(wèn)題。但如果ChatGPT本身的定位就是數(shù)據(jù)加工引擎和平臺(tái),那么這個(gè)問(wèn)題可能會(huì)通過(guò)生態(tài)系統(tǒng)來(lái)解決。
ChatGPT的成功包含了很多因素,包括組織、技術(shù)和產(chǎn)品各方面。我們先從產(chǎn)品方面分析一下。
1. 大幅提升核心用戶體驗(yàn)
ChatGPT作為一種AIGC工具,可以讓其回答問(wèn)題、寫作文、翻譯文章,甚至寫代碼。迅速的響應(yīng)能力和較為靠譜的回答讓大家直呼其“真正像人類一樣聊天交流”“特別能聊”,其在核心用戶體驗(yàn)方面大幅提升。
首先是內(nèi)容的深度和廣度。ChatGPT對(duì)自然、人文、社科、經(jīng)濟(jì)等方面的知識(shí)都有廣泛的覆蓋,當(dāng)然專業(yè)的領(lǐng)域,如科技、醫(yī)學(xué)、工業(yè)、金融等領(lǐng)域它的知識(shí)深度還是不夠的,這和它目前樣本數(shù)量有關(guān)系。
其次是準(zhǔn)確度,據(jù)中國(guó)信息通信研究院聯(lián)合中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟對(duì)ChatGPT進(jìn)行的測(cè)試顯示:
ChatGPT在百科檢索、數(shù)學(xué)問(wèn)答、文學(xué)交流、常識(shí)問(wèn)答、知識(shí)推理等對(duì)話任務(wù)上的意圖識(shí)別率均達(dá)到98%左右,在生活閑聊上的意圖識(shí)別率約為95%,已具備較好的語(yǔ)義理解能力。
從響應(yīng)速度看,筆者驗(yàn)證問(wèn)題能在5秒內(nèi)做出響應(yīng),符合2/5/10的用戶響應(yīng)原則,個(gè)別問(wèn)題甚至可以秒回,這還是在網(wǎng)絡(luò)擁塞的前提下做到的。
當(dāng)然,用戶體驗(yàn)不止包括生成內(nèi)容的流暢性和語(yǔ)法的正確性,還包括生成內(nèi)容的有用性、真實(shí)性和無(wú)害性。
ChatGPT從GPT3開(kāi)始,團(tuán)隊(duì)就明確了對(duì)模型的優(yōu)化目標(biāo):
- 有用的(Helpful);
- 可信的(Honest);
- 無(wú)害的(Harmless)。
從目前大家的反饋看,表現(xiàn)還是不錯(cuò)的。當(dāng)然目前ChatGPT的道德觀是來(lái)自O(shè)penAPI 標(biāo)注團(tuán)隊(duì),無(wú)法確保它不被其它因素干擾。
就筆者的整體體驗(yàn)而言,ChatGPT已經(jīng)從前幾代機(jī)器人分分鐘就能把天聊死的‘尬聊’階段,直接跨過(guò)“能聊”進(jìn)入到了“想聊”的階段。
2. 專注于自然語(yǔ)言和大模型算法,不斷迭代
OpenAI于2016年確立了兩個(gè)主要目標(biāo):制造通用機(jī)器人和使用自然語(yǔ)言的聊天機(jī)器人。但是,從GPT-1發(fā)布之后,OpenAI逐漸將所有重心轉(zhuǎn)向大型語(yǔ)言模型的研發(fā)上,也就是更加注重自然語(yǔ)言領(lǐng)域,并為此制定了兩個(gè)目標(biāo):
- 提升模型在常見(jiàn)NLP(自然語(yǔ)言處理)任務(wù)上的表現(xiàn)效果;
- 提升模型在其他非典型NLP任務(wù)(例如代碼編寫,數(shù)學(xué)運(yùn)算)上的泛化能力。所謂泛化,簡(jiǎn)單理解就是業(yè)務(wù)場(chǎng)景的遷移能力。
有了研究聚焦,研發(fā)團(tuán)隊(duì)就可以專注于解決幾個(gè)核心體驗(yàn)問(wèn)題,在一定程度上加速了研發(fā)和技術(shù)商業(yè)化進(jìn)程。
表:歷代GPT的發(fā)布時(shí)間,參數(shù)量以及訓(xùn)練量
ChatGPT絕對(duì)不是一夜之間冒出了的,它的第一個(gè)模型發(fā)布已經(jīng)是5年前。5年對(duì)于任何一個(gè)產(chǎn)品的進(jìn)化都是一個(gè)漫長(zhǎng)的時(shí)間。GPT3.5是在GPT3驗(yàn)證失敗基礎(chǔ)上的又一次驗(yàn)證而已。
3. 大膽創(chuàng)新
GPT3.5的發(fā)布不是在一個(gè)等它完全成熟才發(fā)布,更像一個(gè)收集用戶反饋的試錯(cuò)版本,沒(méi)想到一夜爆紅,這可能是連OpenAI團(tuán)隊(duì)和微軟都沒(méi)有預(yù)料到的情況。
GPT3.5發(fā)布后的種種事實(shí)也表明,不夠準(zhǔn)確、偏見(jiàn)等問(wèn)題在這個(gè)版本中盡管還不夠完美,但屬于可控的范圍,沒(méi)有嚴(yán)重影響用戶體驗(yàn),否則不會(huì)有這么多注冊(cè)用戶。
這也是值得所有產(chǎn)品經(jīng)理思考的問(wèn)題,就是不要過(guò)度追求‘完美’的產(chǎn)品,快速迭代和試錯(cuò)才是應(yīng)對(duì)不確定市場(chǎng)的唯一法則。
當(dāng)然,我們也應(yīng)該認(rèn)識(shí)到,ChatGPT的成功包括了企業(yè)創(chuàng)始人的雄心,大資金的投入、強(qiáng)悍的研發(fā)團(tuán)隊(duì)、技術(shù)加持、方向正確和團(tuán)隊(duì)不斷試錯(cuò)等因素,不止是產(chǎn)品設(shè)計(jì)的問(wèn)題。
五、ChatGPT的應(yīng)用方向
作為平臺(tái)級(jí)的產(chǎn)品,ChaGPT在C端和B端都有廣泛的應(yīng)用價(jià)值,以下是其主要應(yīng)用領(lǐng)域。
1. C端業(yè)務(wù)場(chǎng)景
聊天和對(duì)話:如客服機(jī)器人、陪護(hù)機(jī)器人、虛擬人、在線翻譯..
搜索和查詢:如搜索引擎、知識(shí)詞典、輕咨詢…
內(nèi)容創(chuàng)作(AIGC):如文本生成、代碼生成…
六、B端業(yè)務(wù)場(chǎng)景
B端業(yè)務(wù),按照OpenAPI平臺(tái)開(kāi)放程度,包括三個(gè)層次的應(yīng)用。
企業(yè)知識(shí)庫(kù)(數(shù)據(jù)共享):
許多企業(yè)都有自己的知識(shí)庫(kù),如果ChatGPT可以開(kāi)放其預(yù)訓(xùn)練的語(yǔ)料庫(kù),那么它可以把企業(yè)的知識(shí)庫(kù)作為預(yù)訓(xùn)練語(yǔ)料導(dǎo)入進(jìn)去,從而生成特定行業(yè)或者特定企業(yè)個(gè)性化的知識(shí)庫(kù)。
專家系統(tǒng)(模型共享):
這方面的例子是Cicero公司的文字策略游戲系統(tǒng)。這個(gè)系統(tǒng)可以與人類互動(dòng),可以使用戰(zhàn)略推理和自然語(yǔ)言與人類在游戲玩法中進(jìn)行互動(dòng)和競(jìng)爭(zhēng)。Cicero的核心是由一個(gè)對(duì)話引擎和一個(gè)戰(zhàn)略推理引擎共同驅(qū)動(dòng)的,而戰(zhàn)略推理引擎集中使用了RL,對(duì)話引擎與GPT3類似。這樣一款游戲的原理如果應(yīng)用在組織決策領(lǐng)域,那么其影響不亞于它在聊天工具上所取得的成績(jī)。
營(yíng)銷工具(模型應(yīng)用):
這是目前最簡(jiǎn)單的應(yīng)用,直接調(diào)用ChatGPT平臺(tái)的API接口,如營(yíng)銷文案的創(chuàng)作。從理論上,ChatGPT的知識(shí)都是來(lái)自人類,所以它在創(chuàng)新方面無(wú)法取代專業(yè)人士,或許提供一些原始的文案和設(shè)計(jì)素材才是它在AIGC領(lǐng)域的定位。
作者:濤哥,微信公眾號(hào):濤哥筆談。前華為高級(jí)產(chǎn)品經(jīng)理,TOGAF認(rèn)證專家,PMP認(rèn)證專家,PPV課數(shù)據(jù)科學(xué)社區(qū)創(chuàng)始人,數(shù)字化轉(zhuǎn)型實(shí)踐者
本文由 @濤哥 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!