零基礎(chǔ)5分鐘搭建一個(gè)私有知識的AI機(jī)器人,接入微信、抖音和飛書
現(xiàn)在,許多企業(yè)都開始借助AI技術(shù)來提高自己的生產(chǎn)效率,那么在了解了AI的強(qiáng)大之后,我們是否有可能搭建一個(gè)專屬于自己的AI機(jī)器人呢?這篇文章里,作者便嘗試教你零基礎(chǔ)學(xué)會搭建,一起來看看吧。
AI 這么強(qiáng),你或者你的公司一定想有一個(gè)專屬的機(jī)器人。
就是那種問它問題,它回答像 ChatGPT 一樣流暢,但回答的內(nèi)容是關(guān)于你或者公司的業(yè)務(wù)介紹。
但是看了一些資料后,都被里面那個(gè)“向量[1]知識庫”給勸退了。
這篇文章,只會提三次“向量[2]”(最后一次在文末)。
我們先講一下原理:怎么讓 AI 機(jī)器人回答問題的時(shí)候,回復(fù)跟你自己/你公司相關(guān)的信息。
當(dāng)你正常問 ChatGPT 問題時(shí),它是這么干活的:
你:張佳是誰?
ChatGPT OS:(把你的問題拆開,“張佳”“是誰”)—>(理解到你想問一個(gè)名字叫“張佳”的人)—>(在大模型里匹配查找關(guān)于“張佳”的信息)—>(沒找到“張佳”)—>(決定糊弄一下)
ChatGPT:很抱歉,根據(jù)我的知識截止日期(2021年9月),我無法提供有關(guān)”張佳”的具體信息,因?yàn)檫@個(gè)名字可能屬于普通的中國姓名,涵蓋了許多不同的個(gè)體。如果你能提供更多上下文或信息,我將盡力提供更準(zhǔn)確的答案。
但是如果你這樣問 ChatGPT:
你:張佳是誰?請根據(jù)以下信息,整理成通俗易懂的介紹,告訴我:張佳,咨詢顧問,句子互動(dòng) CMO&解決方案專家,TOP1 醫(yī)療健康MCN運(yùn)營VP,新榜高級咨詢顧問,專欄作家,《短視頻內(nèi)容算法》作者。在私域、流量、運(yùn)營、數(shù)據(jù)和產(chǎn)品方面有豐富的經(jīng)驗(yàn),深諳商業(yè)邏輯,可以為個(gè)人和企業(yè)提供非常棒的解決方案和 idea。持續(xù)關(guān)注最新趨勢、最新玩法,希望每個(gè)人都能先進(jìn)。
ChatGPT OS:(拆解問題:給了個(gè)提問,給了參考答案,讓我根據(jù)參考答案整理一個(gè)個(gè)人介紹)—>(這是個(gè)文本編輯題)—>(說點(diǎn)好聽的給他)
ChatGPT:張佳是一位……他在……他擅長……總之,……。
看出第二次提問和第一次提問的區(qū)別了么?
這就是打造個(gè)人/企業(yè)專屬知識 ChatGPT 的精髓所在。
你會問了:我怎么讓用戶提問問題的時(shí)候帶著你說的那些資料???
想要打造一個(gè)專屬對話機(jī)器人,我們需要先“劫持”一個(gè)機(jī)器人,也就是在用戶問它問題之后,它帶著問題去問大模型之前,在傳輸?shù)男畔⑸蟿?dòng)點(diǎn)手腳。
我畫了一個(gè)圖,你大概就理解了:
所以,想要打造一個(gè)私有/企業(yè)專屬的 ChatGPT,你應(yīng)該有一些可以加到用戶問題后面作為參考資料的知識庫。
這個(gè)知識庫可以是一些個(gè)人、公司、產(chǎn)品的介紹文檔,也可以是一些 QA 問題庫,或者你的客服應(yīng)答用戶的聊天記錄。
接下來,你需要把這些知識資料拆成一段一段的,盡量保證是「一個(gè)問題+一段答案」,或者一段一段的「概念描述或介紹」性的文字。
因?yàn)槲覀冎?,AI 的對話都是有字?jǐn)?shù)限制的,太多了 AI 處理不了或者容易整不明白,并且我們調(diào)用人家的大模型,是按照字?jǐn)?shù)收費(fèi)的。(如果你以前不知道,現(xiàn)在已經(jīng)知道了)
所以每次發(fā)給大模型的文字盡量少一點(diǎn),拆完了大概是這樣的:
然后我們只需要再解決一個(gè)問題:用戶發(fā)過來的問題,我們識別出來以后,在拆好的一段段文字中找到最相關(guān)的,加到用戶的問題后面發(fā)給大模型就好了。
原理搞明白了吧?
摩拳擦掌,開搞!
這里推薦一個(gè)已經(jīng)相對成熟、應(yīng)用范圍比較廣的國產(chǎn)“玩具”
大概花 5 分鐘就能拍桌子大呼:“我自己真牛逼”。
網(wǎng)址在這里:https://chato.cn
注冊完進(jìn)去以后就會讓你創(chuàng)建個(gè)機(jī)器人,選 AI 創(chuàng)建。
相信我,AI 創(chuàng)建的比你自己琢磨的要牛逼。
把角色名起,寫一下希望這個(gè)機(jī)器人完成的事,簡單一倆關(guān)鍵詞就好了,剩下的等 AI 給你輸出。
創(chuàng)建完以后,其他的先不用管,直接進(jìn)入知識庫。
這里支持兩種方式:問答式和文檔式。
「錄入問答」這種機(jī)械性的工作咱不干,直接選文檔式。
文檔式有三種選擇:第一種是你有現(xiàn)成的文檔,支持 N 多文檔格式(連epub都有,擺明了讓你上傳電子書);第二種是輸入文檔,手打編輯復(fù)制粘貼這樣,上限 10 萬字。前兩種你上傳完成以后系統(tǒng)自己給你分段,你決定不了啥,只能隨緣(Chato 的 PM 看到以后加個(gè)班)。第三種就“硬核”一點(diǎn)了,直接粘貼網(wǎng)址,它直接幫你采集(違法抓你不抓他們)。
我這里把白皮書里《如何使用企業(yè)微信添加客戶為好友》的一篇文檔上傳到知識庫了。
然后等著機(jī)器人來學(xué)習(xí),說是 5-10 分鐘,如果字?jǐn)?shù)不多一兩分鐘就完事。點(diǎn)擊上面的聊天演示就可以測試一下 AI 的能力了。
問了一個(gè)“知識庫”里有答案的問題,AI 的回答基本上就是一個(gè)“抄”。
測試差不多,現(xiàn)在可以把我們的私有機(jī)器人拉出去溜溜了。
之所以給大家用這個(gè)玩具來展示,是因?yàn)樗梢越尤氲狡渌恢梅浅1憬?。你可以把它嵌入到你現(xiàn)成的網(wǎng)頁里,比如官網(wǎng);可以接入到企業(yè)微信賬號上,拉到你們的企業(yè)微信群中;也可以嵌入進(jìn)公眾號、飛書機(jī)器人、微信客服和抖音私信!
基本都是手把手配置,復(fù)制粘貼一些 ID 和密鑰就可以直接用的狀態(tài)。
我來展示兩個(gè):
比如我有一個(gè)官網(wǎng),它長下面的樣子:
我想在官網(wǎng)里接入這個(gè)機(jī)器人,只需要把他們提供的代碼,復(fù)制粘貼到我的官網(wǎng)代碼里即可(給大家看源代碼了,證明它不是 PS 的)。
比如我想讓這個(gè)機(jī)器人在我們公司群里協(xié)助回答一些問題,可以按照后臺的指引文檔,配置一個(gè)機(jī)器人應(yīng)用(也是手把手的,我就不一步一步教了)。
把飛書機(jī)器人拉進(jìn)群里,可以@它問問題。
回答也是完全按照知識庫資料來的,只是順序變了一些。
其他類似企微客服接入、公眾號接入,也都是一步一步手把手教程文檔。(這里其實(shí)可以夸一下 Chato 的產(chǎn)品團(tuán)隊(duì),寫的教程很好)
另外,如果你感興趣的話,可以在 Chato 后臺的規(guī)則里配置各種模型、索引量(就是從你的知識庫里找?guī)锥沃R放在用戶問題后面給大模型)、角色的設(shè)定(也是預(yù)設(shè)提示詞的一部分,讓角色更聽話的)、默認(rèn)的關(guān)鍵詞回復(fù),比如加上一個(gè)聯(lián)系客服的二維碼。
這些自己探索吧,都是“增值”內(nèi)容了。
最后,還有一個(gè)關(guān)鍵信息。
類似搭建企業(yè)專屬 ChatGPT 這樣的信息,是我《AI+私域提效行動(dòng)營》的一部分。如果你想使用 AI 發(fā)揮更大的價(jià)值,把 AI 實(shí)實(shí)在在的用到你的工作中,提高工作的效率,請務(wù)必報(bào)名。
第一期已經(jīng)收獲了學(xué)員的巨多好評(我還沒來得及截圖,但我從不吹牛)。
第二期正式開始招募,同樣采用 21 天直播+練習(xí)+答疑的模式,手把手教你把 AI 用起來,讓具體的工作被提效!
還記得我們在文章開始的時(shí)候說要再提一次“向量[3]”么?
現(xiàn)在說一下:
因?yàn)镚PT 大模型支持的字符數(shù)是有限的;
為了盡最大可能的節(jié)省 token 的消耗,所以很多技術(shù)同學(xué)會把拆開的一段一段知識庫文字,通過 OpenAI 提供的 embedding 接口,轉(zhuǎn)化成跟大模型的參數(shù)存儲形式一樣的格式,也就是本文承諾只提三次的那個(gè)詞,這樣也更適合大模型去匹配自己的知識能力。
但如果你不差錢,就不需要學(xué)習(xí)這些腦仁疼的技術(shù)。
23年4月成立的公司,不得不說效率可以,但我還是對企業(yè)沒有信任度 ,暫時(shí)不敢玩的太深入
再研究一下這家公司背后的百姓網(wǎng)呢~
世事滄桑