從開放域機(jī)器人構(gòu)建出發(fā),聊聊如何與機(jī)器人吹水
作者從自己的實(shí)際工作出發(fā),以兒童機(jī)器人場景為例,從多個(gè)角度對如何構(gòu)建閑聊機(jī)器人進(jìn)行了闡述,并分享了與機(jī)器人“吹水的”價(jià)值、方式方法以及背后原理。
一、機(jī)器人概述
機(jī)器人按照對話方式,可以分為“問答機(jī)器人”、“任務(wù)對話機(jī)器人”、“開放閑聊機(jī)器人”。但機(jī)器人的落地使用過程中,往往需要不同作用的機(jī)器人進(jìn)行結(jié)合。
拿電器類客服機(jī)器人舉例來說,會(huì)有如下對話:
用戶:“包安裝嗎”
機(jī)器人:”我們是包安裝的哦,親“
以上是我們最常見的問答場景,機(jī)器人通過檢索方式,找出query對應(yīng)的answer返回給用不。
再比如:
用戶:“我要查物流”
機(jī)器人:“您要查詢的是哪個(gè)訂單”(提供訂單A&訂單B&訂單C)
用戶:選擇A
機(jī)器人:該貨品目前已經(jīng)由順豐發(fā)出。
在以上場景中,機(jī)器人需要通過多輪方式完成查物流的任務(wù)。
這就像咱人一樣,在工作中,不僅需要有決策和解決問題的能力,還需要有日常溝通能力,任何一項(xiàng)都是不可或缺的。
由于工作中接觸了各類機(jī)器人,對于開放域聊天內(nèi)容的感觸比較深的是,閑聊本身在機(jī)器人的場景中,作用會(huì)相對弱一些,但大部分時(shí)候,又屬于機(jī)器人的基本能力,屬于典型的“得不到的永遠(yuǎn)在騷動(dòng),得到的有恃無恐”。
而目前市面上的機(jī)器人介紹文檔,一方面關(guān)于閑聊的內(nèi)容不多,絕大部分是任務(wù)型和檢索性的文章;另一方面,閑聊的介紹更偏向于技術(shù)實(shí)現(xiàn)方式。但小七我認(rèn)為,想要做好開放域聊天,其實(shí)不能只考慮技術(shù)實(shí)現(xiàn),而應(yīng)該從產(chǎn)品本身出發(fā)。
所以今天,小七結(jié)合之前做開放域機(jī)器人的實(shí)操過程,主要以兒童機(jī)器人場景為例子,從不同角度來闡述如何構(gòu)建閑聊機(jī)器人,跟著我燥起來!
二、吹水的價(jià)值
閑聊,俗稱“吹水”。朋友間吹水,講究開心就好。所以,閑聊是一個(gè)雙方都帶有情感訴求的過程,可以是解悶逗樂,也可以是哭訴慰藉。
基于此,如果用戶與機(jī)器人進(jìn)行閑聊互動(dòng),必定是希望機(jī)器人能引起其情感的共鳴和變化。如下對話是用戶跟“小愛同學(xué)”(小米音箱)的對話:
用戶:小愛同學(xué),放個(gè)屁
robot:矮油,人家是女孩紙,怎么會(huì)做這么羞羞的事情。既然主人想要聽放屁,我就勉為其難放一個(gè),放的不好可不許怪我哦。
噗~~
用戶在這次對話中,讓小愛同學(xué)放屁,純粹是逗樂找趣。同時(shí),機(jī)器人的反應(yīng)也是有一定套路,讓用戶感受到,這是一個(gè)可以給自己帶來樂趣的朋友。
當(dāng)一個(gè)朋友情商特別高,能夠在自己傷心時(shí)給予安慰,無聊時(shí)帶來樂趣,開心時(shí)互相分享,任何一個(gè)人都會(huì)很感激有這樣的益友,讓人離不開。
比如用戶面前有一個(gè)娛樂機(jī)器人,前者習(xí)慣性會(huì)以人與人交流的形式來進(jìn)行對話。這時(shí)候,機(jī)器人不能而不是“直男”,顧著解決問題,也應(yīng)該是一個(gè)情商高的朋友,感知用戶的情感,并在回復(fù)時(shí)伴隨著相應(yīng)的情感,讓用戶感受到樂趣和溫度。
只有這樣子,用戶才能與機(jī)器人做更多交互,提高用戶粘性,而不是“仰天嘲笑出門去,AI都是智障人”?
三、如何吹水
用戶如果有意和機(jī)器人扯犢子吹水,必然會(huì)有”像人“的期望值。這個(gè)標(biāo)準(zhǔn)說起來簡單,做起來相當(dāng)?shù)秒y,畢竟nlp技術(shù)還真沒達(dá)到完全理解人類的水平。
如果我們換個(gè)角度,如《西部世界》中所講,機(jī)器人如果擁有了記憶,便開始進(jìn)化成有意識(shí)的生物了。同樣的,對于【像人】(類似有意識(shí))這個(gè)狀態(tài),我們可以抽象出一些特質(zhì),機(jī)器人如果擁有了這些特征后,能讓用戶覺得還不錯(cuò),愿意聊下去。
那以下是筆者從過往做閑聊機(jī)器人過程中所抽象出的特質(zhì),下面會(huì)一一做介紹。
1. 人設(shè)一致性
(1)人設(shè)一致性的意義
每個(gè)社會(huì)人都有自己統(tǒng)一的人設(shè),包括身份、性別、形象、性格、愛好等,人與人之間也是基于這個(gè)“本”在對話。即使是路上的陌生人問路,也會(huì)先根據(jù)對方的形象、性別稱呼,比如路上經(jīng)常有人找我問路,都會(huì)說:“你好,帥哥”。而這稱呼,本身就是一個(gè)人物設(shè)定的表現(xiàn)。如果一個(gè)人人設(shè)不一致,有時(shí)候東,有時(shí)候西,那要么是這個(gè)人太戲精,要么就是神經(jīng)錯(cuò)亂,比如下面這個(gè)人:
A:你是誰
B:我是來自廣東的產(chǎn)品經(jīng)理
A:那你平時(shí)工作都在干嘛
B:我在畫建筑設(shè)計(jì)圖,敲代碼,修空調(diào)。
A:(這恐怕是個(gè)假的產(chǎn)品經(jīng)理吧)
機(jī)器人也一樣,需要立個(gè)人設(shè)在用戶前面,才能讓后者有真實(shí)感,安全感。如果機(jī)器人沒有人設(shè),會(huì)讓聊天變得異常怪異。有時(shí)候回答不上來、有時(shí)候亂回答,有時(shí)候上句不接下句,用戶會(huì)認(rèn)為亂七八糟,溝通不了。就如Cathy Pearl在《語言用戶界面設(shè)計(jì)》中所說:“人物模型的一致性,使人們能夠在與它們溝通時(shí)得以預(yù)測接下來會(huì)發(fā)生什么”。
(2)設(shè)計(jì)方式
那我們要如何設(shè)定機(jī)器人的人設(shè)呢?平時(shí)我們要了解一個(gè)人,一般會(huì)從其背景信息出發(fā),如名字、家鄉(xiāng)、職業(yè)、愛好等;其次,通過其談吐舉止,也可以了解一個(gè)人的性格特征。
關(guān)于機(jī)器人的背景,我們需要給到它一個(gè)故事。《西部世界》中,每個(gè)機(jī)器人都有自己的身份和劇本。但用戶會(huì)問機(jī)器人的哪些背景信息呢?事實(shí)是,不大可能枚舉出一個(gè)人的所有背景信息,就連人都可能忘了自己很多以前的事兒。
這里我們可以從日常提問(高頻問題)入手。以兒童機(jī)器人為例,在我們之前做的項(xiàng)目中,從線上交互數(shù)據(jù)看出,咨詢機(jī)器人背景信息的query占了所有交互數(shù)據(jù)的10%以上。這類問題包括:
- 機(jī)器人的身份是什么?姓名、年齡、生日、星座、家鄉(xiāng)等
- 機(jī)器人的能力是什么?
- 機(jī)器人的愛好是什么?
- 機(jī)器人的家庭背景、社交背景是怎么樣的?
另一方面,我們需要設(shè)計(jì)機(jī)器人的性格特點(diǎn),以此來體現(xiàn)其談吐。性格特點(diǎn)可以是風(fēng)趣、自信、忠誠,亦或是調(diào)皮、溫暖、腹黑。
最終我們可以有這么一個(gè)故事:
我們要?jiǎng)?chuàng)造一個(gè)兒童機(jī)器人,叫小七,男生,獅子座,關(guān)鍵很帥,來自泰坦星永恒一組,由于星球?yàn)l臨滅絕,爸爸媽媽送他到了地球,所以他留在地球和人類愉快地生活。小七性格幽默,樂于助人,但有時(shí)候也有些腹黑,教育小朋友。
(3)產(chǎn)品舉例
筆者也找了市面上做botframework的平臺(tái),這類產(chǎn)品的側(cè)重點(diǎn)主要在于技能定制及模型訓(xùn)練,而對于人設(shè)很少涉及。后面發(fā)現(xiàn)以下兩個(gè)平臺(tái)有相關(guān)設(shè)定,其中:圖靈機(jī)器人涉及到的屬性有性別、年齡、星座、爸爸媽媽;海知涉及的屬性包括姓名、性別、生日、喜好和爸爸媽媽。人設(shè)內(nèi)容不多,但這類機(jī)器人基礎(chǔ)配置,還是必不可少的。
圖靈機(jī)器人人設(shè)頁面:
海知ruyi機(jī)器人人設(shè)頁面:
2. 語言風(fēng)格設(shè)定
(1)意義與設(shè)計(jì)方式
語言風(fēng)格首先要符合人設(shè)特點(diǎn)。幽默的性格,機(jī)器人的回復(fù)就需要搞笑輕松一些,若是嚴(yán)謹(jǐn)?shù)男愿瘢瑱C(jī)器人說話就需要嚴(yán)肅。想象一下,一個(gè)在法院的政務(wù)機(jī)器人,當(dāng)你問它你會(huì)啥的時(shí)候,它說會(huì)泡妞撩妹,那場面真的會(huì)難以控制。
比如前面提到的小七喜歡掉書袋,那我們可以在小孩子玩游戲很久之后,提醒小朋友需要休息一下,然后看看書,或者引導(dǎo)其來學(xué)習(xí)古詩詞。
確定了語言風(fēng)格之后,就需要將這種性格特點(diǎn)體現(xiàn)在機(jī)器人的對話中。我們可以從用戶所有query中,抽象高頻場景進(jìn)行針對性設(shè)定,使得機(jī)器人人設(shè)和說話風(fēng)格一致,更像一個(gè)人在聊天,這也是我們最終的預(yù)期效果。
而在這個(gè)過程中,為了讓機(jī)器人顯得更加擬人化,我們也嘗試加入了一些類似口頭禪的feature,比如有的人習(xí)慣以“呃”來開始,有的人喜歡說“然后”來銜接。
(2)產(chǎn)品舉例
在以往例子中,我們所發(fā)現(xiàn)的其中一個(gè)高頻場景是:用戶會(huì)重復(fù)問同一個(gè)問題(不知道是不是都是一些智能程度檢驗(yàn)師在聊天,尷尬)。這種情況是極不建議機(jī)器人一直是單一回復(fù),那就成了一個(gè)對話復(fù)讀機(jī)了。而微軟小冰對于用戶這種互動(dòng),結(jié)合了她自己的人設(shè)和語言風(fēng)格來回應(yīng)(比如:撒嬌、傲氣)。
我們可以探索下微軟小冰的策略:
小冰的策略是,針對同個(gè)問題,給出不同的回復(fù)。若用戶重復(fù)太多次,小冰會(huì)有情緒的變化,慢慢地顯得不耐煩,并且開始責(zé)怪用戶,到最后干脆不回答了,直到用戶說其他內(nèi)容,就回復(fù)“你終于不說重復(fù)的話啦~”。從中我們可以看出,小冰的語言是很活動(dòng)調(diào)皮并且較為傲嬌的。
也只有這樣豐富的語言體現(xiàn),用戶才更相信對面是個(gè)可以聊天的朋友,而不是一個(gè)無聊的智障機(jī)器人。
3. 個(gè)性化
(1)個(gè)性化意義
如同政治課本中的一句話:世界上不會(huì)有完全一樣的葉子。即使如雙胞胎,也會(huì)有各自的個(gè)性。我們過往發(fā)生的每件事情,讓我們形成了特有的世界觀,價(jià)值觀,人生觀。三觀決定了每個(gè)人的思想不同,而語言是思想的折射,從而讓每個(gè)人談吐都是與眾不同的。
相應(yīng)的,機(jī)器人也應(yīng)該有自己的過往記憶,從而形成自己與眾不同的三觀。 這樣,每個(gè)機(jī)器人都是個(gè)性化的,就跟我們不同性格的朋友一樣。
(2)設(shè)計(jì)方式
當(dāng)然,如果要記住所有的事情,對于機(jī)器人來說是困難的,也會(huì)顯得沒有意義,畢竟人也有記性差的時(shí)候。那機(jī)器人需要有什么記憶呢?除了剛才的背景信息,最重要的,是要記住它的主人,即用戶。
也就是說,機(jī)器人需要能記住自己主人相關(guān)的信息,包括姓名、性別、愛好等方面,甚至某些過往的交互行為。這樣,當(dāng)某個(gè)用戶A擁有了一款能記住機(jī)子的機(jī)器人,即使市面上有其他機(jī)器人,對用戶來說,這個(gè)機(jī)器人小伙伴都是獨(dú)一無二的。
那要記住用戶,首先得有個(gè)收集用戶畫像的過程。這各場景就跟男生想要了解妹紙一樣,要么是自己主動(dòng)了解(撩),要么是自己通過細(xì)心觀察(備胎式方案),被動(dòng)了解。
1)主動(dòng)了解型
如果機(jī)器人想主動(dòng)去了解用戶,就需要找準(zhǔn)時(shí)機(jī),否則會(huì)顯得十分突兀,甚至讓用戶產(chǎn)生防備心理。
一般來說,最好的時(shí)機(jī),應(yīng)該是兩個(gè)朋友相互了解的時(shí)候。具體我們可以看以下例子:
用戶:你叫什么名字呀?
機(jī)器人:我叫小七。主人你呢?
用戶:我叫小八,你好呀。
機(jī)器人:你好,小八。我知道自己主人叫啥了,好開心!
用戶:你會(huì)做什么呢?
機(jī)器人:唱歌跳舞,啥都會(huì)呢。小八,你平時(shí)喜歡干什么呢?
用戶:我也喜歡唱歌呢。
機(jī)器人在這樣的互動(dòng)中,能夠了解到用戶的興趣愛好,并記憶下來。而用戶也會(huì)覺得這個(gè)機(jī)器人真的像自己的玩伴,從而更愿意與其玩下去。
2)細(xì)心觀察型
當(dāng)然,如果機(jī)器人能夠細(xì)心留意用戶以往說的話,也可以從中了解很多信息,從而做出很驚艷的交互表現(xiàn)。比如:
(早上)
用戶:早上好
機(jī)器人:早上好,小八。今天周末天氣很好,小八有打算去哪里玩嗎?
用戶:今天要跟爸爸媽媽去動(dòng)物園。
機(jī)器人:聽起來很棒呀。要玩得開心哦
(晚上)
用戶:晚上好。
機(jī)器人:小八呀,今天去動(dòng)物園玩了一天,能跟我講講都玩了什么了嗎
用戶:我今天看了斑馬、獅子、孔雀。。。。
機(jī)器人:好像很好玩呀。下次小八帶著小七一起去,好不好
機(jī)器人不僅能記憶,而且記性也好,讓小朋友感覺真的有在關(guān)注自己,也讓家長相信機(jī)器人確實(shí)是一個(gè)好陪伴,讓孩子不會(huì)孤單。
通過這樣的記憶,讓每個(gè)機(jī)器人都成為特有的存在。每個(gè)小朋友都有陪伴自己成長的專屬的玩伴。
P.S.當(dāng)家里有兩個(gè)小朋友的時(shí)候,如果希望機(jī)器人能夠記住用戶是誰,我們也可以通過聲紋識(shí)別方式記住不同用戶的名稱。
4. 主動(dòng)引導(dǎo)
(1)意義
一個(gè)相對智能的吹水機(jī)器人算是擺在這里了。但事實(shí)告訴我們,如果只是這樣,用戶不會(huì)一直和他聊下去。市面上很多機(jī)器人會(huì)宣稱自己有很多能力,可以陪伴小孩子,還可以教小朋友數(shù)學(xué)、英語等等。咱先不說這些能力有沒有用,好不好玩,到底能不能被用戶觸發(fā),才是首要考慮的問題。
想象一下,兩個(gè)人在聊天,永遠(yuǎn)是其中一方在找話題,另一方只是在附和,就算話癆也不可能永遠(yuǎn)有話題。而且,用戶往往不知道要和機(jī)器人聊啥,尷尬的氣氛會(huì)讓前者失去聊下去的興趣。所以,通過機(jī)器人主動(dòng)引導(dǎo)來找話題,從而讓用戶不斷來聊天,便顯得尤為重要。
(2)設(shè)計(jì)方式
設(shè)計(jì)主動(dòng)引導(dǎo)的時(shí)候,產(chǎn)品經(jīng)理需要講究策略,主要解決三個(gè)關(guān)鍵點(diǎn):內(nèi)容、時(shí)機(jī)、話術(shù)。
1)引導(dǎo)內(nèi)容
選擇引導(dǎo)什么內(nèi)容,這個(gè)取決于機(jī)器人的能力和定位,比如一個(gè)寓教于樂的機(jī)器人,應(yīng)該多讓小朋友做數(shù)字游戲、詩詞游戲等互動(dòng)。同時(shí),機(jī)器人如果學(xué)習(xí)(上線)了一些新的能力,也需要及時(shí)引導(dǎo)用戶來體驗(yàn),保證用戶的活躍度。
2)引導(dǎo)時(shí)機(jī)
對于時(shí)間點(diǎn)的問題,我們可以選擇在開頭、過程中以及結(jié)尾三個(gè)timing去觸發(fā)。
比較常見會(huì)在用戶喚醒機(jī)器人時(shí)候去引導(dǎo)其體驗(yàn)?zāi)芰?,如下case便是小度音箱在過年期間的能力引導(dǎo),會(huì)在用戶開始閑聊之后,直接推薦響應(yīng)技能。
user:小度小度,晚上好
小度:晚上好呀。先來看看明天的天氣吧,稍后還有精彩節(jié)目等著你哦~
小度:明天天氣xxxxx
小度:我為您整理了一些收聽率很高的節(jié)目,聽聽看吧,覺得不喜歡可以跟我說“換個(gè)臺(tái)”
但如果每次都在喚醒時(shí)引導(dǎo)就會(huì)顯得特別生硬。我們想象一下,兩個(gè)朋友在扯皮吹水,一般是從一個(gè)話題突然想到其他話題就開聊了。同理,用戶跟機(jī)器人聊天,也應(yīng)該允許雙方聊著聊著就扯到其他話題的。
我們也不必在所有聊天內(nèi)容中去想辦法做話題引導(dǎo)。首先,應(yīng)該找出用戶的高頻聊天場景中,比如小朋友會(huì)經(jīng)常讓機(jī)器人講笑話,講完后就可以引導(dǎo)做其他寓教于樂的游戲。當(dāng)然,實(shí)際情況不可能如此簡單暴力,觸發(fā)條件需要做權(quán)重計(jì)算,包括用戶各類技能的觸發(fā)次數(shù)、其他引導(dǎo)場景的觸發(fā)頻率、歷史引導(dǎo)的用戶反饋(如用戶說:我不喜歡)等。
最后就是在結(jié)尾的timing做引導(dǎo),也就是當(dāng)雙方都陷入沉默的尷尬氣氛的時(shí)候。拿小米音箱舉例,由于是全雙工喚醒,當(dāng)用戶每隔15s沒有說話,則會(huì)主動(dòng)引導(dǎo)一次,連續(xù)三次引導(dǎo)無果才會(huì)退出喚醒狀態(tài)。比如:“主人你去哪兒了?告訴你哦,我最近新學(xué)了一項(xiàng)技能,要不要跟我一起玩呢”。這樣可以引起用戶聊下去的興趣,開始新的話題,保證cps的數(shù)據(jù)上漲。
3)引導(dǎo)話術(shù)
至于最后的引導(dǎo)話術(shù),因?yàn)椴煌瑘鼍暗脑捫g(shù)是不一樣的,所以要保證與我們先前講的語言風(fēng)格一致,至少不能讓一個(gè)很嚴(yán)肅的學(xué)霸型機(jī)器人突然撒嬌說:“跟人家聊點(diǎn)別的東東嘛~”
5. 趣味性
所謂好看的皮囊千篇一律,有趣的靈魂萬里挑一。說到底,一個(gè)chatbot如果不好玩,再怎么折騰也沒用。另一方面,聊天機(jī)器人始終是一個(gè)To C的產(chǎn)品,通過運(yùn)營好玩的內(nèi)容,保證活躍和留存是相當(dāng)重要的。這往往能給到用戶意想不到的驚喜,從而產(chǎn)生持續(xù)對話的興趣。
如何讓閑聊變得好玩,就不得不提小冰的套路了。一方面,小冰日常會(huì)更新技能,不斷刺激用戶去體驗(yàn);另一方面,也會(huì)在各種聊天中皮一皮,讓用戶相信這是個(gè)有趣的“朋友”,比如上文提到的對于用戶故意使壞,一直重復(fù)單句的場景。
再比如,小冰曾經(jīng)更新一個(gè)“讀心術(shù)”的技能,也就是在15個(gè)問題之內(nèi)猜出用戶心里想的人物是誰。利用ID3決策樹等算法先將人物及特征作為訓(xùn)練樣本,再讓小冰反問用戶,為每個(gè)特征分類,最后選中用戶的“心上人”。
通過這一個(gè)個(gè)的小游戲,可以讓用戶不斷產(chǎn)生愉悅感及下次的期待感,朋友之間也是這樣,總有一些共同話題和興趣活動(dòng),才能讓雙方成為知己。
之前設(shè)計(jì)閑聊機(jī)器人時(shí),小七也設(shè)定了某些套路策略。比如情人節(jié)前后的土味情話,每天用戶開始進(jìn)行互動(dòng)的時(shí)候,以主動(dòng)消息的方式來發(fā)土味情話。當(dāng)時(shí)每天的土味情話在情人節(jié)期間還是帶來了不少的留存和活躍的。在實(shí)現(xiàn)方式上也比較簡單,直接利用規(guī)則設(shè)定即可,ROI還是挺高的。
user:打開聊天女仆
bot:主人你好呀。啊,你有沒有聞到什么味道?
user:沒有啊/什么味/…
bot:怎么你一出來空氣就甜炸了啊
同樣的,兒童機(jī)器人更需要這樣的趣味性和新鮮感,畢竟兒童天性就是“喜新厭舊”。如果小玩伴每天都是玩同樣的游戲,說同樣的話,到最后一定“沒朋友”。所以可以加入寓教于樂的兒童游戲,日常更新的兒童笑話,兒童故事,來吸引小朋友的注意,讓孩子喜歡上這個(gè)玩伴。
6. 情感
根據(jù)馬斯洛的需求層次理論,情感和歸屬(love and belonging)的需要是極為強(qiáng)烈的,缺乏該需求的人,往往會(huì)因?yàn)闆]有感受到身邊人的關(guān)懷,而認(rèn)為沒有價(jià)值活在這世界上。而對于開放域聊天機(jī)器人,市場往往會(huì)將其定位為陪伴,以提供一定程度的情感需求。因此,如何讓機(jī)器人感知用戶的喜怒哀樂并做情感陪伴,就有很大的必要性了。
這里分為兩塊,其一是如何識(shí)別用戶情緒;其二是機(jī)器人如何做情感反饋。
(1)情緒識(shí)別
我們暫不討論情感識(shí)別的技術(shù)識(shí)別,而是從產(chǎn)品側(cè)分析機(jī)器人要識(shí)別哪些情緒,從數(shù)據(jù)角度,就是劃分哪些數(shù)據(jù)作為情感分類。
情感有很多種,態(tài)度上有喜歡和討厭,心情上有悲傷和快樂,人際上有疏遠(yuǎn)和冷漠,等等。選擇哪些情感場景做反饋,主要取決于兩點(diǎn):
- 機(jī)器人定位:比如兒童陪伴場景,機(jī)器人對用戶的大部分情緒都應(yīng)該有敏感的識(shí)別,才能讓兒童感受到陪伴的意義;而法律機(jī)器人的閑聊場景,很多情感問題可以不用太注重,機(jī)器人選擇統(tǒng)一回復(fù)即可。
- 機(jī)器人回復(fù)內(nèi)容的顆粒度:比如在兒童場景中,小朋友罵了臟話,其實(shí)不需要了解具體罵的啥內(nèi)容,都應(yīng)該先引導(dǎo)小朋友文明用詞,所以臟話內(nèi)容的分類不需要太細(xì),只要是臟話就做統(tǒng)一回復(fù)即可。
(2)情感反饋策略
當(dāng)知道了用戶開心、失望還是憤怒的情緒之后,身為“朋友”的機(jī)器人就需要有所回應(yīng)。針對不同的情緒分類,機(jī)器人可以有不同的策略。這里我們可以列一下兒童場景中集中回復(fù)策略:
用戶生氣(說臟話):小朋友不可以說臟話哦,這樣我就不想跟你玩了,我只想跟文明的小孩做朋友呢~(教育策略)
用戶生氣(無臟話):怎么了?有人惹你不開心了嗎?沒事,有小七陪著你舒緩心情呢~不如跟我一起聽首好聽的兒歌放松放松吧(引導(dǎo)兒童場景)
用戶失落:主人,成長路上有不開心的事情,也會(huì)有開心的事情呢~至少小七一直陪著主人。對咯,我剛聽了一個(gè)笑話,可笑死我了,我也讓主人開心一下吧~(引導(dǎo)笑話場景)
用戶害怕:主人你抱著我,就沒啥好怕的了,我們一起變勇敢!
用戶開心:主人開心,小七就更開心啦。但是,但是,你要陪小七讀詩詞的呢,不要忘了哦~(引導(dǎo)詩詞場景)
總而言之,機(jī)器人的情感陪伴的最終效果,應(yīng)該是真正做到:不許騙我、罵我,要關(guān)心我;別人欺負(fù)我時(shí),你要在第一時(shí)間出來幫我;我開心時(shí),你要陪我開心;我不開心時(shí),你要哄我開心。嗯,最佳損友!
7. 特別說明:敏感詞處理
根據(jù)2017年國家頒布的《網(wǎng)絡(luò)安全法》第47條和68條的規(guī)定,企業(yè)要保證自己的網(wǎng)絡(luò)運(yùn)營平臺(tái)內(nèi)容安全,若出現(xiàn)敏感詞等違規(guī)行為將會(huì)收到行政處罰,甚至被勒令停業(yè)整改。而作為聊天機(jī)器人的產(chǎn)品設(shè)計(jì)者,需要保證機(jī)器人不亂說話,否則牽連成本巨大。
所以一般我們會(huì)設(shè)計(jì)一個(gè)敏感詞庫,并且做日常維護(hù)更新。有了敏感詞庫之后,我們來看機(jī)器人的回復(fù)語料來源,主要由三種渠道:(1)人工添加;(2)網(wǎng)上爬取;(3)自動(dòng)生成。對于(1)(2),我們會(huì)考慮在錄入回復(fù)的地方做敏感詞過濾;而對于自動(dòng)生成的回復(fù),一般會(huì)在生成回復(fù)的時(shí)候,過濾掉敏感詞。
嗯,做個(gè)聰明的機(jī)器人,知道什么該說,什么不該說。
四、吹水是怎么練成的
這一章主要聊的是機(jī)器人的實(shí)現(xiàn)方式,除非是算法類的產(chǎn)品經(jīng)理,其他AI產(chǎn)品經(jīng)理的重點(diǎn)還在于用戶場景,所以這塊我們簡單聊一下即可(畢竟說了好多了,在這段感情中累了)。
1. 檢索式閑聊實(shí)現(xiàn)
基于對話式檢索的閑聊主要使用匹配句子相似度的方式,比如先將用戶消息及對話庫的分類轉(zhuǎn)換為句向量,再計(jì)算兩者之間的余弦距離以得到語義相似度,最終將相似度最高的分類對應(yīng)回復(fù)話術(shù)返回給用戶。
想要轉(zhuǎn)換為句向量,由詞向量通過監(jiān)督方法或者無監(jiān)督方法獲得。現(xiàn)在主流的詞向量模型有Word2Vec、BERT等。當(dāng)獲得了詞向量之后,可以通過各類模型獲得,如CNN、跳躍思維向量、快速思維向量。
整體流程可以概括為:
(1)將query做分詞等預(yù)處理,再通過Word2Vec、BERT等模型將分詞結(jié)果轉(zhuǎn)化為詞向量,再利用快速思維向量、跳躍思維向量等方式獲取句向量
(2)將生成的句向量與模型模型已經(jīng)處理過的分類匹配,計(jì)算兩者余弦相似度,獲得相似度分值;
(3)根據(jù)分值排序,選擇最佳相似問句,將對應(yīng)answer返回。
當(dāng)然,之前算法大大分享過:由于語料庫巨大,如果每一條語料都與query計(jì)算,匹配效率會(huì)賊低。所以可以用一個(gè)高效的搜索引擎做粗粒度的篩選,選出候選答案,再進(jìn)行向量方式處理。
2. 生成式閑聊實(shí)現(xiàn)
生成式聊天機(jī)器人采用端到端的深度學(xué)習(xí)模型,如seq2seq,會(huì)從海量對話數(shù)據(jù)中學(xué)習(xí)到問題和回復(fù),從而對每條query都自動(dòng)生成回復(fù)。翻譯過來就是,回復(fù)內(nèi)容不必預(yù)設(shè),全部讓機(jī)器人自己來生成。
一般可以通過LSTM等模型將輸入的序列映射為固定長度的向量,然后使用深度LSTM從向量中解碼得到目標(biāo)輸出序列。
業(yè)界的觀點(diǎn)中,目前seq2seq的生成模型往往會(huì)出現(xiàn)安全回答的問題、機(jī)器人個(gè)性不一致的問題和多輪對話中的對話連續(xù)性問題。我司算法大大跟我說過,這類情況也不是沒辦法解決,一般會(huì)在生成模型中加入外部知識(shí)(如小冰的話題模型以及情感分類模型)來讓回復(fù)更有意義。
當(dāng)然,在小七的觀點(diǎn)中,生成模型不只是會(huì)出現(xiàn)這三個(gè)問題,我們剛才講到的吹水策略,才是閑聊機(jī)器人的重點(diǎn)價(jià)值體現(xiàn)。生成式雖然可以保證每條消息都能有所答復(fù),但朋友間的閑聊,不在于有話必應(yīng),而在于用心溝通,用心交往。
當(dāng)然,我也曾經(jīng)天真地設(shè)想過一個(gè)方案:利用檢索式滿足策略回復(fù)同時(shí),對于大量長尾的query,可以用生成回復(fù),并引用情感等模型來保證回復(fù)內(nèi)容更有意義,這個(gè)顧全大局但ROI賊低的方案活生生就被算法大大一句“天真”懟回來了,哈哈哈哈哈~
五、怎么知道吹得好不好
當(dāng)我們將一個(gè)閑聊機(jī)器人構(gòu)建完成并且上線了,不代表產(chǎn)品經(jīng)理的工作就完成了。我們需要通過數(shù)據(jù),了解機(jī)器人吹水能力是不是OK的,是不是真的達(dá)到用戶預(yù)期。
平日里我們說一個(gè)人溝通能力強(qiáng),能夠和任何人談笑風(fēng)生,但并沒有一個(gè)標(biāo)準(zhǔn),往往都是主觀判斷。而機(jī)器人是一個(gè)產(chǎn)品,產(chǎn)品經(jīng)理始終需要找到可以衡量價(jià)值的指標(biāo),才能證明這個(gè)閑聊機(jī)器人是否真的滿足用戶需求。
如上圖所示,從不同的目標(biāo)來看,產(chǎn)品經(jīng)理需要關(guān)注不同的指標(biāo),比如我們設(shè)計(jì)了一款兒童陪伴硬件機(jī)器人,從上往下都有不同的指標(biāo)。
對于企業(yè)來說,首先關(guān)注的就是好不好賣。產(chǎn)品經(jīng)理就需要根據(jù)銷售量情況,去設(shè)計(jì)場景和亮點(diǎn),保證產(chǎn)品側(cè)對銷售量的提升。
從用戶角度來說,產(chǎn)品經(jīng)理就需要關(guān)注其使用情況,大部門閑聊場景都是To C,所以避免不了要關(guān)注留存、活躍,也只有這兩個(gè)指標(biāo)上去了,才能體現(xiàn)機(jī)器人陪伴的意義。其次,我們也需要關(guān)注每次對話的輪次,來了解用戶是否愿意聊下去,也就是業(yè)界所說的CPS(單輪對話次數(shù))。
從功能來說,產(chǎn)品經(jīng)理需要考慮每個(gè)技能的使用情況,包括每個(gè)技能、場景的觸發(fā)率、完成率、留存率。這類指標(biāo)可以說是對整體留存、活躍、CPS的深層次現(xiàn)象探究,比如哪些場景的觸發(fā)率高,從而提升了cps;哪些技能完成率低,導(dǎo)致整體活躍降低。
最后,機(jī)器人是一個(gè)智能化系統(tǒng),自身也應(yīng)該有一些客觀標(biāo)準(zhǔn)來衡量其智能化程度。因?yàn)槲覀冇懻摰闹饕腔跈z索式的閑聊系統(tǒng),其常用評判標(biāo)準(zhǔn)有召回率、精準(zhǔn)率和F-測度。
本文由 @steseven 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
- 目前還沒評論,等你發(fā)揮!