“閑聊”的當(dāng)前現(xiàn)狀及未來展望
“閑聊”短時間內(nèi)還是需要產(chǎn)品驅(qū)動,而長時間則可能是依賴技術(shù)驅(qū)動。
現(xiàn)狀梳理
人機對話的發(fā)展還處在起步階段,音箱之間的大戰(zhàn)就是一個很好的開始,未來會有更多的設(shè)備被賦予對話的能力。
目前整個過程最大的問題在于自然語言處理(即NLP),在這個NLP中最不好處理的就是開放域的閑聊了,這也是無論那個公司的”對話系統(tǒng)(廣義上的語音交互設(shè)備所搭載的系統(tǒng))“,都會出現(xiàn)答非所問的情況。
用戶體驗角度
1. 了解競品(這里指狹義上的競品)
目前知名度最高的閑聊機器人就是小冰,小冰也是業(yè)內(nèi)首個提出用“交互次數(shù)(即CPS)”來作為衡量閑聊質(zhì)量的方式,而其他公司大多都還在用“單輪準(zhǔn)確率”來衡量聊天的好壞,這里最大的問題是評判標(biāo)準(zhǔn)過于主觀。當(dāng)然也有公司以其他相關(guān)轉(zhuǎn)化率為目標(biāo),不在分析范圍內(nèi)。
所以這里主要分為:以提升CPS為目標(biāo)的小冰和以提升單輪準(zhǔn)確率為目標(biāo)的其他公司。
2. 競品優(yōu)劣
前面已經(jīng)分析過了,各個公司的優(yōu)化目標(biāo)不同,所以他們出現(xiàn)的問題也會有所差異。
小冰:由于小冰以CPS為目標(biāo),所以導(dǎo)致小冰非常善于引導(dǎo)對話,也就是說小冰的主動性太強了,就像你有一個非常愛嘮嗑的朋友,時不時還帶著你一起跑題。帶來的問題就是小冰常常會回復(fù)的答非所問,讓人感覺不知所云。
還有小冰為了實現(xiàn)上下文的關(guān)聯(lián)性,他們聊天庫的語料是進(jìn)行分類的,也就是當(dāng)你談到某個話題時,他會在當(dāng)前的聊天中,固定出現(xiàn)該話題的語料,使用戶感覺到一直再聊一個事情。帶來的問題就是和小冰閑聊很難跳出該話題,不能夠更靈活的應(yīng)對用戶的反饋。
其他公司:那些重視單輪準(zhǔn)確率的閑聊,單獨拿出來每句話看,給人的感覺是很難區(qū)分這是人還是機器人。但是整體一起看,很容易就能看出來,其中前后矛盾,指代不明的現(xiàn)象頻繁出現(xiàn),很難堅持聊下去。
由于為了提高單輪準(zhǔn)確率,最簡單的方式補充聊天庫,即Q-A語料。這時候的閑聊機器人是被動的,也就是你問他,他才會回復(fù),當(dāng)你不知道該說什么的時候,對話就結(jié)束了。
綜合考慮,就用戶體驗的角度來講,CPS為目標(biāo)更加客觀,更能滿足用戶的需求。
3. 潛在價值
閑聊無用論現(xiàn)在是大家的共識,這也是除小冰外,很少見大公司把這個當(dāng)作核心來做。其實這主要因為沒有明確的商業(yè)模式,而且技術(shù)瓶頸明顯,但是市場規(guī)模還是很大的。因為聊天對話是人類的天性,每個人都需要一個可以說心里話的人,目前技術(shù)是主要瓶頸,無法支撐開放域的自由對話,讓人感覺沒有人會和機器人聊天。
想要從閑聊的角度抓住用戶,那一定是要滿足情感的需求。
技術(shù)解決角度
面對開放域閑聊各種各樣的問題,也有各種各樣的解決方法,我按照自己的理解,大致分為三種方式算法、正則、兜底。
1. 算法
隨著深度學(xué)習(xí)的發(fā)展,算法這個詞逐漸進(jìn)入人們眼中,給人一種高深莫測的感覺,但是在自然語言處理中,所能起到的作用還是很有限的。按照回復(fù)方式,現(xiàn)在算法主要分為:匹配算法(計算兩個句子的是否匹配)、解析算法(先給輸入進(jìn)行分類,再按照預(yù)設(shè)類別回復(fù))和生成算法(直接生成回復(fù))
匹配算法:這應(yīng)該是閑聊最重要的算法了,主要是從海量聊天庫中找到相似的句子,和搜索用到的算法較一致。
解析算法:目前很多公司都用到了,主要就是通過模型對輸入進(jìn)行分類,也是目前算法的主流用法。
生成算法:很少有公司用這類算法,主要還是回復(fù)結(jié)果并不可控,據(jù)說中文版的小冰有10%的回復(fù)使用該算法。
2. 正則
正則指得就是正則表達(dá)式,這是比較傳統(tǒng)的方式,雖然簡單,但是效果立竿見影。這種方式在技能上比較常見,我覺得正則即可以準(zhǔn)確到完全匹配,也可以泛化到關(guān)鍵詞回復(fù)。
3. 隨機
所謂隨機就是不做任何解析,隨機回復(fù)我們預(yù)設(shè)好的回復(fù)。這往往用來解決超過機器人能力范圍時,給用戶的一個反饋。在明知無法滿足用戶需求的情況下,回復(fù)的話術(shù)就會很重要,不同產(chǎn)品需要不同的設(shè)計思路。
語言的本質(zhì)
之前在一篇文章當(dāng)中看到一個對語言本質(zhì)的理解,說“語言時思維的映射”。也就是說如果你不會思考,那么你的語言終究是假的,是存在于表面的。而現(xiàn)在的深度學(xué)習(xí),也只是在利用大量的數(shù)據(jù)進(jìn)行特征提取,并沒有因果關(guān)系的推理,所以當(dāng)前的深度學(xué)習(xí)在NLP領(lǐng)域,能力有限。而想要實現(xiàn)真正像人一樣的閑聊,還是需要一定的時間,短時間內(nèi)無法速成。
未來展望
理解了閑聊的現(xiàn)狀,想象一下閑聊的未來,目前閑聊在對話系統(tǒng)中的位置可能如下:
1. 隨著人機對話的普及,會有越來越多的產(chǎn)品搭載對話系統(tǒng),閑聊將長時間會作為一個”兜底“的存在,用來解決技能以外的輸入。當(dāng)技能識別率和技能資源趨于一致的情況下,對話系統(tǒng)中的閑聊將會成為一個加分項的。
2. 閑聊如果可以收集到用戶畫像,那么基于閑聊的推薦系統(tǒng)將會發(fā)揮很大的作用,這個需要根據(jù)不同的產(chǎn)品進(jìn)行設(shè)計。如果做推薦,想到最好的入手點還是前面說到的情感,情感一方面可以造成用戶粘性,另一方面可以獲得用戶的信任。
我按照對語言本質(zhì)的猜測,將閑聊未來的發(fā)展分成兩部分,分割線就是技術(shù)是否可以讓技術(shù)實現(xiàn)思考:
1. 閑聊短時間內(nèi)還是需要產(chǎn)品驅(qū)動,而產(chǎn)品即需要了解當(dāng)前技術(shù)瓶頸,也需要了解用戶需求,甚至需求背后的人性,還有閑聊在整個產(chǎn)品中的定位,才有機會提升閑聊的用戶體驗。
2. 閑聊長時間的未來可能是技術(shù)驅(qū)動,而產(chǎn)品只是一個輔助的角色。先進(jìn)的技術(shù)可以讓機器人思考,調(diào)整相關(guān)的參數(shù),就可以改變機器思考的方式,這個時候產(chǎn)品的作用就不再那么重要。
本文由 @我叫人人 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
不錯