色五月激情中文字幕，欧美一级亚洲欧洲日本，欧美亚洲色综久久精品国产，国产av巨作情欲放纵无码，最新亚洲人成无码专区，国产一级毛卡片视频a，91久久精品一区二区三区色欲，中文字幕玖玖资源亚洲精品

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

發(fā)布

注冊 | 登錄

“閑聊”的當(dāng)前現(xiàn)狀及未來展望

我叫人人

2019-05-07

1 評論 5159 瀏覽 17 收藏

9 分鐘

“閑聊”短時間內(nèi)還是需要產(chǎn)品驅(qū)動，而長時間則可能是依賴技術(shù)驅(qū)動。

現(xiàn)狀梳理

人機對話的發(fā)展還處在起步階段，音箱之間的大戰(zhàn)就是一個很好的開始，未來會有更多的設(shè)備被賦予對話的能力。

目前整個過程最大的問題在于自然語言處理（即NLP），在這個NLP中最不好處理的就是開放域的閑聊了，這也是無論那個公司的”對話系統(tǒng)（廣義上的語音交互設(shè)備所搭載的系統(tǒng)）“，都會出現(xiàn)答非所問的情況。

用戶體驗角度

1. 了解競品（這里指狹義上的競品）

目前知名度最高的閑聊機器人就是小冰，小冰也是業(yè)內(nèi)首個提出用“交互次數(shù)（即CPS）”來作為衡量閑聊質(zhì)量的方式，而其他公司大多都還在用“單輪準(zhǔn)確率”來衡量聊天的好壞，這里最大的問題是評判標(biāo)準(zhǔn)過于主觀。當(dāng)然也有公司以其他相關(guān)轉(zhuǎn)化率為目標(biāo)，不在分析范圍內(nèi)。

所以這里主要分為：以提升CPS為目標(biāo)的小冰和以提升單輪準(zhǔn)確率為目標(biāo)的其他公司。

2. 競品優(yōu)劣

前面已經(jīng)分析過了，各個公司的優(yōu)化目標(biāo)不同，所以他們出現(xiàn)的問題也會有所差異。

小冰：由于小冰以CPS為目標(biāo)，所以導(dǎo)致小冰非常善于引導(dǎo)對話，也就是說小冰的主動性太強了，就像你有一個非常愛嘮嗑的朋友，時不時還帶著你一起跑題。帶來的問題就是小冰常常會回復(fù)的答非所問，讓人感覺不知所云。

還有小冰為了實現(xiàn)上下文的關(guān)聯(lián)性，他們聊天庫的語料是進(jìn)行分類的，也就是當(dāng)你談到某個話題時，他會在當(dāng)前的聊天中，固定出現(xiàn)該話題的語料，使用戶感覺到一直再聊一個事情。帶來的問題就是和小冰閑聊很難跳出該話題，不能夠更靈活的應(yīng)對用戶的反饋。

其他公司：那些重視單輪準(zhǔn)確率的閑聊，單獨拿出來每句話看，給人的感覺是很難區(qū)分這是人還是機器人。但是整體一起看，很容易就能看出來，其中前后矛盾，指代不明的現(xiàn)象頻繁出現(xiàn)，很難堅持聊下去。

由于為了提高單輪準(zhǔn)確率，最簡單的方式補充聊天庫，即Q-A語料。這時候的閑聊機器人是被動的，也就是你問他，他才會回復(fù)，當(dāng)你不知道該說什么的時候，對話就結(jié)束了。

綜合考慮，就用戶體驗的角度來講，CPS為目標(biāo)更加客觀，更能滿足用戶的需求。

3. 潛在價值

閑聊無用論現(xiàn)在是大家的共識，這也是除小冰外，很少見大公司把這個當(dāng)作核心來做。其實這主要因為沒有明確的商業(yè)模式，而且技術(shù)瓶頸明顯，但是市場規(guī)模還是很大的。因為聊天對話是人類的天性，每個人都需要一個可以說心里話的人，目前技術(shù)是主要瓶頸，無法支撐開放域的自由對話，讓人感覺沒有人會和機器人聊天。

想要從閑聊的角度抓住用戶，那一定是要滿足情感的需求。

技術(shù)解決角度

面對開放域閑聊各種各樣的問題，也有各種各樣的解決方法，我按照自己的理解，大致分為三種方式算法、正則、兜底。

1. 算法

隨著深度學(xué)習(xí)的發(fā)展，算法這個詞逐漸進(jìn)入人們眼中，給人一種高深莫測的感覺，但是在自然語言處理中，所能起到的作用還是很有限的。按照回復(fù)方式，現(xiàn)在算法主要分為：匹配算法（計算兩個句子的是否匹配）、解析算法（先給輸入進(jìn)行分類，再按照預(yù)設(shè)類別回復(fù)）和生成算法（直接生成回復(fù)）

匹配算法：這應(yīng)該是閑聊最重要的算法了，主要是從海量聊天庫中找到相似的句子，和搜索用到的算法較一致。

解析算法：目前很多公司都用到了，主要就是通過模型對輸入進(jìn)行分類，也是目前算法的主流用法。

生成算法：很少有公司用這類算法，主要還是回復(fù)結(jié)果并不可控，據(jù)說中文版的小冰有10%的回復(fù)使用該算法。

2. 正則

正則指得就是正則表達(dá)式，這是比較傳統(tǒng)的方式，雖然簡單，但是效果立竿見影。這種方式在技能上比較常見，我覺得正則即可以準(zhǔn)確到完全匹配，也可以泛化到關(guān)鍵詞回復(fù)。

3. 隨機

所謂隨機就是不做任何解析，隨機回復(fù)我們預(yù)設(shè)好的回復(fù)。這往往用來解決超過機器人能力范圍時，給用戶的一個反饋。在明知無法滿足用戶需求的情況下，回復(fù)的話術(shù)就會很重要，不同產(chǎn)品需要不同的設(shè)計思路。

語言的本質(zhì)

之前在一篇文章當(dāng)中看到一個對語言本質(zhì)的理解，說“語言時思維的映射”。也就是說如果你不會思考，那么你的語言終究是假的，是存在于表面的。而現(xiàn)在的深度學(xué)習(xí)，也只是在利用大量的數(shù)據(jù)進(jìn)行特征提取，并沒有因果關(guān)系的推理，所以當(dāng)前的深度學(xué)習(xí)在NLP領(lǐng)域，能力有限。而想要實現(xiàn)真正像人一樣的閑聊，還是需要一定的時間，短時間內(nèi)無法速成。