如何讓AI機(jī)器人的對(duì)話更加自然?
本文翻譯了國(guó)外作者Anna Prist 在Medium發(fā)布的《How to make your Chatbot Sound Natural》,提煉了設(shè)計(jì)機(jī)器人對(duì)話的注意點(diǎn)。并結(jié)合譯者的體驗(yàn)分析了如何讓機(jī)器人對(duì)話自然點(diǎn)的三點(diǎn)要素。
我總是沒(méi)法很好地翻譯文章,只能是在理解后再進(jìn)行轉(zhuǎn)述。最近看了幾篇很不錯(cuò)的機(jī)器人文章,就想著一邊翻譯,再一邊寫(xiě)點(diǎn)自己的想法。
日常工作時(shí)沉浸在機(jī)器人平臺(tái)、多輪場(chǎng)景以及各種解析器中,需要這樣來(lái)從不同的角度刺激下,或許會(huì)有些新的想法出來(lái)。
今天這篇是來(lái)自Anna Prist 在Medium發(fā)布的《How to make your Chatbot Sound Natural》
先概述下Anna提到在設(shè)計(jì)機(jī)器人對(duì)話時(shí),要注意的六點(diǎn):
- 語(yǔ)境(對(duì)話中機(jī)器人需要進(jìn)行上下文理解)
- 個(gè)性(機(jī)器人需要擁有自己的個(gè)性)
- 簡(jiǎn)明(機(jī)器人的用詞表述需要簡(jiǎn)明、清晰)
- 靈活性(需要考慮到用戶的表述會(huì)多樣)
- 自然性(使用些人類(lèi)對(duì)話中的自然表述,如禮貌性表達(dá))
- 主動(dòng)性(引導(dǎo)對(duì)話進(jìn)行,不要讓對(duì)話中斷)
我們習(xí)慣了技術(shù)的快速革新,甚至我們都無(wú)法想象如果沒(méi)有了技術(shù)的未來(lái)會(huì)是怎么樣的。隨著我們不斷的向前推進(jìn),交互設(shè)備以及交互設(shè)計(jì)都在不斷進(jìn)步。也多虧了那些小說(shuō)以及電影讓我們知道了我們?nèi)绾闻c機(jī)器去進(jìn)行交互—我們可以使用語(yǔ)音指令、手勢(shì)操作以及虛擬屏幕,就像電影中湯姆·克魯斯做過(guò)的那樣:
(可以youtube上搜索“Minority Report’s gesture-based user interface”進(jìn)行觀看)
在日?;?dòng)中,你可以使用像觸摸、語(yǔ)音和手勢(shì)之類(lèi)的交互方式,這對(duì)我們來(lái)說(shuō)是很容易的,這并不需要學(xué)習(xí)。
使用“自然”一詞是因?yàn)榛?dòng)是我們?nèi)祟?lèi)的基本行為。從我們生命的第一天開(kāi)始,我們就自然而然的去跟周?chē)囊磺谢?dòng),嘗試去抓住或移動(dòng)?xùn)|西、嘗試去說(shuō)話去交流。這些交互方式反映在人機(jī)互動(dòng)中同樣會(huì)是自然的。
微軟的首席研究員Bill Buxton曾說(shuō),語(yǔ)音用戶界面可能會(huì)是最自然的用戶界面,尤其是在駕駛汽車(chē)的時(shí)候。很顯然,當(dāng)你手放在方向盤(pán)上,眼睛盯著前方關(guān)注路況。通過(guò)聲音,就可以為你傳輸大量的信息,這成為當(dāng)前場(chǎng)景下最有效的溝通(互動(dòng))方式。通過(guò)技術(shù)的進(jìn)步,使得我們可以與機(jī)器進(jìn)行對(duì)話、互動(dòng)。
語(yǔ)音是一種很常見(jiàn)的人類(lèi)技能,因此也可以假定你的用戶已經(jīng)具備了該技能。對(duì)于VUI開(kāi)發(fā)人員來(lái)說(shuō),下一個(gè)挑戰(zhàn)在于創(chuàng)建對(duì)話/技能/行為,以及訓(xùn)練聊天機(jī)器人/虛擬助理來(lái)進(jìn)行交流并且讓它們好用。
這個(gè)挑戰(zhàn)相當(dāng)?shù)钠D巨,因?yàn)橐寵C(jī)器去理解我們的意圖就必須還得聯(lián)系并了解上下文對(duì)話。為了要聽(tīng)起來(lái)自然,也應(yīng)該具備個(gè)性等等。下面我們列出了一些技巧,可以用于創(chuàng)建聊天機(jī)器人和虛擬助理。
01 設(shè)計(jì)機(jī)器人對(duì)話時(shí),要注意的六點(diǎn)
語(yǔ)境(上下文)
作為人類(lèi),我們可以很自然地使用語(yǔ)境,我們都不需要去刻意去思考這件事。我們可以自然的知道如何跟不同的人或在不同的地方以何種方式進(jìn)行對(duì)話。我們會(huì)用不同的語(yǔ)氣或方式跟孩子、父母、朋友和同事進(jìn)行交談。我們?cè)诩依锏臅r(shí)候可以大聲而直率的講話,但在公共場(chǎng)合時(shí),我們就會(huì)保持形象并注意自己的說(shuō)話語(yǔ)氣和用詞。
而聊天機(jī)器人和虛擬助理是沒(méi)有這種場(chǎng)景化的知識(shí)和意識(shí)的。這就是為什么要提這個(gè)“語(yǔ)境“的原因了。一些基本的數(shù)據(jù)信息,如用戶的查詢記錄/答案、用戶授權(quán)后獲得的信息、用戶表達(dá)的信息等等這些,不要去問(wèn)那些你(機(jī)器人)已經(jīng)知道的事情,不要給有經(jīng)驗(yàn)的用戶還不斷提供新手引導(dǎo)。
個(gè)性
當(dāng)聊天機(jī)器人或虛擬助理?yè)碛辛藗€(gè)性會(huì)聽(tīng)起來(lái)很自然。例如:Alexa 就很好玩,它對(duì)各種事物都有自己的見(jiàn)解。甚至,它的觀點(diǎn)和喜好會(huì)因所在國(guó)家/地區(qū)而不同。比如在美國(guó)時(shí)問(wèn)它喜歡什么啤酒和在德國(guó)時(shí)問(wèn)它是不一樣的。亞馬遜的開(kāi)發(fā)人員在開(kāi)始創(chuàng)建Alexa時(shí),他們只是希望不要讓它聽(tīng)起來(lái)像一臺(tái)沒(méi)有情感的機(jī)器。然而沒(méi)想到會(huì)有如此多的人愛(ài)上了Alexa的性格。而Alexa也因擁有性格在與用戶互動(dòng)中增加了信任度。這個(gè)原則一定程度上會(huì)限制自動(dòng)生成響應(yīng)的能力,然而對(duì)用戶體驗(yàn)卻是至關(guān)重要。
簡(jiǎn)明
簡(jiǎn)短的用詞可以減輕認(rèn)知負(fù)擔(dān)、節(jié)省時(shí)間以及聽(tīng)起來(lái)比較自然??s短文本去展示真正重要的信息,省略用戶已經(jīng)知道的事實(shí)和說(shuō)明。如果你的機(jī)器人帶有顯示屏,你還可以將一些信息放在屏幕上進(jìn)行歸納或隱藏等。
靈活性
必須要預(yù)料到,用戶會(huì)在對(duì)話的過(guò)程中隨時(shí)改變信息。甚至用戶會(huì)用各種不同的表達(dá)來(lái)回答你的問(wèn)題。
自然性
機(jī)器人的講話必須自然,需要避免重復(fù)和比較官方的語(yǔ)言。盡可能的使用隱式確認(rèn)和主動(dòng)監(jiān)聽(tīng)技術(shù),來(lái)告訴用戶你獲取到的關(guān)鍵信息和內(nèi)容。并且不要忘記那些禮貌性的表述,如再見(jiàn)、感謝、請(qǐng)這樣的用詞等。
主動(dòng)性
為了避免出現(xiàn)用戶不知道下一步該怎么做的情況,需要在監(jiān)視對(duì)話框中將出路(下一步)考慮進(jìn)去。如通過(guò)問(wèn)題或指導(dǎo)性的標(biāo)記來(lái)進(jìn)行對(duì)話,提供相關(guān)的按鈕指引等。
雖然對(duì)話設(shè)計(jì)會(huì)受限于技術(shù)的開(kāi)發(fā)水平,但是使用這些技巧能夠在一定程度上有助于進(jìn)行輕松自然的對(duì)話。這個(gè)領(lǐng)域還相對(duì)較新,我們都需要從不斷的嘗試和錯(cuò)誤中來(lái)吸取教訓(xùn),因此也不要害怕犯錯(cuò)。
要記住,好的對(duì)話是自然的對(duì)話。
以上就是譯文內(nèi)容了,接下來(lái),想就幾個(gè)點(diǎn)再說(shuō)一說(shuō):
02 譯者的思考
關(guān)于機(jī)器人個(gè)性
在我們與機(jī)器人對(duì)話時(shí),一般會(huì)涉及到四個(gè)不同類(lèi)型的對(duì)話,開(kāi)放域的聊天、任務(wù)驅(qū)動(dòng)的對(duì)話、問(wèn)答(FAQ)和推薦。
但很多時(shí)候,這些不同類(lèi)型的支持都是來(lái)自于不同的團(tuán)隊(duì)。不同團(tuán)隊(duì)將其不同功能賦予給了這個(gè)機(jī)器人。當(dāng)這個(gè)機(jī)器人與用戶進(jìn)行對(duì)話時(shí),用戶會(huì)明顯感覺(jué)到不自然。我們稍微回想下,當(dāng)你跟你朋友聊天,如果對(duì)方突然變成了你朋友的男朋友/女朋友在打字說(shuō)話,一般情況下是能感覺(jué)出來(lái)的。
關(guān)于靈活性
人類(lèi)語(yǔ)言的表述真的過(guò)于靈活而豐富了,同樣的一個(gè)詞,在不同的語(yǔ)境下,甚至不同的語(yǔ)調(diào)都代表著不同的意思,這著實(shí)加大了機(jī)器人來(lái)理解人類(lèi)語(yǔ)言的難度。
關(guān)于場(chǎng)景
同樣的功能,在不同的場(chǎng)景下,人類(lèi)對(duì)其要求也是不同的。舉個(gè)栗子,也是我最近跟我的天貓精靈互動(dòng)時(shí)的感受。
有時(shí)睡的比較晚,大概在晚上兩點(diǎn)多的時(shí)候,我說(shuō)“天貓精靈幫我定個(gè)早上八點(diǎn)的鬧鐘”,這時(shí)天貓精靈會(huì)保持原音量來(lái)回答我。是的,如果我之前白天很歡樂(lè)很大音量的聽(tīng)過(guò)歌,這時(shí)我就要被天貓精靈超大嗓音給驚嚇到了(已被嚇到好多次了)。
于是我會(huì)把音量降低再降低。然而早上天貓精靈大概會(huì)在七點(diǎn)五十九分?的時(shí)候突然以正常音量說(shuō)“您的鬧鐘即將響起…”(明明我已經(jīng)把音量調(diào)低了……),于是我就這樣被這句話突然地嚇醒…
所以單這樣一個(gè)定鬧鐘的功能,在不同的場(chǎng)景下,我們也是希望它能更自然點(diǎn)、貼心點(diǎn)、聰明點(diǎn)。
嗯,今天就寫(xiě)到這了~
原文標(biāo)題:《How to make your Chatbot Sound Natural》
原文作者:Anna Prist
譯文地址:https://mp.weixin.qq.com/s/6ykvYxpALO0vGd4TDzcfgw
編譯作者:空明,公眾號(hào):空明里
本文由 @空明 翻譯發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議。
老大我轉(zhuǎn)到脈脈去,可以嗎