舉例說明語(yǔ)音交互設(shè)計(jì)的基本原則

3 評(píng)論 6321 瀏覽 38 收藏 8 分鐘

本篇文章作者通過舉例的方式,總結(jié)了語(yǔ)音交互設(shè)計(jì)的十二個(gè)基本原則,希望對(duì)有需要的小伙伴們有所幫助!

在智能音箱的技能制作中,最重要的就是語(yǔ)音交互(voice interactive )模型了,語(yǔ)音交互就是將人的語(yǔ)言轉(zhuǎn)換成應(yīng)用的action(面向系統(tǒng)的動(dòng)作)的模式,也就是VUI(Voice UI),我們之前談?wù)撌謾C(jī)APP的UI更多意義上是GUI(Graphic UI),而要做好VUI的交互和GUI一樣,都對(duì)于細(xì)節(jié)提出了更多更高的要求。

亞馬遜的VUI設(shè)計(jì)師Amdrew ku就說過:“人類對(duì)于聲音的敏感是超出很多人的想象的?!?/p>

在制作技能中,首先要明確的就是你的技能能做什么,然后根據(jù)這個(gè)點(diǎn)來預(yù)測(cè)用戶可能的表述,再把相關(guān)的表述對(duì)應(yīng)到意圖(intent)。

基本上,用戶的表述可以分為三類:完整的意圖、不完整的意圖和無意圖。

當(dāng)用戶明確表達(dá)了完整了意圖的時(shí)候就應(yīng)該去完成意圖相應(yīng)的任務(wù),比如:

用戶:“現(xiàn)在幾點(diǎn)了”
智能音箱:“現(xiàn)在是晚上9點(diǎn)41分”

在這個(gè)對(duì)話(session)中,意圖是完全明確的,所以只要執(zhí)行意圖回復(fù)信息即可。而遇到的用戶的意圖是完整的,就需要去引導(dǎo)用戶補(bǔ)充,比如:

用戶:“我想查一下明晚的航班”
智能音箱:“請(qǐng)問你想查去什么地方的航班?”

另外,當(dāng)用戶的表述超出模型的時(shí)候,還要提供必要的幫助,比如:

用戶:“這個(gè)游戲我不會(huì)玩”
智能音箱:“在本游戲中你可以與好友進(jìn)行成語(yǔ)接龍,只需要對(duì)我說一個(gè)你想到的成語(yǔ)?!?/p>

只有區(qū)分了不同的意圖,音箱才能有區(qū)分的進(jìn)行反饋,把用戶“引到”使用路徑上來。在區(qū)分意圖之后,設(shè)計(jì)者還應(yīng)該注意在設(shè)計(jì)語(yǔ)音交互模型時(shí)的一些基本原則,這些原則基本來源于alexa平臺(tái)上對(duì)于skill制作的經(jīng)驗(yàn),也包括一些國(guó)內(nèi)AI平臺(tái)在這方面的總結(jié),如下:

原則一:讓用戶明白他是不是需要回答,如需要回答,最好使用疑問句。

【正確示例】
音箱:有三個(gè)車,紅車、黃車、綠車,你要選哪個(gè)?
【反面示例】
音箱:你可以從下面的三個(gè)選項(xiàng)中選一個(gè),分別是紅車、黃車、綠車。

原則二:不要假定用戶知道該怎么做,要引導(dǎo)用戶。

【正確示例】
音箱:歡迎進(jìn)入滴滴打車,你可以嘗試對(duì)我說“打個(gè)出租車”。
【反面示例】
音箱:歡迎進(jìn)入滴滴打車。

原則三:向用戶提問時(shí),不要摸棱兩可。

【正面示例】
音箱:你要沙拉還是漢堡?
用戶:漢堡
【反面示例】
音箱:還要再來點(diǎn)沙拉或者漢堡嗎?
用戶:…….

原則四:簡(jiǎn)潔

用戶:我的星座運(yùn)勢(shì)如何?
【正面示例】
音箱:你的星座是什么
【反面示例】
音箱:有12個(gè)星座可以選擇,分別是雙子座、金牛座….你要選哪個(gè)?

原則五:不要給用戶太多選擇(最好不要超過三個(gè))

用戶:我想點(diǎn)奶昔。
【正面示例】
音箱:巧克力口味,草莓口味,香草口味,你要選哪個(gè)?
【反面示例】
音箱:巧克力口味,草莓口味,香草口味,可可口味,抹茶口味,你要選哪個(gè)?

原則六:復(fù)雜的技能(skill)多提供幫助指引。

一個(gè)技能(skill)能超過滿足三個(gè)需求就算很復(fù)雜了,如果是相對(duì)獨(dú)立的功能最好拆分成三個(gè)技能。如果用戶在技能使用流程中卡住,就需要幫助了,通常的做法是把功能列表讀給他,讓他知道技能可以做什么。

原則七:不問沒必要的問題

用戶:打開可可笑話
【正面示例】
音箱:一條警犬看到馬路上過來一條普通狗,就氣勢(shì)兇兇地跑去質(zhì)問它:我是警犬,你是什么東西?普通狗不屑一顧地看看它說:看清楚點(diǎn),老子是便衣。
【反面示例】
音箱:你想聽笑話嗎?

原則八:必要時(shí)和用戶再次確認(rèn)

當(dāng)用戶的命令涉及到某些方面操作,應(yīng)該通過語(yǔ)音進(jìn)行二次確認(rèn)。

比如:用戶公開的動(dòng)作(分享到社交網(wǎng)絡(luò))、影響他人的命令(給別人發(fā)信息)和錢相關(guān)的操作(下單)。

原則九:讓用戶明白他的狀態(tài)、目前在技能流程中的位置。

【正面示例】
音箱:你成功訂了咖啡,下次再見。
【反面示例】
音箱:你成功的訂了咖啡。

原則十:選項(xiàng)太多的時(shí)候需要分幾部分播報(bào)。

用戶:附近有什么電影院?jiǎn)幔?br /> 【正面示例】
音箱:最近的是XXX電影院,在山東路,還要聽其他較近的影院信息嗎?
【反面示例】
音箱:最近的是XXX電影院,在山東路,第二近的XXXX電影院在YYYY路,第三近的是…..

原則十一:TTS要口語(yǔ)化。

【正面示例】
音箱:北京國(guó)安戰(zhàn)勝了上海申花,比分是2比1。
【反面示例】
音箱:北京國(guó)安2:1上海申花

原則十二:用戶卡住的時(shí)候可以退出。

用戶:滴滴打車有什么功能?
【正面示例】
音箱:用滴滴打車1 XXX 2 XXX 3 XXXX 如果想退出的話可以說“結(jié)束”
【正面示例】
音箱:用滴滴打車1 XXX 2 XXX 3 XXXX

利用這些原則規(guī)范化設(shè)計(jì)后的技能更容易被用戶了解和使用和喜愛。

當(dāng)然這些原則還應(yīng)該根據(jù)技能和AI平臺(tái)的場(chǎng)景、風(fēng)格進(jìn)行調(diào)整,只有技能可以進(jìn)行良好的交互,技能才能更快更好的服務(wù)用戶。

 

本文由 @maoChuan 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 最近在做這個(gè)汽車語(yǔ)音交互,太難了 ??

    來自上海 回復(fù)
  2. 嗯?

    回復(fù)
  3. 認(rèn)真的看完了,有一點(diǎn)感悟可能比較深刻,大致是“替用戶做選擇”,現(xiàn)在的都市人都喜歡簡(jiǎn)潔、高效的溝通,且大部分人都有選擇困難癥,而且都極其沒有耐心,在真的需要幫助的場(chǎng)景下,說話的方式確實(shí)值得我們深思,如何能有效的傳達(dá)、簡(jiǎn)明的讓對(duì)方獲取信息,反而成了一個(gè)難點(diǎn),文章中舉的例子,有些還挺實(shí)用,比如:我想要什么東本西,語(yǔ)音會(huì)高效的給出為數(shù)不多的選擇項(xiàng),而不是將所有的備選項(xiàng)都一一列出

    來自廣東 回復(fù)