語音交互產(chǎn)品的設(shè)計(jì)原則
在上一篇文章中,我們簡單了解了一下“語音交互”的相關(guān)發(fā)展歷程,以及實(shí)現(xiàn)原理等,那么此次我們落實(shí)到產(chǎn)品本身,來談?wù)劇罢Z音交互產(chǎn)品”在設(shè)計(jì)、制作時(shí)的相關(guān)原則。
語音交互所滿足的需求
語音交互能滿足用戶怎樣的需求?或者說,我們?cè)谠O(shè)計(jì)一款“語音交互類產(chǎn)品”時(shí),應(yīng)著重考慮哪些方面的“痛點(diǎn)”?
1. 快捷性
以定鬧鐘為例,目前我用的是IPhone7,我如果想通過傳統(tǒng)方式定鬧鐘,我的流程是:亮屏-上劃打開控制欄-點(diǎn)擊圖標(biāo)-選擇鬧鐘-定鬧鐘-結(jié)束(因?yàn)槲业目刂浦行臎]有添加鬧鐘,而是秒表,所以需要多一步驟)。而如果通過語音助手,我只需要:嘿,Siri(啟動(dòng)Siri)-幫我訂一個(gè)明早8點(diǎn)的鬧鐘-結(jié)束。
因此“語音交互”所需要滿足的很重要一點(diǎn)就是操作便捷性,能動(dòng)動(dòng)嘴皮子就解決的事,往往會(huì)比動(dòng)手來的輕松很多。若是一款語音交互產(chǎn)品,給用戶的感覺就是我說了半天都解決不了我的需求,還不如我直接點(diǎn)手機(jī)來得快,那無疑它是失敗的。
2. 安全性
最直接的場(chǎng)景——開車。雖然明文規(guī)定開車的時(shí)候不許接打電話,但實(shí)際生活中仍有很多人還是會(huì)在駕駛途中接電話。即使有耳機(jī),在有電話接進(jìn)來的時(shí)候往往也需要我們?cè)侔匆幌孪鄳?yīng)的按鍵,才能接聽。但在有“語音助手”的情況下,我們也許只需要說一聲“接聽”就可以了。包括我們臨時(shí)有急事想要撥打電話給別人時(shí),同樣可以滿足對(duì)應(yīng)需求。
因此在很多時(shí)候,如果產(chǎn)品的語音交互功能完善,就可以為用戶解決很多煩惱,同樣也可以避免很多安全事故的發(fā)生,因?yàn)檫@個(gè)時(shí)候人的注意力不需要再集中在操作設(shè)備身上,只需要簡單說幾句話就可以解決一切。
3. 差異性
“語音交互產(chǎn)品”更可以解決不同設(shè)備之間的信息流轉(zhuǎn)問題,這就是未來的智能家居概念,通過語音來控制所有的家具設(shè)備。因?yàn)椴煌脑O(shè)備在輸入方式的選擇上可能會(huì)存在差異,比如:有些是按鍵,有些是觸摸等,但如果所有家具都能利用“語音交互”來完成相應(yīng)的控制,那一切就會(huì)隨心所欲很多,而需求往往同樣對(duì)應(yīng)著合適的場(chǎng)景。
適合語音交互的場(chǎng)景
目前很多的現(xiàn)有場(chǎng)景其實(shí)都適合添加“語音交互”的元素進(jìn)去,所以我們簡單地將其概括為三方面。
1. 追求高效
高效性適用于很多場(chǎng)景,比如辦公場(chǎng)景:給XXX發(fā)送一封郵件,郵件內(nèi)容是***;比如生活場(chǎng)景:我要去某地,請(qǐng)從我當(dāng)前所在位置為我找一種時(shí)間最短的出行方式。諸如此類還有很多,用戶追求的就是足夠的快速,足夠的方便。講一句話需要多久呢?
2. 偏向執(zhí)行
結(jié)果導(dǎo)向,用戶關(guān)注的是事情或者命令執(zhí)行的結(jié)果,并不關(guān)心過程。比如:用戶想要查詢他買的股票是漲了還是跌了,對(duì)他來說也許關(guān)心的只是最后呈現(xiàn)的這么一個(gè)結(jié)果,那他只需要通過語音助手詢問即可獲知。因?yàn)楸旧硗ㄟ^“語音交互”執(zhí)行命令時(shí),用戶就已經(jīng)放棄了操作的過程,設(shè)備已經(jīng)把所有的過程通過用戶的一句話給省略了。
有些時(shí)候我們?cè)谶M(jìn)行網(wǎng)上購物的時(shí)候,也許用戶就不會(huì)選擇用“語音助手”來做推薦,因?yàn)榇蟛糠值挠脩魳酚谙硎転g覽琳瑯滿目的商品的過程。但同樣也有很多時(shí)候用戶只想快點(diǎn)結(jié)束過程,好達(dá)到目的,比如獲知天氣、定鬧鐘、查路線等。此種場(chǎng)景也多見于“工具型”產(chǎn)品中。
但基于目前的一個(gè)技術(shù)限制,“語音交互”功能本身也是偏向結(jié)果的,即用戶較難從一次語音交互過程中獲得什么享受。
3. 設(shè)備優(yōu)勢(shì)
即可以通過語音來實(shí)現(xiàn)遠(yuǎn)程控制設(shè)備,我們不需要去觸摸設(shè)備,不需要有其他操作,只需說一聲,設(shè)備就能運(yùn)轉(zhuǎn)起來。也許是簡單的讓放在桌上的手機(jī)設(shè)置一個(gè)鬧鐘,也許是讓家中的電器開始運(yùn)作。通過“語音交互”,我們確實(shí)能消除很多由于空間而帶來的限制。
那基于此,有適合“語音交互”發(fā)揮其功能的場(chǎng)景,同樣會(huì)有不適合語音交互的場(chǎng)景。
不適合語音交互的場(chǎng)景
場(chǎng)景大致也分為三種:
1. 嘈雜環(huán)境
在這個(gè)時(shí)候,影響的主要就是ASR(語音識(shí)別)與TTS(文本到語音)這兩個(gè)環(huán)節(jié),一個(gè)是人對(duì)設(shè)備說話,還有一個(gè)是設(shè)備反饋給用戶聲音。如果環(huán)境很吵鬧,首先就會(huì)影響機(jī)器聽取用戶的聲音,在將語音轉(zhuǎn)文字這一環(huán)節(jié)就容易產(chǎn)生偏差,直接導(dǎo)致后續(xù)的“自然語言環(huán)節(jié)”出錯(cuò),從而毀壞接下來所有的流程。
而同樣,周圍聲音吵,機(jī)器有反饋用戶也可能聽不清,從而也容易對(duì)機(jī)器發(fā)出的聲音產(chǎn)生誤解。
其實(shí)這點(diǎn)在日常生活中就能明白,如果周圍很吵,一般不會(huì)有人還會(huì)去使用“語音助手”。
2. 交流發(fā)散
這個(gè)主要是考慮到目前的一個(gè)“語音交互”技術(shù)發(fā)展的程度,現(xiàn)在我們絕大多數(shù)時(shí)候使用相關(guān)的語音助手,目的一般都是很明確的。解決一個(gè)問題或者制定一個(gè)任務(wù),往往是結(jié)果導(dǎo)向,只要設(shè)備實(shí)現(xiàn)了我的這么一個(gè)要求,那么這次“語音交互”就可以算是成功的。
而“交流發(fā)散”指的是什么呢?
它主要說的是用戶與設(shè)備如兩人閑聊一般聊天,即交流沒有目的性,這樣子的對(duì)話產(chǎn)生的內(nèi)容是呈發(fā)散性的,生活中的例子,比如:“調(diào)戲Siri”,很多用戶用各種話來測(cè)試Siri,期待一個(gè)回答。但由于目前的技術(shù)限制,語音交互還遠(yuǎn)遠(yuǎn)無法實(shí)現(xiàn)“交流”,即如果用戶注重過程,那么其實(shí)是沒那么理想的。
3. 過長流程
這一點(diǎn)上其實(shí)與“交流發(fā)散”都有點(diǎn)類似,即追求結(jié)果,那么勢(shì)必過程就會(huì)變得其次。因此如果用戶在使用“語音交互”時(shí)流程過長,往往會(huì)得到不好的體驗(yàn);或者說,本身這個(gè)指令的過程就是比較冗長的,以目前的技術(shù)也許根本不適合采用“語音交互”技術(shù)。
其他不適合的場(chǎng)景其實(shí)還有很多,比如:重視視覺效果的場(chǎng)景?!包c(diǎn)外賣”,雖然我們之前經(jīng)常會(huì)用這個(gè)來舉例,但就現(xiàn)在來說,如果使用語音助手點(diǎn)外賣,稍稍顯得有點(diǎn)沒必要。
因?yàn)槲覀凕c(diǎn)外賣,包括購物,其實(shí)很看重視覺體驗(yàn),你總不能光靠聽聲音就知道這個(gè)商品的成色等,而且同時(shí)本身它的流程也比較長,可能還包括手動(dòng)確定訂單、支付金額(也許會(huì)有聲紋認(rèn)證)等步驟,還無法完全依靠“語音交互”來實(shí)現(xiàn)。
之前我們一直說,就目前的“語音交互”的應(yīng)用來說,往往能實(shí)現(xiàn)的功能都是偏結(jié)果型的,因此一段語音交互對(duì)話,其實(shí)是帶著目的性的(與設(shè)備產(chǎn)生互動(dòng)其實(shí)也是帶著“消遣時(shí)間”的目的),或者說,設(shè)備是帶著任務(wù)來與用戶產(chǎn)生此次對(duì)話的。
任務(wù)型對(duì)話的概念
任務(wù)型對(duì)話:其目標(biāo)是為了達(dá)成用戶所希望完成的任務(wù),滿足用戶有直接目的的需求。(如:定鬧鐘、查路線等)
在這里,可以將這么一段“任務(wù)型對(duì)話”簡單分成三個(gè)部分:
1. 意圖定義
設(shè)備需要分析用戶想要干嘛,也就是理解用戶需求。只有在充分理解用戶需求的基礎(chǔ)上,才能設(shè)計(jì)出一款成功的產(chǎn)品?;谶@個(gè)道理,同樣要建立在理解用戶想法上來去開展接下來的對(duì)話流程。
2. 槽位定義
“槽位”是什么?
在“語音交互”中,它可以被理解為“關(guān)鍵字”,設(shè)備想要完成執(zhí)行用戶所下達(dá)的任務(wù),它必須清楚地知道這個(gè)任務(wù)究竟是什么,這就涉及到對(duì)一段話中槽位的匹配。
我們舉兩個(gè)例子:
(1)定鬧鐘——“我要定個(gè)鬧鐘”
很顯然,這是不完整的,給你定什么時(shí)候的?幾點(diǎn)的?
在這里,時(shí)間的槽位就是缺失的,導(dǎo)致設(shè)備無法執(zhí)行命令。
好,那這個(gè)時(shí)候,用戶說“給我定個(gè)八點(diǎn)的鬧鐘”。這時(shí)候完整了嗎?其實(shí)還是沒有完整,因?yàn)椴恢朗窃缟习它c(diǎn)還是晚上八點(diǎn),時(shí)間的槽位依然沒有明確定義,這次的任務(wù)依然無法執(zhí)行。
最后用戶說“給我定一個(gè)明天早上八點(diǎn)的鬧鐘”,這個(gè)時(shí)候,相應(yīng)的槽位就補(bǔ)充完整,可以正常執(zhí)行。
(2)打電話——這也是我們很常用的的“語音交互”功能。
用戶說“我要打個(gè)電話”,同樣,打電話給誰?電話對(duì)象這個(gè)槽位缺失。
接下來,是“給李四打個(gè)電話”,這么一看貌似已經(jīng)沒錯(cuò)了,對(duì)象也有了,具體指令也有了,但其實(shí)還是存在隱患,萬一用戶的手機(jī)是雙卡的呢?其實(shí)任務(wù)依然無法執(zhí)行,因?yàn)樵O(shè)備不知道用戶會(huì)選擇哪張卡來進(jìn)行撥號(hào),也許可以提前設(shè)置默認(rèn)號(hào)碼,但同樣這也是槽位之一。
而且很多用戶也許會(huì)給自己的聯(lián)系人設(shè)置備注,或者出現(xiàn)同名的情況,比如:用戶手機(jī)里有兩個(gè)叫李四的聯(lián)系人,這時(shí)候設(shè)備還應(yīng)該去詢問“要撥打給哪個(gè)李四”。
因此在設(shè)計(jì)這么一款語音交互產(chǎn)品時(shí),就槽位判斷的準(zhǔn)確性是很重要的,一旦產(chǎn)生誤解,或者對(duì)槽位未精確定位,相關(guān)操作就無法執(zhí)行。
3. 流程分支
這個(gè)就和槽位定義相互關(guān)聯(lián),因?yàn)樵谝粓?chǎng)“語音交互”過程中,順利的話也許用戶一開始就把所有槽位都說到了,那么設(shè)備就可以直接執(zhí)行命令。如果出現(xiàn)槽位缺失,那么設(shè)備這時(shí)候就應(yīng)該提示用戶補(bǔ)充相應(yīng)的槽位。
但流程分支,不光包括“槽位缺失”這一情況,還會(huì)存在“增加指令”(如用戶還需要在定一個(gè)鬧鐘)、“放棄指令”(用戶操作到一半,突然選擇放棄)、“刪除任務(wù)”(如刪除此前設(shè)置好的鬧鐘)、“修改指令”(用戶一開始定的早上8點(diǎn)的鬧鐘,操作中突然說要把這個(gè)鬧鐘改到9點(diǎn))等等,這里就不一一列舉。
任務(wù)型對(duì)話的流程設(shè)計(jì)
與做APP一樣,在設(shè)計(jì)“任務(wù)型對(duì)話”的流程時(shí),我們同樣需要考慮盡可能多的操作與情景。
1. 槽位完整表達(dá)時(shí)
以定鬧鐘為例,“設(shè)置一個(gè)明早八點(diǎn)的鬧鈴”:設(shè)置鬧鈴是相應(yīng)需要執(zhí)行的操作,明早是日期,八點(diǎn)是具體時(shí)間。因此這樣一段對(duì)話其槽位都是完整的,流程也是最簡單的,因?yàn)橛脩粢呀?jīng)把所有的信息都說完整了,設(shè)備只需要執(zhí)行就可以了。
2. 槽位部分表達(dá)時(shí)
“明天叫我起床”,顯然缺少具體時(shí)間的槽位,雖然相應(yīng)的執(zhí)行操作內(nèi)容是完整的,但因?yàn)槿笔畔?,依然?dǎo)致任務(wù)無法完成,所以設(shè)備會(huì)發(fā)起新一輪的對(duì)話,要求用戶補(bǔ)充對(duì)應(yīng)確實(shí)的槽位。
這種情況相對(duì)也常見,很多用戶會(huì)先說:“給我定個(gè)鬧鐘”,等到機(jī)器響應(yīng)之后,再說“定到明天早上八點(diǎn)”。
3. 含有分支流程時(shí)
即在一輪對(duì)話中,即使用戶槽位表達(dá)完整,但因?yàn)槌霈F(xiàn)了分支情況,導(dǎo)致任務(wù)依然無法立刻執(zhí)行。比如:用戶說“打電話給張三”,但也許用戶不止有一張卡,這個(gè)時(shí)候就產(chǎn)生了“用哪張卡撥號(hào)”的分支;也許用戶通訊錄中不止有一位聯(lián)系人叫張三的,那這個(gè)時(shí)候的分支流程又變成了“呼叫哪個(gè)張三”的情況。
類似這種,在一輪“任務(wù)對(duì)話”過程中,出現(xiàn)了分支流程時(shí),對(duì)應(yīng)的操作又應(yīng)該怎么設(shè)計(jì),這就要求產(chǎn)品經(jīng)理能充分考慮到用戶在不同情況下的一個(gè)需求,從而進(jìn)一步完善相對(duì)應(yīng)的功能。
4. 主動(dòng)或意外退出時(shí)
也許是設(shè)備還沒有執(zhí)行完成任務(wù)時(shí),突然退出的情況,在這里包括:用戶關(guān)閉相關(guān)功能、用戶放棄操作等情況。如果是用戶直接強(qiáng)行退出程序,自然也沒有后續(xù)進(jìn)程可言,但也許可以考慮到,當(dāng)用戶重新啟動(dòng)該功能時(shí),設(shè)備是否可以自動(dòng)詢問:“上次我們還有一個(gè)任務(wù)沒有完成,是XXX,是否將其繼續(xù)完成”。
但如果是用戶停止了任務(wù),比如用戶說“給我定個(gè)鬧鐘”,但就在設(shè)備詢問“要定幾點(diǎn)?”的時(shí)候,用戶說“算了,不用了”,那這個(gè)時(shí)候,設(shè)備應(yīng)該如何回復(fù)。
因此在這一環(huán)節(jié)主要考慮的就是當(dāng)一場(chǎng)“任務(wù)型對(duì)話”結(jié)束時(shí),設(shè)備可以執(zhí)行怎樣的一個(gè)操作,來反饋給用戶。
總結(jié)
以上就是關(guān)于“語音交互產(chǎn)品設(shè)計(jì)原則”的簡單贅述,最重要的一點(diǎn)是:當(dāng)我們?cè)谠O(shè)計(jì)語音交互的功能時(shí),我們應(yīng)該結(jié)合實(shí)際問題,從實(shí)際出發(fā),把語音交互作為一種更高效的生產(chǎn)力,從而給用戶帶來更好的體驗(yàn),帶來更高的效益,而不是作為一種噱頭添加到我們的產(chǎn)品中去。
本文由 @二十一弦 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
請(qǐng)問,打電話給某某,如果是同名的,該怎么處理
可以語音提示,找到xx個(gè)都叫張三的,你想打給哪一個(gè),然后可以默認(rèn)設(shè)置經(jīng)常聯(lián)系的那個(gè)排在首位方便用戶查看。如果是視覺障礙的,可以再播報(bào)手機(jī)號(hào)
無屏,播報(bào)手機(jī)號(hào),你覺得用戶有多大的概率能根據(jù)手機(jī)號(hào)區(qū)分哪個(gè)手機(jī)號(hào)是誰的?
如果默認(rèn)撥給經(jīng)常聯(lián)系的那個(gè)號(hào),那我不經(jīng)常聯(lián)系的那個(gè)號(hào)是不是就永遠(yuǎn)都撥不出去?
1、作為聯(lián)系人,如果姓名相同,那能產(chǎn)生區(qū)分度的除了手機(jī)號(hào),就只有備注或者分組之類的信息,那就一樣的概念,語音播放其他信息
2、我沒有說“默認(rèn)撥給經(jīng)常聯(lián)系的那個(gè)號(hào)”,而是默認(rèn)設(shè)置排在首位,也就是更直觀的顯示,只要你要打哪個(gè),完全可以選擇
3、你所假設(shè)的情境,其實(shí)就是:1、屏幕損壞或者視覺障礙,無法顯示內(nèi)容;2、也沒有事先將相關(guān)同名聯(lián)系人進(jìn)行區(qū)分,同一個(gè)名字的聯(lián)系人除了號(hào)碼不同其他方面完全一樣;3、同時(shí)用戶還區(qū)分不了手機(jī)號(hào),然后他需要打給那個(gè)人。我倒是想聽聽你對(duì)于這種極端情況怎么看
現(xiàn)在有一種產(chǎn)品形態(tài)較無屏音箱,但是需要有打電話功能。剛好看到你這篇文章,所以才向你請(qǐng)教。
無屏音箱,就是沒有屏幕,并不是屏幕損壞,或者視覺障礙。比如天貓精靈。