語(yǔ)音交互——對(duì)話設(shè)計(jì)原則
編輯導(dǎo)語(yǔ):對(duì)話設(shè)計(jì)是語(yǔ)音交互設(shè)計(jì)中的重要環(huán)節(jié),有效的對(duì)話設(shè)計(jì)可以讓用戶擁有更加流暢的體驗(yàn),并在幫助用戶解決相應(yīng)問(wèn)題時(shí),給予用戶一定的溫度感。本篇文章里,作者總結(jié)了人機(jī)交互中對(duì)話設(shè)計(jì)的原則與注意事項(xiàng),一起來(lái)看一下。
為用戶解決問(wèn)題,建立有溫度的對(duì)話交流是設(shè)計(jì)師的共同愿景。對(duì)話設(shè)計(jì)是語(yǔ)音交互中最重要的一環(huán),也是最能體現(xiàn)智能助手智商和情商的一環(huán),它將直接影響用戶和計(jì)算機(jī)之間的交流。
筆者按照自身經(jīng)驗(yàn),以及Google、亞馬遜和阿里提供的語(yǔ)音交互設(shè)計(jì)指南,總結(jié)了以下內(nèi)容供各位設(shè)計(jì)師作參考。
對(duì)話設(shè)計(jì)前你需要了解的事項(xiàng):
一、考慮計(jì)算機(jī)的局限
語(yǔ)音交互設(shè)計(jì)是設(shè)計(jì)人類和計(jì)算機(jī)之間的對(duì)話,因此我們?cè)谠O(shè)計(jì)前要考慮技術(shù)的優(yōu)勢(shì)和不足。
在很多方面,計(jì)算機(jī)都很容易超越人類,它們可以快速找到并共享信息;不厭倦被問(wèn)到重復(fù)的問(wèn)題,不會(huì)被命令給冒犯到。
但是計(jì)算機(jī)在很多方面都不如人類。技術(shù)的局限性引入了人與人對(duì)話中不會(huì)發(fā)生的場(chǎng)景,例如人機(jī)對(duì)話時(shí)需要以特定的單詞或短語(yǔ)開(kāi)頭,例如“Ok Google”;用戶說(shuō)的話需要轉(zhuǎn)變?yōu)榻Y(jié)構(gòu)化數(shù)據(jù)才能被計(jì)算機(jī)理解,中途出現(xiàn)一些不穩(wěn)定因素都會(huì)導(dǎo)致計(jì)算機(jī)理解失敗,這些局限性應(yīng)該提前提示用戶。
另外,當(dāng)你的語(yǔ)音系統(tǒng)還達(dá)不到很聰明、隨意交流的程度,那么就不應(yīng)該讓用戶誤認(rèn)為它可以達(dá)到。提前讓用戶了解到語(yǔ)音系統(tǒng)的局限可以規(guī)避用戶問(wèn)一些千奇百怪的問(wèn)題。
二、確認(rèn)用戶場(chǎng)景
為了實(shí)現(xiàn)個(gè)性化和場(chǎng)景化設(shè)計(jì),我們可以通過(guò)技術(shù)手段獲取用戶地址、時(shí)間和用戶身份(包括聲紋、用戶注冊(cè)信息)等信息,在設(shè)計(jì)對(duì)話腳本前我們需要考慮以下幾個(gè)場(chǎng)景相關(guān)的問(wèn)題:
- 用戶在哪里?所處的環(huán)境是怎樣的?
- 用戶正在做什么?
- 用戶使用的是什么設(shè)備?
- 用戶要完成什么任務(wù)?目標(biāo)是什么?
- 用戶的期望和意圖是什么?
三、明確你要設(shè)計(jì)的技能是什么?
不同類型的技能面向不同的用戶群體和用戶場(chǎng)景,在設(shè)計(jì)前明確要設(shè)計(jì)的技能是什么。
2019年亞馬遜Alexa的技能總數(shù)已經(jīng)超過(guò)100,000項(xiàng),技能類型包括娛樂(lè)游戲、新聞、教育、生活、趣味搞笑、效率、天氣、音樂(lè)影視、智能家居、運(yùn)動(dòng)、飲食、財(cái)經(jīng)、當(dāng)?shù)?、旅行交通、電影電視、公共服?wù)、社交、購(gòu)物、車聯(lián)網(wǎng)。而音樂(lè)影視、游戲娛樂(lè)、生活和智能家居19種分類,而音樂(lè)影視、游戲娛樂(lè)、生活和智能家居技能占絕大多數(shù)。所有的技能都可以分為播報(bào)型、指令型和互動(dòng)型三類。
1. 播報(bào)型
為用戶提供內(nèi)容服務(wù),例如音樂(lè)、新聞、百科、食譜、故事等等。
2. 指令型
為用戶和生活服務(wù)建立一座工具橋梁,幫助用戶解放雙手,通過(guò)語(yǔ)音就能控制家居、發(fā)送短信、叫外賣等等。
3. 互動(dòng)型
用戶通過(guò)多輪對(duì)話的方式與設(shè)備交互。主要用于在娛樂(lè)領(lǐng)域,如問(wèn)答測(cè)試、情景探險(xiǎn)、識(shí)圖對(duì)話、聽(tīng)音唱歌等功能。
2019年亞馬遜Alexa團(tuán)隊(duì)針對(duì)用戶評(píng)論、評(píng)分、參與度、用戶體驗(yàn)和創(chuàng)新性5個(gè)維度公布了Alexa十大技能,都屬于播報(bào)型和互動(dòng)型技能,其中七項(xiàng)是游戲和問(wèn)答測(cè)試類型,另外三項(xiàng)分別是Spotify音樂(lè),導(dǎo)游冥想和TED演講。
四、明確你要設(shè)計(jì)的對(duì)話類型是什么?
不同的技能對(duì)應(yīng)著不同的對(duì)話類型,從應(yīng)用場(chǎng)景的覆蓋面看,對(duì)話類型可以分為開(kāi)放域(Open-domain)和封閉域(Closed-domain)兩大類。
開(kāi)放域?qū)υ掝愋蜎](méi)有太多限定的主題或明確的目標(biāo),用戶和語(yǔ)音助手之間可以進(jìn)行各種話題的自由對(duì)話,它更像一種圖靈測(cè)試,難度很大,需要大量的知識(shí)庫(kù)和復(fù)雜的模型,一般用于閑聊場(chǎng)景。
封閉域?qū)υ掝愋屯ǔ?huì)限定在一定場(chǎng)景之下,有若干明確的目標(biāo)和限定的知識(shí)范圍,目標(biāo)也更加清晰明確,例如正常人不會(huì)和電商導(dǎo)購(gòu)交流情感問(wèn)題。
正因如此,封閉域?qū)υ掝愋蛯?duì)對(duì)話的質(zhì)量要求更高,錯(cuò)誤的容忍度更低,它需要一個(gè)垂直領(lǐng)域建立的模型和知識(shí)圖譜。封閉域?qū)υ掝愋鸵话阌糜谌蝿?wù)、問(wèn)答或者娛樂(lè)場(chǎng)景。
基于以上的總結(jié),對(duì)話類型主要分以下四種,它們有各自的特點(diǎn)。
1. 任務(wù)類型
任務(wù)類型的對(duì)話指在特定條件下為帶有明確目的的用戶提供信息或者服務(wù)。
在智能家居場(chǎng)景下,一般可以通過(guò)單輪對(duì)話實(shí)現(xiàn)設(shè)備的操控。如果用戶的需求需要多輪互動(dòng),那么任務(wù)類型的對(duì)話需要通過(guò)詢問(wèn)、澄清和確認(rèn)來(lái)幫助用戶明確目的。
任務(wù)類型的對(duì)話主要用于智能助手應(yīng)用上,例如Siri、小愛(ài)同學(xué)和天貓精靈。
- 特點(diǎn):設(shè)計(jì)起來(lái)比較復(fù)雜,非常依賴意圖識(shí)別技術(shù),通常使用意圖識(shí)別+多輪對(duì)話+對(duì)接內(nèi)容提供商的API和知識(shí)圖譜。
- 目標(biāo):用最短的對(duì)話輪次來(lái)完成用戶的任務(wù),通過(guò)對(duì)話所獲取的信息轉(zhuǎn)換成需要的參數(shù)。比如“明天北京天氣怎么樣”。地點(diǎn)是北京,時(shí)間是明天,意圖是天氣。這些都要在意圖設(shè)計(jì)時(shí)提前設(shè)計(jì)好。
2. 問(wèn)答類型
問(wèn)答類型的對(duì)話需要回答“怎么設(shè)定鬧鐘”、“什么是巡航系統(tǒng)”等問(wèn)題,而這些問(wèn)題也是一種任務(wù),所以問(wèn)答類型和任務(wù)類型的對(duì)話有一定的相似性。
問(wèn)答類型的對(duì)話一般用于客服機(jī)器人上,例如京東的JM客服機(jī)器人和阿里的云小蜜客服機(jī)器人。它們能和用戶進(jìn)行基本溝通并自動(dòng)回復(fù)用戶有關(guān)產(chǎn)品或服務(wù)相關(guān)的問(wèn)題,當(dāng)問(wèn)題回答不了時(shí)可以轉(zhuǎn)向人工客服,降低企業(yè)客服運(yùn)營(yíng)成本的同時(shí)兼顧用戶體驗(yàn)。
- 特點(diǎn):意圖設(shè)計(jì)非常簡(jiǎn)單,一般抓住關(guān)鍵詞“為什么”和“是什么”即可,然后通過(guò)FAQ+對(duì)接內(nèi)容提供商的API和知識(shí)圖譜回答用戶的問(wèn)題。
- 目標(biāo):用最短的對(duì)話輪次來(lái)回答用戶的問(wèn)題。
3. 閑聊類型
前面提到閑聊類型的對(duì)話屬于開(kāi)放域類型,因此它是一種沒(méi)有明確目的的對(duì)話,語(yǔ)音助手不知道用戶下一句話會(huì)說(shuō)什么,主要根據(jù)用戶對(duì)話中出的關(guān)鍵詞進(jìn)行回復(fù)。閑聊類型的對(duì)話一般用于智能助手應(yīng)用上。
- 特點(diǎn):不精準(zhǔn),不可控。機(jī)器的回復(fù)會(huì)在閑聊庫(kù)當(dāng)中,通過(guò)檢索給出相應(yīng)的回復(fù)。
- 目標(biāo):對(duì)話輪次越多越好,一直聊下去就行。
4. 游戲/娛樂(lè)類型
游戲/娛樂(lè)類型的對(duì)話結(jié)合了任務(wù)和閑聊類型的特點(diǎn),還要結(jié)合游戲類型、趣味性等因素進(jìn)行設(shè)計(jì),一般用于智能助手應(yīng)用上。
- 特點(diǎn):腳本分支多,游戲型還需要考慮故事線,設(shè)計(jì)起來(lái)比較復(fù)雜。
- 目標(biāo):讓用戶放輕松。
五、提前定義好智能助手的人物設(shè)定
智能助手的人物設(shè)定會(huì)影響回復(fù)話術(shù)的設(shè)計(jì),所以提前確認(rèn)好智能助手的核心關(guān)鍵詞和畫(huà)像可以避免后續(xù)回復(fù)話術(shù)的修改。
六、了解對(duì)話的關(guān)鍵因素
Google的設(shè)計(jì)師通過(guò)解構(gòu)那些我們習(xí)以為常的自然對(duì)話中的規(guī)則和慣例,挖掘出一個(gè)好的VUI對(duì)話的關(guān)鍵因素。
在語(yǔ)音交互設(shè)計(jì)指南Actions on Google Design中提到,構(gòu)建一個(gè)好的VUI對(duì)話需要考慮以下4個(gè)部分。
1. 話輪轉(zhuǎn)換(Turn-taking)
在對(duì)話交流中,我們會(huì)在一些往返的微妙信號(hào)中輪流說(shuō)話。如果沒(méi)有有效的輪換,會(huì)導(dǎo)致對(duì)話過(guò)程中雙方同時(shí)說(shuō)話,或者對(duì)話內(nèi)容會(huì)不同步并且難以被理解的情況。
因此輪到用戶說(shuō)話時(shí),智能助手應(yīng)該發(fā)出清晰的信號(hào),例如音效提醒。用戶說(shuō)話時(shí)智能助手不要貿(mào)然強(qiáng)行打斷。如果是詢問(wèn)用戶問(wèn)題,那就不要在用戶回答的時(shí)候又突然插入一些其他問(wèn)題或者指令。
2. 對(duì)話線索(Treading)
在自然交流中,對(duì)話中的上下文、對(duì)話隨時(shí)間演變的方式等對(duì)話元素都會(huì)連貫地交織在一條主線上。對(duì)話中的對(duì)話線索可以幫我們更容易跟上對(duì)話流的節(jié)奏。
3. 利用語(yǔ)音固有的效率
人們經(jīng)常使用較為簡(jiǎn)短的口頭表達(dá)方式,因?yàn)樗麄兡軌蚨床斐龃蠹以谡f(shuō)什么?;旧衔覀兌伎梢愿兄鲆粋€(gè)對(duì)話中的“言外之意”,也知道有些東西是不需要被直接說(shuō)出來(lái)的。但是VUI中的隱喻必須能夠彌補(bǔ)人類語(yǔ)言中看似不合邏輯、非理性的部分。
4. 預(yù)測(cè)不同的用戶行為
人們會(huì)用不同的詞語(yǔ)和風(fēng)格去描述同樣的事情,這取決于他們自己的情景語(yǔ)境和自己早前經(jīng)驗(yàn)產(chǎn)生的對(duì) VUI 的預(yù)期,因此 VUI 應(yīng)該支持這些差異,用戶才能擁有一個(gè)無(wú)損的體驗(yàn)。
七、遵循會(huì)話“合作原則”
有研究表明,人們對(duì)技術(shù)的反應(yīng)就像對(duì)另一個(gè)人的反應(yīng)一樣。這意味著用戶在和智能助手交互時(shí),也會(huì)依賴他們現(xiàn)有的人與人對(duì)話方式。
美國(guó)語(yǔ)言哲學(xué)家格萊斯(Paul Grice)認(rèn)為,在人們交際過(guò)程中,對(duì)話雙方似乎在有意無(wú)意地遵循著某一原則,以求有效地配合從而完成交際任務(wù)。因此,格賴斯提出了會(huì)話中的“合作原則”,語(yǔ)音交互可以考慮跟從對(duì)話合作原則進(jìn)行設(shè)計(jì)。
- 量的準(zhǔn)則:所說(shuō)的話應(yīng)該滿足且不超出交際所需的信息量。
- 質(zhì)的準(zhǔn)則:不要說(shuō)自知是虛假和缺乏足夠證據(jù)的話。
- 關(guān)系準(zhǔn)則:所說(shuō)的話要貼切, 要與交談目的和方向有關(guān)系,不說(shuō)不相干的話。
- 方式準(zhǔn)則:所說(shuō)的話要簡(jiǎn)潔明了,別拐彎抹角產(chǎn)生歧義。
然而,人們?cè)趯?shí)際言語(yǔ)交際中,并非總是遵守“合作原則”,有些時(shí)候人們會(huì)故意違反合作原則。格萊斯把這種通過(guò)表面上故意違反“合作原則”而產(chǎn)生的言外之意稱為“特殊會(huì)話含義”,它是需要依賴特殊語(yǔ)境才能推導(dǎo)出來(lái)的含義。
舉個(gè)例子:A和B在談?wù)撘徊侩娪啊?/p>
A:“你覺(jué)得這部電影怎么樣???”
B:“場(chǎng)面倒是很壯觀,服裝也很耀眼?!?/p>
表面上B并沒(méi)有回答A的問(wèn)題說(shuō)出這部電影怎么樣,但是不可否認(rèn)的是,B的話語(yǔ)有自己的內(nèi)在意義。B的回答暗指除了耀眼的服裝和壯觀的場(chǎng)面,電影本身并沒(méi)有什么吸引人的地方。這內(nèi)在意義需要通過(guò)語(yǔ)境推斷出來(lái),這樣的含義就是特殊會(huì)話含義。
盡管大部分的幽默源于特殊會(huì)話含義,但我們?cè)谠O(shè)計(jì)腳本過(guò)程中,盡量避免使用這種對(duì)話方式,避免用戶一時(shí)半刻理解不了這句話的意思。
八、對(duì)話不存在“出錯(cuò)”的概念
邏輯和準(zhǔn)確性不是萬(wàn)能法則,人類口語(yǔ)表達(dá)通常會(huì)呈現(xiàn)出各種毫無(wú)道理的話。用戶任何請(qǐng)求都是有目的的,他們總是希望完成某些任務(wù),即使沒(méi)有明確說(shuō)出來(lái)。
這時(shí)候,不要管用戶說(shuō)了什么,不要把它當(dāng)成是一個(gè)錯(cuò)誤來(lái)處理,而是考慮如何把它轉(zhuǎn)變?yōu)橐粋€(gè)機(jī)會(huì),把它當(dāng)做是對(duì)話中的轉(zhuǎn)折點(diǎn),用新的方式來(lái)處理,從而推進(jìn)更順暢、更自然的溝通。
以下方法有助于把“錯(cuò)誤”轉(zhuǎn)化為對(duì)話交互中自然的一部分:
- 不要把技術(shù)上的“出錯(cuò)”當(dāng)做用戶的錯(cuò)誤。
- 對(duì)于不同類型的“出錯(cuò)”提供對(duì)應(yīng)適合的處理方式。
- 通過(guò)提供幫助來(lái)避免出錯(cuò)。
- 要知道在什么情況下放棄。
- 使完成任務(wù)的路徑更強(qiáng),來(lái)掩蓋錯(cuò)誤。
#專欄作家#
薛志榮,微信公眾號(hào):薛志榮,人人都是產(chǎn)品經(jīng)理專欄作家。暢銷書(shū)《AI改變?cè)O(shè)計(jì)-人工智能時(shí)代的設(shè)計(jì)師生存手冊(cè)》作者,全棧開(kāi)發(fā)者,專注于交互設(shè)計(jì)和人工智能設(shè)計(jì)。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自 Unsplash,基于CC0協(xié)議。
專欄作家
薛志榮,微信公眾號(hào):薛志榮,人人都是產(chǎn)品經(jīng)理專欄作家。暢銷書(shū)《AI改變?cè)O(shè)計(jì)-人工智能時(shí)代的設(shè)計(jì)師生存手冊(cè)》作者,全棧開(kāi)發(fā)者,專注于交互設(shè)計(jì)和人工智能設(shè)計(jì)。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自 Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!