日本欧洲亚洲精品在线观看，中文字幕亚洲第16页，最新AV网站在线看，精品国产亚洲第一区二区三区，亚洲午夜无码影片免费，日韩精品一区二区四区五区，欧美精品久久国产欧美日韩，丝袜制服欧洲亚洲中文

搜索

APP

起點(diǎn)課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

發(fā)布

注冊 | 登錄

針對“語音助手”類產(chǎn)品，淺談對話式交互設(shè)計(jì)

Darcy

2019-06-27

1 評論 8157 瀏覽 73 收藏

17 分鐘

今天給大家分享一篇針對“語音助手”類產(chǎn)品的對話式交互進(jìn)行討論的文章，希望帶給你更多幫助。

說到語音設(shè)計(jì)大家腦海里會浮現(xiàn)出各種科幻場景，其實(shí)語音設(shè)計(jì)離我們并不遠(yuǎn)，可能我們太過于熟悉，以至于忽視它的存在。

剛好自己對這一領(lǐng)域充滿好奇，就以Siri、天貓精靈和小愛同學(xué)這三款產(chǎn)品體驗(yàn)為本，結(jié)合《語音用戶界面設(shè)計(jì)》這本書的內(nèi)容，寫了這篇文章。

本文主要針對“語音助手”類產(chǎn)品的對話式交互進(jìn)行討論。

一、前世今生

看看這段話：“業(yè)務(wù)查詢請按1，手機(jī)充值請按2”。每次撥打10086時(shí)，都能聽到這樣的回答。

這種語音交互形式叫“交互式語音應(yīng)答（Interactive Voice Response，IVR）”，這也是語音設(shè)計(jì)的第一個(gè)階段，起源于20世紀(jì)90年代。

還有我們熟悉的電話訂票，電話股票交易等，都屬于這個(gè)階段的產(chǎn)物。

這個(gè)階段的語音設(shè)計(jì)，為復(fù)雜的功能提供了自助的語音處理方案。語音交互的內(nèi)容已經(jīng)提前設(shè)定好，用戶帶著疑問作出特定的回答，語音系統(tǒng)就會給出指定的答案。

接下來的時(shí)代，各種智能設(shè)備普及了，也誕生了Siri、Google Now等語音助手，以及這幾年挺火的智能音箱。

如：小愛同學(xué)、天貓精靈和騰訊聽聽等，幾乎所有的行業(yè)巨頭都參與這場盛宴，這是語音設(shè)計(jì)的第二個(gè)階段，也是目前所處的階段。

二、設(shè)計(jì)核心點(diǎn)

語音交互是一種包含豐富信息的互動形式，在設(shè)計(jì)語音交互時(shí)，可以從對話模式、引導(dǎo)式回答、自然溝通作為設(shè)計(jì)的核心考慮點(diǎn)。

1. 對話模式

談?wù)Z音設(shè)計(jì)就離不開討論語言溝通，在日常生活中，人們之間的對話溝通從語速、用詞和前后對話的內(nèi)容等，就可以讓對方了解到說話者表達(dá)的內(nèi)容和情緒的變化。

（1）單輪對話

單輪對話是指對話內(nèi)容不包含情景，沒有關(guān)聯(lián)上下文內(nèi)容。這種對話模式導(dǎo)致語音交互更偏向于簡短的操作任務(wù)，過于復(fù)雜的操作任務(wù)，則需要分解成簡短的口令。

比如：“播放陳奕迅的歌”大多數(shù)語音系統(tǒng)是可以識別的；而如果說“介紹下陳奕迅”，然后再說“播放他的代表歌曲”，這種需要上下文關(guān)聯(lián)、復(fù)雜的對話模式，現(xiàn)階段大多數(shù)語音助手是無法識別的。

淺談?wù)Z音設(shè)計(jì)

（2）連續(xù)對話

語音交互的對話模式還有另一種類型，它們搭載了自然語音處理系統(tǒng)，使用場景也打破單輪對話的限制，它們就是聊天機(jī)器人，也叫伴侶式機(jī)器人。

它們定位更偏向模擬人類對話，研究人機(jī)對話的領(lǐng)域。相信未來語音助手也可以結(jié)合對話式聊天模式，實(shí)現(xiàn)自然聊天并準(zhǔn)確的進(jìn)行功能操作。

比如：小米的小愛同學(xué)，有一個(gè)隱藏的技能“打開閑聊”，開啟后可以進(jìn)行連續(xù)對話模式。微軟小冰也是聊天機(jī)器人方面比較成熟的產(chǎn)品之一。

淺談?wù)Z音設(shè)計(jì)

2. 引導(dǎo)式回答

在單輪對話模式的限制中，需要特別留意語音系統(tǒng)的回答，引導(dǎo)用戶正確使用簡短的語音對話。

（1）確認(rèn)模式

語音交互的確認(rèn)模式，可以分為顯性確認(rèn)與隱性確認(rèn)兩種類型。

顯性確認(rèn)，是一種強(qiáng)制用戶確認(rèn)的方式。主要用于涉及錢財(cái)或者會帶來嚴(yán)重影響的操作行為中。

當(dāng)用戶說幫我充個(gè)話費(fèi)時(shí)，這里涉及錢財(cái)支出，則語音系統(tǒng)應(yīng)該重復(fù)一次即將執(zhí)行的命令，用戶確認(rèn)答復(fù)后，平臺再進(jìn)行對應(yīng)的操作。

比如：讓天貓精靈幫忙充話費(fèi)，天貓精靈在進(jìn)行支付前，會讓用戶確認(rèn)一次充值內(nèi)容，當(dāng)用戶給予肯定回答后，天貓精靈才會進(jìn)行充值支付操作。

淺談?wù)Z音設(shè)計(jì)

隱性確認(rèn)，是根據(jù)識別的可信度進(jìn)行弱確認(rèn)的方式。

系統(tǒng)對語音內(nèi)容進(jìn)行打分評級，當(dāng)可信度等級為高時(shí)，確認(rèn)是可信的命令，直接執(zhí)行對應(yīng)的操作。無需用戶再進(jìn)行確認(rèn)，或重復(fù)一次反饋結(jié)果。

比如：對Siri說“打開支付寶付款碼”，Siri會直接打開支付寶軟件的付款碼頁面，并在界面弱提示正在打開支付寶。這個(gè)過程不需要用戶再去確認(rèn)，因?yàn)檫@是一個(gè)可信的操作。

當(dāng)可信度等級為中等時(shí)，系統(tǒng)執(zhí)行對應(yīng)的操作后，還需要對操作進(jìn)行隱性確認(rèn)，讓用戶知道為什么會執(zhí)行當(dāng)前的操作。

比如：在晚上對天貓精靈說“早上好”時(shí)，天貓精靈會播放晚間資訊，并告知現(xiàn)在是晚上，明天上午說“早上好”可以播放資訊等。

如下圖所示（晚間資訊通過語音播放，界面沒有展示文本）。

淺談?wù)Z音設(shè)計(jì)

當(dāng)可信度等級為低時(shí)，系統(tǒng)應(yīng)該明確告知用戶，無法識別有效的語音內(nèi)容。

總的來說，隱性確認(rèn)是讓用戶知道為什么會這樣操作，用戶收到語音系統(tǒng)的反饋就行。顯性確認(rèn)則是需要用戶明確確認(rèn)的過程。

（2）錯(cuò)誤引導(dǎo)

現(xiàn)階段語音系統(tǒng)無法避免錯(cuò)誤識別或無法識別的情況。

出錯(cuò)不要緊，如何改善機(jī)器的錯(cuò)誤反饋才是重點(diǎn)。

當(dāng)機(jī)器無法識別或識別的內(nèi)容屬于低可信度時(shí)，機(jī)器需要引導(dǎo)用戶去用正確的語句結(jié)構(gòu)來對話，千萬不要自作聰明地嘗試回答。

比如：跟Siri對話時(shí)，如果Siri沒有檢測到語音，則會通過界面，給予文字反饋；超時(shí)沒說話時(shí)，則會展示“你可以這樣問我”的引導(dǎo)頁。

當(dāng)遇到Siri無法回答的問題時(shí)，則會給予簡單的文字引導(dǎo)。

淺談?wù)Z音設(shè)計(jì)

跟小愛同學(xué)對話時(shí)，經(jīng)常會遇到跑題的情況。這種過度自信的回答很容易給用戶帶來負(fù)面感受。

淺談?wù)Z音設(shè)計(jì)

（3）語音之外的反饋

對于語音助手類產(chǎn)品來說，語音是一種交互方式，但不是唯一的。產(chǎn)品一般會搭配硬件和軟件來使用。

所以除了語音之外，不要忽略其他反饋的渠道。

同時(shí)語音交互有自身的優(yōu)勢，可以不受物理位置的影響，可以簡單快捷的上手學(xué)習(xí)，不需要去學(xué)習(xí)界面的操作。但是界面交互也有自身優(yōu)勢，如展示列表類內(nèi)容等復(fù)雜信息。

比如：讓小愛同學(xué)播放歌曲時(shí)，小愛同學(xué)會通過語音形式播放對應(yīng)的歌，但也會在界面中靜默展示播放列表。

淺談?wù)Z音設(shè)計(jì)

除了界面的輔助反饋外，也不要忘記物理反饋。在喚醒小愛同學(xué)和天貓精靈時(shí)，這兩個(gè)音箱都會亮起燈光，用于示意已經(jīng)喚醒設(shè)備，正在接收語音內(nèi)容中。

淺談?wù)Z音設(shè)計(jì)

3. 自然溝通

對于自然溝通的語音設(shè)計(jì)來說，可以嘗試以下幾個(gè)方向。

（1）個(gè)性化

每個(gè)人都有自己的說話方式，跟機(jī)器進(jìn)行對話也會帶著自己的習(xí)慣。每個(gè)語音系統(tǒng)也可以有自己的個(gè)性，這是設(shè)計(jì)者可以考慮塑造的機(jī)器人格。

比如：分別問天貓精靈、小愛同學(xué)、Siri“你喜歡什么顏色”，可以得到三種不同類型的回答。

如圖可以看出Siri、天貓精靈和小愛同學(xué)都有自己的性格差異。

淺談?wù)Z音設(shè)計(jì)

當(dāng)調(diào)戲Siri和小愛同學(xué)，不斷重復(fù)它們的回答時(shí)。

Siri會帶有情緒地說“奇怪，難道這里有回音”。而小愛同學(xué)會帶有情緒地說“別鬧，我才是小愛”。

淺談?wù)Z音設(shè)計(jì)

甚至問Siri圓周率是多少時(shí)，它還會加上一些“無意義”的語氣詞，如“呼氣！”。

可惜的是，Siri并不是真正模擬呼氣的過程，而是用平緩的語氣念出了“呼氣”兩個(gè)字，這也許是出于對“恐怖谷理論”的擔(dān)憂吧。

淺談?wù)Z音設(shè)計(jì)

（2）本土文化

本土文化也是自然溝通的考慮因素之一，不同文化所用的語言不同，導(dǎo)致在選詞造句上都存在很大的差異。

像日常溝通中，人們會用上諺語來表達(dá)自己想描述的內(nèi)容。在語音助手類產(chǎn)品中，Siri是做得比較好的。

比如：當(dāng)遇到英文單詞時(shí)，Siri會用中文讀出來。說謝謝時(shí)，Siri會引用“一家人不說兩家話”這樣的地方用語來回答。

淺談?wù)Z音設(shè)計(jì)

（3）語意分析

對于實(shí)現(xiàn)自然溝通來說，語意分析算是重點(diǎn)，也是難點(diǎn)之一。在很多語言中，同一個(gè)詞在不同場景下說出來，經(jīng)常表達(dá)著不同的含義。

像“晚上好”，我們也可以用“晚安”來表達(dá)。“早上好”甚至可以省略為一個(gè)“早”字，在語音設(shè)計(jì)的過程中，建立用戶詞庫以及關(guān)鍵詞歸類，可以更自然的分析用戶的語意。

通過通配符和邏輯表達(dá)式，系統(tǒng)可以更好的識別含義相近的語句。

將“電腦慢”這樣的關(guān)鍵詞定義為通配符，并將“名詞+形容詞”的語句表達(dá)式定義為歸為同一類邏輯。系統(tǒng)就可以認(rèn)為“電腦慢”、“電腦很慢”、“電腦真的很慢”等等相近含義的語句歸為同一含義。這有點(diǎn)像微信公眾號的關(guān)鍵詞自動回復(fù)一樣。

通過建立詞庫的形式，也能實(shí)現(xiàn)更自然的語意分析。

詞庫有兩種建立的方案，一種是將整理歸納好的詞庫，提前內(nèi)置到語音助手中。另一種則是提供自定義功能，讓用戶在日常使用中，不斷去教育，修正語音助手的詞庫。這就像輸入法的詞庫設(shè)計(jì)一樣。

比如：對天貓精靈說關(guān)閉、睡覺、閉嘴、安靜等，都可以觸發(fā)設(shè)備的關(guān)閉操作。而小愛同學(xué)有“小愛訓(xùn)練”，用戶可以自定義關(guān)鍵詞并定義該關(guān)鍵詞要執(zhí)行的操作。

這是主動去教育語音助手，形成用戶獨(dú)有詞庫的方式。

淺談?wù)Z音設(shè)計(jì)

通過分析語句中的通配符，未來還有很多可能性。

當(dāng)人感覺到生氣時(shí)，常用命令式的對話，同時(shí)會用上情緒用詞，通過這些詞匯，語音助手可以更精確的識別使用者的情緒變化，做出更自然的回復(fù)。

但在準(zhǔn)確率還無法保證的情況下，謹(jǐn)慎把語音助手做得過分“智能”，因?yàn)樽R別錯(cuò)誤率過高，更容易引起用戶的負(fù)面情緒。

（4）過度關(guān)懷

想象下，你跟朋友說“晚安”，朋友回復(fù)你“晚安，做個(gè)好夢哦。明天深圳的天氣是晴轉(zhuǎn)多云……”

可能偶爾一兩次，還會覺得這位朋友好貼心，睡覺前還告訴你明天的天氣。但長期接觸后，就會覺得這位朋友好啰嗦，這個(gè)故事來源于小愛同學(xué)的晚安反饋，每次說晚安都過度關(guān)懷用戶。

對于語音助手來說，雖然趨勢是擬人化，但設(shè)計(jì)者要把握擬人的程度，語音助手自身提供的語音反饋應(yīng)該是簡明的單一操作。復(fù)雜的組合操作應(yīng)該由輔助屏幕來呈現(xiàn)，或是由用戶自定義語音任務(wù)來觸發(fā)。

三、總結(jié)

語音交互相對界面交互，還存在一些缺點(diǎn)：在公共場景使用會有點(diǎn)尷尬。有些用戶存在心理障礙，不適應(yīng)跟機(jī)器對話。豐富的信息內(nèi)容也不合適單獨(dú)用語音來表示。

雖然存在這些缺點(diǎn)，但是語音交互還是會成為未來主流交互方式之一。它可以釋放雙手，學(xué)習(xí)門檻也更低，用戶直覺的說出操作就行，不需要去學(xué)習(xí)界面交互。更具有同理心，通過語氣、音量、語調(diào)、語速等就可以獲知使用者心情的變化。

最后，在語音交互的設(shè)計(jì)中，我們可以遵循一些原則：

保護(hù)用戶的隱私。
保持自然的溝通。
保持簡短的回復(fù)。
提供明確的反饋。
對識別內(nèi)容的支持修正。
了解語音識別的局限性。

作者：mufly

來源：https://www.ui.cn/detail/439773.html

本文由 @mufly 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于CC0協(xié)議

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App

Darcy

汪汪社區(qū)里最大方的喵

871篇作品 12821696總閱讀量

不是數(shù)據(jù)分析師，如何打造優(yōu)秀的數(shù)據(jù)分析案例？

09-265391 瀏覽

產(chǎn)品經(jīng)理面試8問

08-2812751 瀏覽

市場預(yù)算下滑，SEO如何0成本 AIGC自動化

12-114304 瀏覽

風(fēng)向變了！淘寶中小商家的賺錢良機(jī)！

11-201277 瀏覽

為什么蘋果仍堅(jiān)持劉海（靈動島）設(shè)計(jì)，而其他公司卻在努力打造100%屏占比的手機(jī)？

11-012159 瀏覽

評論

我想養(yǎng)只哈士奇

讀了您的文章對我很有幫助謝謝

最近回復(fù)

消費(fèi)金融數(shù)字化專題研究（一）：消費(fèi)金融公司商業(yè)畫布分析

11-211832 瀏覽
淘寶開始測試“甄選直播間”

01-113655 瀏覽
偽慈善短視頻，一地雞毛

03-012899 瀏覽

針對“語音助手”類產(chǎn)品，淺談對話式交互設(shè)計(jì)

一、前世今生

二、設(shè)計(jì)核心點(diǎn)

1. 對話模式

2. 引導(dǎo)式回答

3. 自然溝通

三、總結(jié)

針對“語音助手”類產(chǎn)品，淺談對話式交互設(shè)計(jì)

一、前世今生

二、設(shè)計(jì)核心點(diǎn)

三、總結(jié)