語音交互設(shè)計(一):VUI發(fā)展及特征

2 評論 9868 瀏覽 78 收藏 10 分鐘

當(dāng)語音交互、智能匹配以及個性化推薦成為新一代用戶主流的交互方式時,現(xiàn)在以一個個獨(dú)立的APP構(gòu)筑的服務(wù)會面臨巨大沖擊。

隨著移動智能終端和云計算的快速發(fā)展,人工智能的浪潮正在悄然顛覆著我們生活的點(diǎn)點(diǎn)滴滴,VUI(Voice User Interface,語音用戶界面)作為一個新的領(lǐng)域也在快速發(fā)展,并對用戶體驗提出了更多關(guān)于語言學(xué)、情感塑造、邏輯搭建等方面的新要求。

大家想一下VUI技術(shù)發(fā)展所帶來的改變:我躺在沙發(fā)上,雙手打著游戲,我只需要用聲音就可以操控空調(diào)、預(yù)定一份外賣,并且在一小時左右就能吃上,相信這種體驗一定不錯!

1. VUI的發(fā)展

那么,在原有GUI(Graphical User Interface,圖形用戶界面)如此豐富的情況下,為什么要新增加一種交互方式呢?它們兩者之間最大的差異就是:輸入方式不同。最顯著特性就是“解放了雙手”,在獲取我們關(guān)注的信息時,可以用最自然的語言進(jìn)行溝通,眼睛和手可以同時處理其他的事情。

1.1 VUI的第一個時期

20世紀(jì)90年代,誕生了第一個可行的、非特定的(每個人都可以對他說話)的語音識別系統(tǒng),交互式語音應(yīng)答(Interactive Voice Response,IVR)系統(tǒng)的出現(xiàn)代表了VUI的第一個重要時期[1]。

人通過電話線路進(jìn)行交互并執(zhí)行任務(wù),如機(jī)票預(yù)訂、銀行轉(zhuǎn)帳、業(yè)務(wù)查詢等。相信大家都用12306電話訂票訂過火車票,我們通過輸入數(shù)字命令,與系統(tǒng)進(jìn)行語音交互,它的主要特點(diǎn)如下:

  • 優(yōu)點(diǎn):擅長識別和播報長字符。
  • 缺點(diǎn):用戶很少有機(jī)會暫停系統(tǒng),系統(tǒng)占主動地位。

圖:12306電話訂票

我們通過輸入身份證號等,讓系統(tǒng)進(jìn)行身份與指令識別,系統(tǒng)也會播報各個站點(diǎn)如:1北京、2天津、3山東等長語音讓我們選擇,回想一下那個過程,我們必須不斷地與系統(tǒng)進(jìn)行交互,如果中間出現(xiàn)錯誤,只能掛斷重來,因此整個交互過程會容易讓用戶處在謹(jǐn)慎、局促的狀態(tài)下。

1.2 VUI的第二個時期

我們現(xiàn)在所處第二時期的初期,目前很多像siri、Google這類集成了視覺和語音信息的APP,以及Amazon Echo這類純語音的設(shè)計產(chǎn)品,逐步發(fā)展并成為主流[1]。隨著語音識別技術(shù)、AI技術(shù)、互聯(lián)網(wǎng)技術(shù)的發(fā)展,我們已經(jīng)可以在手機(jī)設(shè)備中用語音處理很多事情,但還有很多事情目前無法通過語音完成,需要我們探索。

圖:Google語音APP

圖:Echo語音助手產(chǎn)品

2.?VUI與GUI相比的優(yōu)勢與劣勢

以目前TXD團(tuán)隊沉淀的GUI設(shè)計原則為檢驗標(biāo)準(zhǔn),進(jìn)行橫向切割,縱向?qū)Ρ萔UI的優(yōu)勢劣勢。

圖:TXD設(shè)計原則

主要的優(yōu)勢有:

主要的劣勢有:

因此,通過對比我們發(fā)現(xiàn),GUI在清晰、高效、通用方面更具優(yōu)勢,這也恰恰是人們獲取信息的關(guān)鍵,能夠準(zhǔn)確給用戶提供幫助,且具有很好的延展性和通用性,相對于“一問一答”點(diǎn)狀獲取信息的方式,更為高效。VUI則是設(shè)計所要追求的一種最自然、最親切的交互方式,是“帶有情感、溫度的交互體驗”,真正的從用戶角度出發(fā)。從我個人角度來看,在目前技術(shù)發(fā)展的階段,VUI更多是一種輔助,至少短時間內(nèi)不會完全取代GUI。

圖:兩種交互方式各有所長

3.?語音交互產(chǎn)品主要應(yīng)用場景

各個場景下,用戶的需求會有所不同,因此語音交互設(shè)計需要針對特定場景,做功能與語音交互的區(qū)別設(shè)計。主要的應(yīng)用場景有:智能家居、車載駕駛、企業(yè)應(yīng)用、醫(yī)療和教育,本文就這五種場景下的語音交互產(chǎn)品做簡要分析與舉例。

3.1 智能家居

圖:智能家居類語音助手的產(chǎn)品發(fā)布

通過上圖,列舉了主要智能家居類語音助手的產(chǎn)品發(fā)布,在今年一季度美國語音助手市場中,Amazon Echo的市場份額達(dá)到70.6%,Google Home則占到23.8%,而其他廠商(包括蘋果、Lenovo、LG、Harmon Kardon和Mattel)分食剩下的市場份額,為5.6%,可見市場競爭壓力。

3.2 車載駕駛

3.3 企業(yè)應(yīng)用

3.4 醫(yī)療

3.5 教育

在各個場景下,目前手機(jī)中所對應(yīng)的APP應(yīng)用都十分豐富,我們在日常使用中也經(jīng)常會遇到需要同時打開多個APP進(jìn)行比對使用,例如我們想找一家價格實惠、味道不錯的飯店,可能需要在口碑、點(diǎn)評等多產(chǎn)品上進(jìn)行查找。

試想,如果語音智能匹配技術(shù)成熟,我們只需要用語音輸入一次需求,系統(tǒng)即可自動推薦與之匹配且符合我們個人喜好的結(jié)果,這才是用戶體驗所追求的自然、快捷、流暢。

圖:各場景下的手機(jī)APP

“當(dāng)語音交互、智能匹配以及個性化推薦成為新一代用戶主流的交互方式時,現(xiàn)在以一個個獨(dú)立的App構(gòu)筑的服務(wù)會面臨巨大沖擊。

復(fù)合體驗在給人們帶來便利的同時,也在逐步瓦解單一介質(zhì)(印刷品、屏幕、聲音)帶來的感官刺激。[1]”

參考書籍:

【1】《語音用戶界面設(shè)計》 Cathy Pearl (著)  王一行(譯)

 

作者:晏菲(史慧婷),阿里巴巴交互設(shè)計師

來源:微信公眾號“TXD技術(shù)體驗設(shè)計(ID:TXD-UED)”

本文由 @TXD技術(shù)體驗設(shè)計 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來源于網(wǎng)絡(luò)

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 很有學(xué)習(xí)意義~尤其那個GUI的原則橫向類比
    已關(guān)注公眾號,希望能看到更多關(guān)于VUI設(shè)計思路、方法、實踐類的文章 ~

    來自浙江 回復(fù)