以語(yǔ)音交互為核心功能的智能產(chǎn)品設(shè)計(jì)建議

1 評(píng)論 11553 瀏覽 63 收藏 21 分鐘

我們終將以自然的方式與機(jī)器交流。

在2012年圣丹斯獨(dú)立電影節(jié)上,影片《機(jī)器人與弗蘭克》贏得特別獎(jiǎng),該片講述機(jī)器人Robot照顧患有老年癡呆癥弗蘭克的故事,選取影片中兩張圖,一張是人與人的交流,另一張是人與機(jī)器的交流,在2017年AI大熱之年,人們能否像電影里的弗蘭克那樣,以人對(duì)人的方式與機(jī)器交流,這在人機(jī)交互學(xué)科里定義為“人機(jī)自然交互”。

何為自然交互?簡(jiǎn)而言之就是以日常交流方式與計(jì)算機(jī)進(jìn)行交互,何為日常交流方式?就是人們通過(guò)語(yǔ)音、肢體、手勢(shì)、眼神、表情等形式進(jìn)行交流互動(dòng)。

人機(jī)交互正邁上新臺(tái)階

人機(jī)交互(HCI – Human Computer Interaction)的發(fā)展是從人類適應(yīng)計(jì)算機(jī)到計(jì)算機(jī)不斷適應(yīng)人類的過(guò)程,劃分四個(gè)階段:代碼指令交互、圖形用戶界面交互、人機(jī)自然交互和人機(jī)情感交互。【引自《人機(jī)情感交互》】

每個(gè)階段的發(fā)展都是以技術(shù)作為基石,以此帶來(lái)的人機(jī)交互更為直觀,也更趨近于人與人的自然交互,同時(shí)會(huì)拓寬更多的使用場(chǎng)景,會(huì)覆蓋全年齡段的所有人。

如下圖所示,指令 – 專業(yè)技術(shù)人員操作早期計(jì)算機(jī);鼠標(biāo)鍵盤 – 受過(guò)教育的普通人使用PC機(jī)進(jìn)行學(xué)習(xí)工作;觸屏 – 更廣泛的人群使用智能手機(jī)進(jìn)行社交、資訊、娛樂(lè)等;自然交互 – 所有人將以自然的行為方式與智能產(chǎn)品互動(dòng)。

隨著AI技術(shù)的發(fā)展,智能產(chǎn)品在感知層面的能力正在變強(qiáng),它能感知人們的語(yǔ)音、肢體語(yǔ)言、手勢(shì)動(dòng)作、表情眼神等,實(shí)現(xiàn)了人機(jī)自然交互的可能性,這是正在發(fā)生的事情。

未來(lái)智能產(chǎn)品的趨勢(shì)是將擁有情感計(jì)算能力(Affective Computing),通過(guò)認(rèn)知人類的語(yǔ)音信息、人臉表情、肢體動(dòng)作等,從而調(diào)整自身的反饋來(lái)適應(yīng)人們那一刻提出的需求,交互會(huì)變得越來(lái)越容易,它會(huì)更懂你。

智能產(chǎn)品能感知人的自然動(dòng)作和讀懂人的情感,都屬于信息輸入層面。在信息輸出層面,智能產(chǎn)品如何設(shè)計(jì)才能達(dá)到“人與人自然交流”的感覺,為此我們將從六個(gè)維度給出設(shè)計(jì)建議,分別是人物設(shè)定、外觀造型、語(yǔ)音、動(dòng)作、界面和光效。正如同人與人交流時(shí)對(duì)方的脾氣性格、外貌印象、聲音特點(diǎn)、肢體語(yǔ)言、表情和眼神。

以語(yǔ)音交互為核心功能的智能產(chǎn)品設(shè)計(jì)建議

1. 人物設(shè)定的設(shè)計(jì)建議

①人設(shè)是要為用戶服務(wù);

人設(shè)是高級(jí)的虛擬形象設(shè)計(jì),不由設(shè)計(jì)師的個(gè)人喜好來(lái)擬定,要充分考慮產(chǎn)品所服務(wù)的目標(biāo)用戶,譬如病人希望看見的是專家級(jí)醫(yī)生,旅客希望能獲得空姐甜美的服務(wù),食客希望迎賓的店小二是熱情好客的,這些形象在我們的腦海里栩栩如生。比如Amazon Echo是成熟職業(yè)女性的形象(類似有Google Home、天貓精靈、京東叮咚等),Olly給人潮流的設(shè)計(jì)感,它們?yōu)楦髯缘哪繕?biāo)受眾群體去設(shè)定形象。

②人設(shè)可以通過(guò)抽象的方法進(jìn)行傳達(dá),并非一定要具象化;

比如小米智能音箱定義的“小愛同學(xué)”是二次元形象,在今年11月底做出限量版手辦,把形象落地到成具象的實(shí)體物品。對(duì)此,仁者見仁智者見智,有人說(shuō)她不是心目中的“小愛”,所以在人設(shè)形象的傳達(dá)上,我們建議可以通過(guò)藝術(shù)的手法達(dá)到目的,比方說(shuō)用音樂(lè)、繪畫、文學(xué)、電影等藝術(shù)進(jìn)行包裝抽象成一套視覺來(lái)傳達(dá),達(dá)到“空山不見人,但聞人語(yǔ)響”的境界。

③人設(shè)與產(chǎn)品要融為一體的進(jìn)行考慮;

以語(yǔ)音交互為核心功能的智能產(chǎn)品,其“人聲”會(huì)讓用戶自動(dòng)的聯(lián)想與之對(duì)應(yīng)的形象,同時(shí)需考慮與外觀造型相匹配,才能符合用戶預(yù)期。有些智能產(chǎn)品有動(dòng)作輸出,例如人設(shè)定義為蠢萌的jibo,它的動(dòng)作就要顯得有趣可愛。如果考慮不周全,就會(huì)導(dǎo)致認(rèn)知失調(diào)產(chǎn)生落差,比如小魚在家,當(dāng)用戶問(wèn)它幾歲時(shí),它卻用其成熟女性的聲音回答“我今年兩歲了”,而Amazon Echo的回答是“按照人類的出生年齡計(jì)算我今年兩歲”,后者更能讓人接受與理解,即使是微不足道的一句文本都可能會(huì)讓用戶“出戲”,所以人設(shè)要與整個(gè)產(chǎn)品的信息輸出層面融為一體的去考慮。

2. 外觀造型的設(shè)計(jì)建議

①充分考慮目標(biāo)用戶的審美與喜好;

根據(jù)目標(biāo)客群打造其喜歡的外觀造型,比如小朋友會(huì)喜歡jibo勝過(guò)Echo,追求新潮的人更喜歡raven R,因?yàn)槟芘c之載歌載舞。與以屏幕為主的智能手機(jī)不同,用戶可不能更換主題皮膚找到自己的喜好,而Google Home也只能是通過(guò)“換褲子”來(lái)迎合用戶偏好與家居風(fēng)格。

②基于使用場(chǎng)景考慮造型設(shè)計(jì);

要考慮用戶會(huì)在哪種現(xiàn)實(shí)環(huán)境的場(chǎng)景下使用,目前市面上的智能語(yǔ)音產(chǎn)品多數(shù)放置在桌面上,體積大小就要認(rèn)真思考,比如大了點(diǎn)、重了些,就不方便自由移動(dòng)隨處擺放,如果定義為多個(gè)使用場(chǎng)景,那便攜上得做到位。比如raven H頂部的“點(diǎn)陣觸控屏”蓋子,用戶能輕松取下進(jìn)行語(yǔ)音和指觸交互,于是不受固定位置的限制。

③避免掉進(jìn)恐怖谷;

避免與人全特征的過(guò)度相似,建議采用抽象的方法提取擬人元素進(jìn)行設(shè)計(jì)表達(dá),這有助于產(chǎn)品向用戶傳達(dá)情感信息,從而有效的提升用戶好感度。例如蔚來(lái)ES8搭載的人工智能nomi,還有百度的度秘,都是通過(guò)此類設(shè)計(jì)方法打造智能情感的交互,讓一個(gè)工業(yè)產(chǎn)品,升級(jí)成一個(gè)有生命,有情感的新伙伴。

但如果與人的特征過(guò)度相似,現(xiàn)階段的技術(shù)能力,造型上做不到寫實(shí)逼真像人,同時(shí)語(yǔ)音、表情、動(dòng)作也無(wú)法達(dá)到自然完美的匹配,所以這不倫不類的設(shè)計(jì)會(huì)給用戶帶來(lái)糟心的體驗(yàn),例如Blue Frog Robotics公司推出的Buddy,很容易讓用戶掉進(jìn)“恐怖谷”。

“恐怖谷理論”是由日本機(jī)器人專家森昌弘提出, 他認(rèn)為,人形玩具或機(jī)器人的仿真度越高人們?cè)接泻酶?,但?dāng)達(dá)到一個(gè)臨界點(diǎn)時(shí),這種好感度會(huì)突然降低,越像人越反感恐懼,直至谷底,稱之為恐怖谷。如圖所示,谷底處能動(dòng)的僵尸比靜止的尸體更恐怖,雖然尸體已經(jīng)夠恐怖的了。

3. 語(yǔ)音的設(shè)計(jì)建議

①自然感;

避免單調(diào)乏味,做到像人說(shuō)話一樣的自然,語(yǔ)氣上聽起來(lái)積極主動(dòng),有意愿的感覺,每一個(gè)音素合成的詞句清晰可辨,自然流暢。人類語(yǔ)音的信息含有語(yǔ)音聲學(xué)特征和文本語(yǔ)義,語(yǔ)音聲學(xué)特征主要是韻律特征(指音素組合成語(yǔ)句的方式),包括聲調(diào)、重音、停頓、語(yǔ)速等,漢語(yǔ)是一種有調(diào)語(yǔ)言,聲調(diào)攜帶非常重要的情感信息。語(yǔ)音屬于自然交互的一種,它需要達(dá)到“自然”的感覺,才能讓用戶感知可用。

如何讓Siri聽起來(lái)更像人那般自然?

iOS11版本關(guān)于Siri的升級(jí)目標(biāo)是“讓Siri聽起來(lái)更像人那般自然”,實(shí)現(xiàn)方法是通過(guò)深度學(xué)習(xí),每一種表達(dá)都有略微不同的聲波,每一句話都包含幾十或者幾百個(gè)音素,Siri為每一次發(fā)聲找出完美的聲音組合,其中音素是由蘋果挑選出的候選人進(jìn)行發(fā)音采集,情感語(yǔ)料的獲取是蘋果以匿名的方式進(jìn)行收聽,然后用于深度學(xué)習(xí)進(jìn)行Siri的訓(xùn)練。

②一旦確定“人聲”不宜隨意更改;

一旦人設(shè)的聲音已根植在用戶的耳朵里,不宜隨意更改,如果說(shuō)手機(jī)界面換背景圖就像人換一身新衣裳,而以語(yǔ)音交互為核心功能的智能產(chǎn)品更換“人聲”,就像重新認(rèn)識(shí)一位陌生人,古語(yǔ)說(shuō)“如聞其聲,如見其人”,人們會(huì)很自然的把聲音與某個(gè)人進(jìn)行關(guān)聯(lián),新的聲音是誰(shuí),就會(huì)重新進(jìn)行“人物建?!薄?/p>

③像人和人那樣進(jìn)行對(duì)話;

首先是對(duì)話流暢,做到及時(shí)反饋,如有停頓,不宜過(guò)長(zhǎng)。話術(shù)簡(jiǎn)短而有效,不要主動(dòng)終止對(duì)話,盡可能的推動(dòng)持續(xù)交流,當(dāng)然不能以命令的形式讓用戶去完成某個(gè)任務(wù),這不是一個(gè)合適的對(duì)話,它或許有點(diǎn)像上下級(jí)的關(guān)系,會(huì)導(dǎo)致用戶帶來(lái)反感和抵制。

④在感知用戶后嘗試主動(dòng)發(fā)起對(duì)話;

再過(guò)些時(shí)日,可能Amazon Echo它能夠根據(jù)說(shuō)話者的語(yǔ)音情感進(jìn)行識(shí)別計(jì)算,通過(guò)韻律學(xué)特征(語(yǔ)調(diào)、響度、節(jié)奏、語(yǔ)音質(zhì)量等)更懂用戶說(shuō)這句話的此刻心境,就像電影《Her》里的那句臺(tái)詞“你今天聽起來(lái)有點(diǎn)不開心”,它能感知你,試著主動(dòng)發(fā)起一次對(duì)話。

4. 動(dòng)作的設(shè)計(jì)建議

①使用國(guó)際通用的認(rèn)知?jiǎng)幼鱾鬟_(dá),同時(shí)考慮個(gè)地方的風(fēng)俗習(xí)慣;

例如?手勢(shì)是全球通用的,它表示的是“我愛你”,而“豎中指”不要以為只有國(guó)內(nèi)用,它是全球通用的“侮辱”。在保加利亞,上下點(diǎn)頭意味著“不”的否定含義,而搖頭表示肯定,這對(duì)于使用動(dòng)作進(jìn)行交互反饋的智能產(chǎn)品,就需要考慮用戶所在的國(guó)家地區(qū),如果考慮不周,當(dāng)希臘的用戶對(duì)著智能產(chǎn)品豎起大拇指時(shí),不要感到高興,它表示的是憤怒。

②動(dòng)作流暢,避免僵硬;

這點(diǎn)會(huì)給用戶帶來(lái)更自然的感受,就像jibo渾然一體的扭動(dòng),或者想raven R隨著音樂(lè)跳舞,它配合著語(yǔ)音的輸出更是相得益彰。查看10秒短視頻 >

③防止對(duì)人造成意外傷害;

比如Buddy,它能夠行駛移動(dòng),最高時(shí)速能達(dá)到70cm/s,自身重量5kg,以該速度撞到人時(shí)會(huì)造成傷害,所以需考慮防護(hù)措施。動(dòng)作輸出時(shí)建議輕緩,防止速度太快、力量過(guò)大,這都容易對(duì)人造成傷害,設(shè)計(jì)上應(yīng)當(dāng)避免暴力動(dòng)作的出現(xiàn)。

④觸摸的動(dòng)作反饋;

比如Mayfield Robotics公司推出的Kuri,它的頭部有觸摸傳感器,當(dāng)你觸摸它的頭部時(shí),它會(huì)流暢地抬起頭仰望著你,這是與觸摸相對(duì)應(yīng)的動(dòng)作反饋,并讓用戶感知到像與人交流那般自然。

5. 界面的設(shè)計(jì)建議

①重輸出,輕輸入;

與觸屏手機(jī)不同,以語(yǔ)音交互為核心功能的智能產(chǎn)品其界面主要用于信息的輸出顯示,而非輸入操控,不引導(dǎo)用戶依賴界面進(jìn)行交互,盡量減少或弱化此類場(chǎng)景,盡可能引導(dǎo)用戶通過(guò)語(yǔ)音進(jìn)行交互。關(guān)于顯示屏是否要在智能產(chǎn)品構(gòu)造之內(nèi),各方觀點(diǎn)不一,Amazon Show幾乎是沿襲觸屏界面交互,jibo的顯屏不僅是融合一體的頭部造型,也能顯示像眼睛的圖形,它還能轉(zhuǎn)變成一個(gè)觸屏界面,raven R比較不一樣,它的頭部像一個(gè)顯示界面,卻是通過(guò)光點(diǎn)進(jìn)行排列簡(jiǎn)化圖形傳達(dá)信息,不是一個(gè)傳統(tǒng)意義上的觸屏界面,但可以指觸交互。三者在界面輸入上的比較,Amazon Show重于jibo和raven R,體驗(yàn)上Show會(huì)容易引導(dǎo)用戶查看屏幕,用戶潛意識(shí)下有指觸交互的沖動(dòng)。

②信息輸出要精簡(jiǎn)而有效;

首先在設(shè)計(jì)元素上使用全球通用的設(shè)計(jì)隱喻符號(hào),且簡(jiǎn)單明了,不宜使用復(fù)雜線條,元素之間建議邊界明晰。在有限的顯示界面,一次只傳達(dá)一個(gè)關(guān)鍵信息,且突顯核心,以便中遠(yuǎn)距離輕易可見,掃一眼可知。在文字輸出上要夠精煉,不要有段落式的文本出現(xiàn),可借鑒Apple Watch表盤界面的設(shè)計(jì)思路。

③界面動(dòng)效要簡(jiǎn)短可重復(fù)播放;

和以GUI為主的產(chǎn)品不同之處,在于用戶不會(huì)一直盯著屏幕看,所以決定要加入界面動(dòng)效,建議動(dòng)效快速簡(jiǎn)短的完成整個(gè)表達(dá),同時(shí)為了避免用戶錯(cuò)過(guò),關(guān)鍵的動(dòng)效可以反復(fù)的循環(huán)播放,禁得起不斷的重播,而不能讓用戶會(huì)感到厭煩,所以流暢、有趣、可循環(huán)重播要一并考慮。

6. 光效的設(shè)計(jì)建議

①與交互反饋進(jìn)行匹配關(guān)聯(lián),各個(gè)狀態(tài)清晰傳達(dá);

就像人與人的對(duì)話互動(dòng)過(guò)程,光效也能做到自然的反饋,其中有4個(gè)反饋態(tài)值得考慮:?jiǎn)拘?、輸入、理解、行?dòng)。比如喚醒瞬間的光效,就像叫對(duì)方的名字,會(huì)有一個(gè)反應(yīng);當(dāng)用戶在語(yǔ)音輸入時(shí),它得有聆聽狀態(tài)的光效;當(dāng)它在處理用戶的語(yǔ)音信息時(shí),要讓人感受到它正在理解中,就像人在思考時(shí)轉(zhuǎn)動(dòng)的眼睛;最后是當(dāng)它進(jìn)行語(yǔ)音輸出時(shí),光效配合著更讓人感受到它的靈動(dòng)。

②不要挑戰(zhàn)國(guó)際上公認(rèn)的通用色;

比如設(shè)備運(yùn)行狀態(tài)的提示燈,建議使用國(guó)際通用的顏色,紅色代表不可用,黃色代表有疑問(wèn),綠色代表正常。還需考慮品牌色的傳達(dá),以及色彩心理學(xué)的問(wèn)題。Amazon Echo關(guān)閉語(yǔ)音功能時(shí),燈光圓環(huán)帶呈現(xiàn)紅色,當(dāng)它在運(yùn)行聆聽時(shí)使用藍(lán)色作為主色,藍(lán)色也是多數(shù)人認(rèn)為代表科技的顏色。

③燈光的動(dòng)態(tài)做到自然反應(yīng);

比如Amazon Dot被喚醒瞬間其圓環(huán)燈帶流動(dòng)般亮起,且能識(shí)別聲音方向,對(duì)著發(fā)聲源處聚合亮光,而天貓精靈的動(dòng)態(tài)就比較弱,只有光源的亮起到漸暗,沒有物理位置上的變化,少一點(diǎn)自然的流動(dòng)反饋。

④亮度與環(huán)境光的匹配;

這一點(diǎn)很像智能手機(jī)的感光元件,根據(jù)環(huán)境光自動(dòng)調(diào)節(jié)屏幕亮度,保護(hù)眼睛,視覺舒適,所以在熄燈后的臥室,智能產(chǎn)品的光就需變暗,本質(zhì)上只做人機(jī)交互反饋,不與照明系統(tǒng)沖突。

結(jié)語(yǔ)與思考

以語(yǔ)音交互為核心功能的智能產(chǎn)品其設(shè)計(jì)建議我們從六個(gè)維度去探索,重點(diǎn)是在智能產(chǎn)品的輸出層面,如何設(shè)計(jì)才能達(dá)到更自然的交互反饋,更好的傳達(dá)情感。文中所提及的產(chǎn)品多數(shù)已發(fā)布在市面上,隨著AI的發(fā)展,也將涌現(xiàn)出更多的“新物種”,它們的發(fā)展趨勢(shì)無(wú)一例外會(huì)在交互上更容易,在適應(yīng)人類的需求上反饋得更體貼,基于新的技術(shù)能力,又將誕生新的設(shè)計(jì)建議。

對(duì)于用戶來(lái)說(shuō),希望能與智能產(chǎn)品建立親切的信任感,越相處越好用,我們也將從iPhone時(shí)代的觸動(dòng)人心,迎來(lái)AI時(shí)代的深知我心—-深知我者,久居我心。

 

本文由 @百度UXC 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!