車載語(yǔ)音產(chǎn)品需求分析與產(chǎn)品設(shè)計(jì)

2 評(píng)論 8127 瀏覽 65 收藏 23 分鐘

語(yǔ)音交互是車載系統(tǒng)中常見的一種交互方式,但在用戶體驗(yàn)上,現(xiàn)在市面上的車載語(yǔ)音交互常常容易受人吐槽。怎么做好相應(yīng)的車載語(yǔ)音產(chǎn)品設(shè)計(jì)呢?這篇文章里,作者對(duì)車載語(yǔ)音產(chǎn)品從需求分析到原型圖設(shè)計(jì)的完整流程做了較為系統(tǒng)的闡述,一起來(lái)看看吧。

目錄:

  1. 車載語(yǔ)音產(chǎn)品概述
  2. 需求分析與競(jìng)品分析
  3. 需求分類與功能設(shè)計(jì)
  4. 智能化場(chǎng)景與交互設(shè)計(jì)方案
  5. 車載語(yǔ)音VUI與原型圖設(shè)計(jì)
  6. 車載語(yǔ)音產(chǎn)品系統(tǒng)架構(gòu)

一、車載語(yǔ)音產(chǎn)品概述

多模交互已經(jīng)成為當(dāng)前智能座艙的標(biāo)配,在車載系統(tǒng)中同時(shí)使用多種交互方式,其中之一就是語(yǔ)音交互。語(yǔ)音交互可以與其他交互方式(如觸摸屏、物理按鈕等)結(jié)合,提供更豐富和便捷的用戶體驗(yàn),用戶可以更方便地進(jìn)行操作,尤其在駕駛過(guò)程中可以更專注于道路,提升安全性和便捷性。

同時(shí),語(yǔ)音交互也可以與其他交互方式相結(jié)合,提供更靈活的操作選擇,滿足用戶的不同需求。

1. 車載語(yǔ)音交互具有以下特點(diǎn)和優(yōu)勢(shì)

車載語(yǔ)音是指通過(guò)語(yǔ)音識(shí)別技術(shù)(ASR)將駕駛員或其他乘員的語(yǔ)音指令轉(zhuǎn)化為可理解的指令,然后通過(guò)語(yǔ)音合成技術(shù)(TTS)將系統(tǒng)的反饋信息以語(yǔ)音形式傳達(dá)給對(duì)應(yīng)人員。

  1. 提升駕駛安全性:駕駛員可以通過(guò)語(yǔ)音指令完成操作,無(wú)需分散注意力去觸摸屏幕或按鈕,減少駕駛風(fēng)險(xiǎn);
  2. 提供便捷的操作方式:語(yǔ)音交互能夠提供更自然、更直觀的人機(jī)交互方式,讓駕駛員更輕松地控制車輛功能和獲取信息;
  3. 支持多任務(wù)處理:通過(guò)語(yǔ)音交互,駕駛員可以同時(shí)進(jìn)行駕駛和操作,無(wú)需停下來(lái)或轉(zhuǎn)移注意力;
  4. 個(gè)性化體驗(yàn):車載語(yǔ)音交互可以根據(jù)駕駛員的習(xí)慣和偏好進(jìn)行個(gè)性化設(shè)置,提供更加貼合用戶需求的服務(wù)和建議。

2. 車載語(yǔ)音產(chǎn)品腦圖框架

二、需求與競(jìng)品分析

1. 車載語(yǔ)音交互痛點(diǎn)分析

語(yǔ)音喚醒率差,識(shí)別率差,NLP理解能力差、多輪對(duì)話不靈活,離線功能少,目前大部分的車載語(yǔ)音是被吐槽頻率最高的一個(gè)功能,基本上可以說(shuō)是雞肋。

下面是用戶痛點(diǎn)整理:

2. 基于實(shí)際駕駛情景的分析

3. 車載語(yǔ)音體驗(yàn)地圖

4. 車載語(yǔ)音產(chǎn)品的競(jìng)品分析

頭部造車新勢(shì)力將語(yǔ)音交互功能作為其產(chǎn)品智能化與差異化的核心體現(xiàn),因此通常會(huì)選擇自研搭建智能語(yǔ)音技術(shù)框架,以提高智能語(yǔ)音助手的功能迭代與優(yōu)化的頻率以及便捷性。

從當(dāng)前各車企語(yǔ)音交互功能的智能化配置來(lái)看,造車新勢(shì)力的語(yǔ)音交互功能的智能化水平依然存在一定優(yōu)勢(shì)。傳統(tǒng)主機(jī)廠通常選擇外部合作的發(fā)展模式,但頭部的傳統(tǒng)主機(jī)廠也開始逐漸發(fā)力,全雙工、多音區(qū)覆蓋等核心功能也已搭載上車。

部分車企語(yǔ)音交互功能智能化配置:

1)小鵬首創(chuàng)全系統(tǒng)功能覆蓋、連續(xù)對(duì)話等,智能化表現(xiàn)成其標(biāo)簽

小鵬基于全車揚(yáng)聲器分布,推出的全系統(tǒng)功能覆蓋、連續(xù)對(duì)話等多種行業(yè)首創(chuàng)功能為其取得行業(yè)領(lǐng)先地位,符合其極客定位。

通過(guò)“OTA+云端”的高頻迭代方式,實(shí)現(xiàn)用戶無(wú)感情況下的語(yǔ)音助手優(yōu)化。語(yǔ)音助手小P更像是用戶專屬的助理與朋友,通過(guò)定制裝扮、多種音色選擇與定制化語(yǔ)音暗號(hào)建立小P與客戶的獨(dú)有聯(lián)系。

小鵬將繼續(xù)優(yōu)化提升語(yǔ)音交互的基礎(chǔ)能力與語(yǔ)音包與應(yīng)用場(chǎng)景的豐富度,同時(shí)也將座艙內(nèi)部分語(yǔ)音相關(guān)的軟件應(yīng)用通過(guò)“軟件收費(fèi)”的方式進(jìn)行開放。

2)理想智能語(yǔ)音交互產(chǎn)品“理想同學(xué)”另辟蹊徑,定位契合車型定位

語(yǔ)音助手“理想同學(xué)”的產(chǎn)品定位完美契合理想ONE中高端家庭用車的車型定位,以全車語(yǔ)音覆蓋、座艙全成員平等交互權(quán)利等特點(diǎn),滿足家庭出行場(chǎng)景的語(yǔ)音交互需求。

理想同學(xué)基于其產(chǎn)品用戶畫像,深耕4音區(qū)以及開拓多音區(qū)覆蓋,使車內(nèi)所有人員均可通過(guò)語(yǔ)音進(jìn)行人機(jī)交互,同時(shí)也將從整車交互的角度進(jìn)行場(chǎng)景化的思考,貼合家庭出行用戶使用習(xí)慣。

3)蔚來(lái)賦予NOMI具有情感的擬人化形象,助其成為“蔚來(lái)的靈魂

蔚來(lái)智能語(yǔ)音交互助手NOMI,源于蔚來(lái)對(duì)于語(yǔ)音交互體驗(yàn)的理解-“Know me”,其集成了語(yǔ)音交互系統(tǒng)和智能情感引擎,被賦予了具有感情的擬人化形象,使蔚來(lái)的汽車產(chǎn)品從機(jī)器演變成了具有生命的駕乘伙伴。

蔚來(lái)的NOMI智能語(yǔ)音交互助手的語(yǔ)音技術(shù)是在科大訊飛的支持基礎(chǔ)上進(jìn)行了個(gè)性化設(shè)計(jì)與改造。NOMI聽音辨位免打擾獨(dú)立音區(qū)交互等功能,可幫助其后排乘客進(jìn)行語(yǔ)音交互的體驗(yàn)。

三、需求分類與功能設(shè)計(jì)

1. 車載語(yǔ)音產(chǎn)品場(chǎng)景控制劃分

車載交互的場(chǎng)景控制,包括語(yǔ)音助手情景模式、語(yǔ)音助手推薦、全場(chǎng)景語(yǔ)音控制。

2. 車載語(yǔ)音系統(tǒng)交互功能劃分

按照語(yǔ)音識(shí)別的交互功能整個(gè)鏈路來(lái)進(jìn)行分類,包括語(yǔ)音助手形象、助手感知、語(yǔ)音助手交互、語(yǔ)音助手聲音。

3. 功能設(shè)計(jì)

1)語(yǔ)音助手形象設(shè)計(jì)

不同場(chǎng)景下的語(yǔ)音交互助手的形象不同,比如在休眠狀態(tài)就是一個(gè)波浪形,在設(shè)置界面是一個(gè)卡通或者人形,這些都是基于車輛定位,比如五菱車型就是設(shè)置卡通,萌寵的形象。如果是商務(wù)車,可以設(shè)置比較穩(wěn)重的形象。

  • 卡通化的語(yǔ)音形象:在親和力上有很大的優(yōu)勢(shì)能夠被用戶快速的接受,但是辨識(shí)度上可能存在同質(zhì)化嚴(yán)重問題,所以在效果表現(xiàn)力上面有欠缺,也較難表達(dá)車企的品牌理念。
  • 抽象化的語(yǔ)音形象:則通過(guò)造型的多變和動(dòng)效豐富,從而在設(shè)計(jì)感和效果上相對(duì)突出,在傳達(dá)性上也不滿意,用戶不容易知道當(dāng)前語(yǔ)音是處在一個(gè)什么狀態(tài)下,在親和力上遠(yuǎn)也不如卡通化形象。

2)車載語(yǔ)音助手感知

語(yǔ)音助手感知,更多的層面類似于人的眼睛和耳朵,通過(guò)聽和看兩個(gè)感覺器官來(lái)進(jìn)行內(nèi)容輸入。

也可以通過(guò)多麥克風(fēng)及回音消除方案進(jìn)行設(shè)計(jì),多音區(qū)的控制,硬件通過(guò)A2B的麥克風(fēng)布局,同時(shí)軟件進(jìn)行界面設(shè)置,是否允許多音區(qū)喚醒。

喚醒方式分實(shí)體按鈕喚醒與虛擬按鈕喚醒,實(shí)體按鈕,好處就是能夠給到用戶觸覺上的反饋,用戶感知性強(qiáng);虛擬按鈕,此類的按鈕一般都會(huì)在中控屏幕上面,喚醒的方式是點(diǎn)擊。

語(yǔ)音喚醒詞有兩種,一種是語(yǔ)音公司默認(rèn)的,這個(gè)是訓(xùn)練過(guò)的模型,男生、女生、老人、小孩都適合。一種是自定義喚醒詞,需要付費(fèi)給語(yǔ)音公司,要么他幫你訓(xùn)練,車上其他乘客(包括車上其他陌生乘客),如果不付費(fèi),就是錄入自己家人的語(yǔ)音,這樣才識(shí)別率會(huì)高一些。

3)車載語(yǔ)音助手交互

語(yǔ)音助手交互更多類似于人的大腦,進(jìn)行多模態(tài)交互,多輪交互等等。

構(gòu)建對(duì)話交互平臺(tái),解決用戶三大對(duì)話類型,獲取內(nèi)容/服務(wù)。任務(wù)型和問答型對(duì)話,用戶需要盡快的得到想要反饋和解決方案,并且快速的完成,此類任務(wù)的反饋要求還需要清晰、簡(jiǎn)單明了,閑聊型的任務(wù)帶有的目的性不是很強(qiáng),但是對(duì)于趣味性要求會(huì)高。

4)車載語(yǔ)音助手交互/多模態(tài)

主流的車型上都配備有多模態(tài)的交互方式包括觸摸、語(yǔ)音、人臉、手勢(shì)、聲紋、指紋、燈光、手表等等。目前主流的是聲音+手勢(shì)會(huì)比較多長(zhǎng)安汽車的視線喚醒、長(zhǎng)城汽車的聲紋識(shí)別。

另外,還有語(yǔ)音+車內(nèi)+車外攝像頭交互方式,奔馳“MBUX Travel Knowledge”–駕駛員可通過(guò)視線鎖定一棟建筑物,并說(shuō):“我想知道這棟樓的用途即可獲取相關(guān)信息。”該功能由Cerence Look提供技術(shù)支撐。

語(yǔ)音+唇動(dòng)識(shí)別與唇動(dòng)識(shí)別融合下的語(yǔ)音交互將極大提高語(yǔ)音識(shí)別性能,不同語(yǔ)言下的唇部動(dòng)作不同,在嘈雜的座艙環(huán)境下即使系統(tǒng)接收到聲音很小,結(jié)合唇部動(dòng)作也可以保障較高的語(yǔ)音識(shí)別率。

5)車載語(yǔ)音助手交互/UGC用戶定義

車主可通過(guò)手機(jī)APP自定義語(yǔ)音指令及對(duì)應(yīng)的操作,在不影響整車控!功能與行車安全的前提下,增加語(yǔ)義定制功能,用戶可根據(jù)個(gè)人喜好與場(chǎng)景化需求,靈活設(shè)置語(yǔ)音交互對(duì)話內(nèi)容,增加個(gè)性化和趣味性,此項(xiàng)功能可關(guān)閉。比如特斯拉的彩蛋屁,可以設(shè)置一個(gè)語(yǔ)音,小P放一個(gè)屁,回復(fù)就是一個(gè)屁的聲音,非常有意思。

6)車載語(yǔ)音助手聲音選擇

語(yǔ)音助手聲音更多的是輸出部分,類似于有“郭德綱”“林志玲”等聲音,也可以個(gè)性化錄制自己的聲音。音色切換指語(yǔ)音系統(tǒng)除了默認(rèn)語(yǔ)音聲音外,可提供其他聲音供用戶選擇,如明星、游戲人物的聲音等。可以設(shè)計(jì)親和女聲、知性女聲、磁性男聲、稚嫩童聲、熱情女聲五種音色供選擇,可以聯(lián)網(wǎng)選擇明星播報(bào)語(yǔ)音。

四、智能化場(chǎng)景與交互設(shè)計(jì)方案

1. 車載音頻的焦點(diǎn)優(yōu)先級(jí)設(shè)計(jì)

1)獨(dú)占交互

在獨(dú)占交互中,一次只允許一個(gè)應(yīng)用持有焦點(diǎn)。因此,在傳入的焦點(diǎn)請(qǐng)求被授予焦點(diǎn)的同時(shí),現(xiàn)有的焦點(diǎn)持有者會(huì)失去焦點(diǎn)。例如,用戶在現(xiàn)有應(yīng)用中播放音樂時(shí)啟動(dòng)新的音樂應(yīng)用。由于這兩個(gè)應(yīng)用都在播放媒體內(nèi)容,因此一次只允許其中一個(gè)應(yīng)用持有焦點(diǎn);

2)拒絕交互

在拒絕交互中,傳入的請(qǐng)求一律會(huì)遭到拒絕。嘗試在通話過(guò)程中播放音樂就是拒絕交互的一個(gè)示例。在這個(gè)例子中,如果撥號(hào)器正為某個(gè)通話持有音頻焦點(diǎn),而另一個(gè)應(yīng)用要請(qǐng)求焦點(diǎn)來(lái)播放音樂,則音樂應(yīng)用發(fā)出的請(qǐng)求會(huì)收到AUDIOFOCUS REQUEST FAILED 響應(yīng)。由于焦點(diǎn)請(qǐng)求遭拒,因此系統(tǒng)不會(huì)向當(dāng)前焦點(diǎn)持有者分派任何類型的焦點(diǎn)丟失事件;

3)并發(fā)交互

AAOS 最獨(dú)特的地方就是并發(fā)交互。在這種交互模式下,請(qǐng)求音頻焦點(diǎn)的車載應(yīng)用可與其他應(yīng)用同時(shí)持有焦點(diǎn)。

2. 處理并發(fā)聲音流

雖然并發(fā)交互適用于許多實(shí)用應(yīng)用,但原始設(shè)備制造商(OEM)必須在硬件級(jí)別跨輸出設(shè)備實(shí)現(xiàn)混音和降音(安卓里面稱為閃避)。

因此,建議僅將存在并發(fā)播放的 CarAudioContext 路由到無(wú)法與其同時(shí)播放的CarAudioContext 的同一輸出設(shè)備。通過(guò)為并發(fā)聲音流提供單獨(dú)的輸出設(shè)備,HAL便可在混音之前對(duì)其中一個(gè)聲音流進(jìn)行閃避。

例如,如果同時(shí)提供導(dǎo)航提示音和媒體播放聲音,媒體聲音流的增益會(huì)暫時(shí)降低(閃避),以便用戶能更清楚地聽到導(dǎo)航提示。

AndroidCar音頻焦點(diǎn)-智能座艙交互矩陣實(shí)例表

3. 車載語(yǔ)音智能化場(chǎng)景分析

1)場(chǎng)景控制

車載交互的場(chǎng)景控制,包括情景模式預(yù)制、助手推薦、全場(chǎng)景語(yǔ)音控制,語(yǔ)音產(chǎn)品經(jīng)理需要重點(diǎn)掌握的是場(chǎng)景推薦模式設(shè)計(jì)、聚合媒體的全部功能、語(yǔ)義表單的設(shè)計(jì)、多輪對(duì)話的設(shè)計(jì)。

2)車載聚合媒體內(nèi)容

作為車載語(yǔ)音產(chǎn)品經(jīng)理,把聚合媒體的所有菜單內(nèi)容都理解一遍,這些內(nèi)容的語(yǔ)音交互場(chǎng)景是什么,才能知道語(yǔ)義表的設(shè)計(jì)以及邏輯框架的設(shè)計(jì)。

3)車載場(chǎng)景智能化推薦

場(chǎng)景智能化推薦,80%是主動(dòng)交互的一種,未來(lái)語(yǔ)音交互也是從被動(dòng)走向主動(dòng),需要產(chǎn)品經(jīng)理非常強(qiáng)的場(chǎng)景智能化的設(shè)計(jì)能力,做到既不打擾用戶,又能給用戶更好的體驗(yàn)。

上車問候:上車的時(shí)候有比較常見的就是開機(jī)動(dòng)畫,儀表自檢,場(chǎng)景推薦可以是節(jié)假日彩蛋、個(gè)性化開機(jī)語(yǔ)、生日提醒等;場(chǎng)景智能化推薦的上車相關(guān)內(nèi)容,包括有主體的喚醒、運(yùn)營(yíng)事件、二十四節(jié)氣提醒、氛圍燈聯(lián)動(dòng)等等;

實(shí)況關(guān)懷、媒體推薦:場(chǎng)景智能化推薦的實(shí)況關(guān)懷在一些汽車上已經(jīng)實(shí)現(xiàn),比如哈佛初戀的車型,包括加班關(guān)懷和限號(hào)提醒媒體推薦主要是智能歌單、電臺(tái)推薦等等;

其他還有目的地推薦、美食推薦、離車關(guān)懷、故障提醒、電量/油量提醒、疲勞駕駛,智能車控、乘客服務(wù)等等。

4)車載語(yǔ)義功能表

(省略)因Excel表格內(nèi)容太多,放進(jìn)來(lái)影響文章可讀性,所以就不展示了。語(yǔ)義功能表包括:通訊模塊、導(dǎo)航模塊、媒體模塊、查詢模塊、車輛控制、語(yǔ)音技能、自動(dòng)泊車、DMS、駕駛相關(guān)設(shè)置、香氛控制等。

五、車載語(yǔ)音VUI與原型圖設(shè)計(jì)

1. 對(duì)話系統(tǒng)設(shè)計(jì)

對(duì)話設(shè)計(jì)是基于人們的對(duì)話的設(shè)計(jì)語(yǔ)言,它集合多個(gè)設(shè)計(jì)的內(nèi)容,其中包括語(yǔ)音用戶界面設(shè)計(jì)、交互設(shè)計(jì)視覺設(shè)計(jì)、動(dòng)畫設(shè)計(jì)、語(yǔ)音對(duì)話腳本設(shè)計(jì)、乃至還有音頻設(shè)計(jì)增加語(yǔ)音助手的靈動(dòng)性。

1)語(yǔ)音交互原理

為了更能理解用戶的需求,需要進(jìn)行多輪對(duì)話的設(shè)計(jì)。

2)語(yǔ)音交互流程

第二步對(duì)話管理,主要完成對(duì)話狀態(tài)的維護(hù)(dialog state tracing,DST),生成系統(tǒng)決策(dialogpolicy),作為接口與人物模型進(jìn)行匹配、提供語(yǔ)義表達(dá)的期望值(expections for interpretation)、分發(fā)任務(wù)記錄當(dāng)前queryID和pageID。

當(dāng)前是用戶的一次對(duì)話需要經(jīng)歷的全部流程,如果需要多次的對(duì)話,就要不斷的維護(hù)對(duì)話棧,并且對(duì)話棧要匹配當(dāng)前的pagelD,才能幫助用戶經(jīng)歷多次跳轉(zhuǎn)都能到達(dá)預(yù)期的頁(yè)面,所以多輪交互更加復(fù)雜和難以掌控。

3)注意事項(xiàng)

語(yǔ)音對(duì)話系統(tǒng)設(shè)計(jì)包括語(yǔ)音用戶界面設(shè)計(jì)、交互設(shè)計(jì)、視覺設(shè)計(jì)、動(dòng)畫設(shè)計(jì)、語(yǔ)音對(duì)話腳本設(shè)計(jì)。

對(duì)話系統(tǒng)設(shè)計(jì)的原則:語(yǔ)音簡(jiǎn)短化、響應(yīng)等待設(shè)計(jì)、避免過(guò)多選擇、不要假設(shè)用戶知道該做什么語(yǔ)言文案設(shè)計(jì)一致性、不要信息轟炸用戶、避免使用專業(yè)術(shù)語(yǔ)。多輪對(duì)話設(shè)計(jì),主要需要二次選擇和確認(rèn),對(duì)搜索結(jié)果排序。

2. 車載語(yǔ)音VUI設(shè)計(jì)

1)GUI與VUI的特點(diǎn)對(duì)比

VUI在某些場(chǎng)景下具有非常明顯的優(yōu)勢(shì),但是也需要比較好的設(shè)計(jì)邏輯。

綠色表示VUI優(yōu)勢(shì)明顯

2)語(yǔ)音VUI交互設(shè)計(jì)規(guī)范

目前業(yè)界未存在公認(rèn)的語(yǔ)音交互的設(shè)計(jì)規(guī)范標(biāo)準(zhǔn),業(yè)內(nèi)各家公司都處于前瞻、摸索、引導(dǎo)的階段盡管語(yǔ)音交互被看做是一種區(qū)別GUI的交互方式,但基本的可用性原則依舊適用于衡量用戶體驗(yàn)的質(zhì)量。

3)VUI的設(shè)計(jì)原則

VUI的設(shè)計(jì)原則相關(guān)內(nèi)容,主要是社會(huì)原則、感性原則、理性原則:

3. 車載語(yǔ)音VUI邏輯與原型圖設(shè)計(jì)

下圖是車載語(yǔ)音撥打電話的主流程圖:

六、車載語(yǔ)音產(chǎn)品系統(tǒng)架構(gòu)

1. 智能座艙域控制高通8155整機(jī)框架圖

主流的8155方案是一芯帶5屏,這里有液晶儀表、中控導(dǎo)航、后排頭枕顯示屏、同時(shí)有語(yǔ)音mic的輸入、U盤、wifi、藍(lán)牙、外接喇叭的輸出。

2. 語(yǔ)音系統(tǒng)架構(gòu)

語(yǔ)音系統(tǒng)架構(gòu)交互,是AI交互中的其中一個(gè)環(huán)節(jié),更多的是整體的解決方案是需要算力、平臺(tái)解決方案。

3. 常見車云通訊協(xié)議

以上是車載語(yǔ)音產(chǎn)品的需求分析到原型圖設(shè)計(jì)的完整流程(完結(jié))。

本文由 @ALICS 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 太干了,贊

    來(lái)自上海 回復(fù)
  2. 配圖有些糊,請(qǐng)問有清晰版本嗎?

    來(lái)自上海 回復(fù)