日本特黄特色特刺激大片，91精产国品一二三区在线，国产精品自在拍在线拍，亚洲丶国产丶欧美一区二区三区，日韩av中文字无码，欧洲日本人妻多人色视频，精品国产不卡自在自线，久久国产精品正在播放

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業(yè)技能直播

會員專屬社群

榮耀標識

發(fā)布

注冊 | 登錄

語音交互規(guī)范（第一講）

東哥的設(shè)計分享

2021-11-10

9 評論 7740 瀏覽 49 收藏

15 分鐘

編輯導語：隨著互聯(lián)網(wǎng)的發(fā)展，語言交互融入了我們的日常生活中。那么，關(guān)于語音交互規(guī)范，你又了解多少呢？本文從AI語音交互發(fā)展談起，總結(jié)了一些語音交互規(guī)范內(nèi)容，供大家參考，希望對你有所幫助。

一、AI語音交互發(fā)展

語音交互的發(fā)展經(jīng)歷了三個階段：

第一階段是上世紀80年代，語音交互能夠?qū)崿F(xiàn)一問一答，前后回答并不具有內(nèi)容的相關(guān)性。隨著人工智能和深度學習的發(fā)展，機器的理解能力越來越強。

自從2009年開始，隨著iPhone手機siri的出現(xiàn)，進入第二階段，語音的對話能做到有問有答，能夠理解上下文，但是這種應用場景還比較局限。

第三階段，2014年Amazon Echo的出現(xiàn)，實現(xiàn)了應用領(lǐng)域的革新，拓展了語音交互的場景，智能語音交互的爆發(fā)則在2017年智能音響的發(fā)展，語音交互得到巨大的突破，語音和語意的理解更加準確，具有代表性的產(chǎn)品有小愛音響、天貓精靈和小度音響等。

二、什么是AI語音交互？

AI語音交互通俗的理解就是：人與機器的對話。語音交互在技術(shù)方面講主要包括：聽（ASR）、語義理解（NLP）、說（TTS）。

聽（ASR）：用ASR技術(shù)把語音識別成文字。

語義理解（NLP）：使用NLP技術(shù)，把文字輸入轉(zhuǎn)化為文字輸出。通過語法判斷、上下文理解、關(guān)系理解、知識圖譜等技術(shù)。就是理解文字的含義后，把想反饋的回答以文字表達出來。

說（TTS）：使用TTS技術(shù)把文字合成為語音。

三、為什么要建立AI語音交互規(guī)范？

在公司角度：有統(tǒng)一的交互規(guī)范便于公司內(nèi)部產(chǎn)品形成統(tǒng)一的共識，減少溝通的成本，提升工作的效率。

在設(shè)計師角度：對外有了統(tǒng)一的交互規(guī)范便于與產(chǎn)品、開發(fā)等人員的溝通，對內(nèi)便于組織內(nèi)的成員學習與提高。

在設(shè)計管理者的角度：對內(nèi)能達成設(shè)計共識，對外提升設(shè)計組織的影響力。

在我看來交互規(guī)范是一個內(nèi)部產(chǎn)品，它隨著產(chǎn)品的生命周期迭代演進；交互規(guī)范是一套內(nèi)部共識，它不僅僅解決了設(shè)計問題，更是組織協(xié)同的解藥；交互規(guī)范是一種思維方式，不僅產(chǎn)品設(shè)計，甚至自己的生活都可以借鑒設(shè)計系統(tǒng)來提升效率。

四、AI語音交互規(guī)范主要內(nèi)容是什么？

語音交互原則
語音交互框架
語音邏輯規(guī)范
語音控制原則
多模態(tài)交互
彈框機制
操作反饋
界面架構(gòu)
情感化設(shè)計

五、語音交互的原則

1. 通用原則

及時反饋原則。用戶在與系統(tǒng)進行語音交互的過程中，系統(tǒng)要給予及時的反饋。

合適的速度。語音的播報速度、結(jié)果呈現(xiàn)速度、IP形象展示的速度、文字展示及糾錯的速度都在一個合適的范圍內(nèi)。

易取原則。盡量減少用戶對操作目標的記憶負荷，交互動作和結(jié)果都是可見、可聽的。

人性化幫助原則。在用戶需要幫助的時候提供必要的幫助說明和引導。

靈活高效原則。語音交互可以跨越層級，直接高效的觸達目標。

防錯原則。在用戶意圖不明確的時候，可以向用戶詢問，還可以預測用戶的可能的意圖提示用戶。

消除歧義。交互的形式和內(nèi)容不會讓用戶感到困惑，當用戶的命令存在歧義時，通過交互的形式消除歧義，幫助用戶達成目標。

適應當?shù)匚幕?。語音的形象IP和話術(shù)的提問及回答都要符合用戶所處的文化背景和地域文化。

2. 交互的可用性要素

輪流對話。在對話中基于信號的傳遞，進行輪流的表達。回答的機制是一問一答。

上下文串聯(lián)。在對話的語言中需要結(jié)合上下文的語意串聯(lián)起來進行回答，這樣有助于提升對話的準確性。

多樣性。對于具體的場景，應該多樣的問與答，結(jié)合情景多樣性的回答。

理解行為。在對話的過程中盡可能的真誠、詳實和有效的理解對話的內(nèi)容。

反饋。對于用戶的請求應給予反饋，無論是聲音、文字還是圖像。

語音的效率。在對話的過程中往往有一些隱晦的潛臺詞，在對話的過程中要理解口語之下的更深層次的意圖，并給予準確的回答。

3. 人性化的表達

語言是人類表達情感的重要方式，在語音交互的過程中，人性化的設(shè)計必不可少的。狀態(tài)可見原則。在整個語音交互的對話過程中，對于場景、角色都需要從人與人對話的角度出發(fā)。

對話的邏輯。語言對話邏輯應該遵循人類語言的本能，不應該強迫用戶為了適應機器對話而采用層級遞進的邏輯思維，用戶只需要正常的表達就可以。

情感化。語音交互需要人格化、情感化。需要與產(chǎn)品的品牌調(diào)性相契合。語音人格方向特征具有：有趣、正能量、機智和溫暖等特點。

口語?？谡Z化的交流，同時也需要避免說顯而易見的內(nèi)容，對話需要多樣性，使體驗更加自然。

環(huán)境貼切。使用簡單易懂和約定俗成的表達，盡可能的貼近用戶所在的環(huán)境。

地方語言。語言的本身要有地域的特色，語音的表達要有廣泛的群眾基礎(chǔ)，其中方言識別也是語音交互中重要的技能。

六、語音交互框架

1. 語音交互流程

一次完整的語音交互流程，包括：喚醒—ASR—NLP—Skill—TTS語音應答/界面結(jié)果展示（如下圖所示）。

AI語音交互規(guī)范（第一講）

2. 語音交互框架

1）根據(jù)蘋果公司的全品類設(shè)備的特點，在語音框架需保持一致，兼顧mac、paid、手機大小屏和橫豎屏。Siri交互包括：Siri的狀態(tài)、ASR內(nèi)容/話術(shù)、語言TTS反饋。

AI語音交互規(guī)范（第一講）

3. 遠場與近場

遠場應用比如Siri。直接說：“Siri”喚醒語音助手，喚醒后可以遠程進行語音交互。

近場應用比如智能電視。使用遙控器，按住語音鍵，對著遙控器進行語音近距離語音交互。

設(shè)計用例：

User：“Siri，定個鬧鐘”。

語音助手：“你要定什么時候呢？”

User：“明天早上8點”。

4. 正常/異常狀態(tài)

正常狀態(tài)：

語音交互的過程中，通過TTS和Siri狀態(tài)（包括：等待與加載），來滿足及時反饋。

異常狀態(tài)：

語音交互過程中，判斷外網(wǎng)終端->提示：待命+網(wǎng)絡(luò)異常，請檢查網(wǎng)絡(luò)。

注：無界面時，直接TTS反饋：【網(wǎng)絡(luò)異常，請檢查網(wǎng)絡(luò)】（要求TTS寫在本地）。

5. 對話澄清

指語音主動與用戶的對話，達到意圖的確認。

說明?：

① 澄清應用于用戶意圖不清晰，必須進行再次對話才能進行意圖確定，否則導致機器執(zhí)行的任務錯誤。

② 假如在遠程的交互中，澄清的過程中，需要語音一直處于待命狀態(tài)（也就是無需再次喚起即可對話）。

③ 在澄清的過程中，需要關(guān)鍵詞引導，以便于用戶表達明確的意圖。

④ 為了讓用戶能自然的回復和應答，同時也防止自然口語化，語音的澄清話術(shù)需要采取封閉式關(guān)鍵詞引導。

⑤ 關(guān)鍵詞的引導，根據(jù)人的記憶及聽力的規(guī)則，每次小于等于3個，且近倆個每句話術(shù)文字在7±2之間。

設(shè)計用例：

User：“幫我定下明天鬧鐘？”（意圖不明）

語音助手：“你要定幾點鬧鐘？”（幾點鐘為關(guān)鍵詞）

Uesr：“明天早上8:00”（意圖明確）

6. 多倫對話

多輪對話指語音助手與用戶進行一輪（一問一答）以上的對話。

說明：

① 應用于意圖雖然清楚、可執(zhí)行，但任務執(zhí)行結(jié)果不清晰。如：結(jié)果的集合過大，用戶沒有找到具體的內(nèi)容。

② 多輪的引導，應能幫助用戶完成任務，同時防止用戶自然語言的發(fā)散。

③ 多輪對話的輪次意味著用戶與智能設(shè)備的多次交流。在搜索工具語言中，語音交互較快的達到目標是關(guān)鍵，輪次越多代表執(zhí)行的效果不理想，通常以小于3輪較為合適。但是在閑聊類型功能中，輪次越多，代表用戶聊天的意愿越強。

設(shè)計用例：

User：“能幫我找一下好看的電視劇嗎？”（意圖清晰，任務集合過大）

語音助手：“你要看中國的？還是國外的？”（關(guān)鍵詞引導）

User：“中國的”（意圖明確）。

7. 話術(shù)

話術(shù)指用戶與智能設(shè)備對話的形式。

說明：

① 話術(shù)來源：a 語音產(chǎn)品中需要互動交流產(chǎn)生場景話術(shù)；b基于人與人對話的原則撰寫而成的話術(shù)。

AI語音交互規(guī)范（第一講）

設(shè)計用例：

AI語音交互規(guī)范（第一講）

8. 話術(shù)（TTS）設(shè)計

語音話術(shù)指在語音交互過程中語音助手通過語言與用戶進行互動，包括文字話術(shù)和語音話術(shù)。

說明：

① 顯示的文字話術(shù)與語音助手的形象關(guān)聯(lián)，并配合出現(xiàn)。

② 顯示話術(shù)與當前語音邏輯相呼應。

③ 語音話術(shù)：用戶發(fā)出請求后，需要給予語音應答。比如：“定今天下午3點鬧鐘”，反饋；“好的，已經(jīng)定好下午3點鬧鐘”。

④ 聲音及文字：引導過程中，根據(jù)業(yè)務的需要進行聲音與文字的引導。

聲音引導：引導澄清用戶的意圖。

文字引導：語音域中的引導話術(shù)。

聲音+文字引導：比如問題及內(nèi)容的搜索結(jié)果。

⑤ 運營類話術(shù)：針對高頻詞的結(jié)果及當前熱門的內(nèi)容，定制化的話術(shù)，目的是增加產(chǎn)品的情感，更加貼切用戶的反饋。實現(xiàn)的方式：由運營后臺配置。

9. 用戶對話引導

語言具有自然性，為了避免用戶語言的隨意泛化，導致用戶指令無法識別，需要在語音中進行話術(shù)規(guī)范性引導。

說明：

引導話術(shù)結(jié)構(gòu)-“喚醒方式+需引導的技能話術(shù)”。

① 全局性引導。由話術(shù)平臺統(tǒng)一部署，引導分為3類：

語音更能引導；
當下熱門內(nèi)容引導；
新上線或主推功能引導。

② 相關(guān)域引導。在語音交互過程中，提供當前領(lǐng)域的相關(guān)話術(shù)引導。分為兩類：

當前領(lǐng)域中多維度的引導；
多輪進階式引導。

③ 運營類的引導。專門為運營類產(chǎn)品定制的語音話術(shù)引導。

10. 情感表達機制

語音交互人性化，是語音交互重要特征之一。

說明：

基礎(chǔ)狀態(tài)：

喚醒狀態(tài)；
待命；
加載；
免喚醒；
聲源定位。

基礎(chǔ)情緒：

歡呼；
陪伴；
安撫；
幫助；
其他（更多的類型根據(jù)業(yè)務需要進行添加）

基礎(chǔ)情緒的表達（如圖所示）：

AI語音交互規(guī)范（第一講）

七、小結(jié)

語音交互規(guī)范主要內(nèi)容分為：

語音交互原則
語音交互框架
語音邏輯規(guī)范
語音控制原則
多模態(tài)交互
彈框機制
操作反饋
界面架構(gòu)
情感化設(shè)計

本篇僅寫了：（1）語音交互原則（2）語音交互框架，后續(xù)分為3篇完成，謝謝大家閱讀，后續(xù)內(nèi)容敬請期待！

本文由 @東哥的設(shè)計分享原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載

題圖來自?Unsplash，基于 CC0 協(xié)議

本文由 @東哥的設(shè)計分享原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自 Unsplash，基于 CC0 協(xié)議。

該文觀點僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App

交互規(guī)范指南文章被收錄于該專欄

共 14 篇文章12458 人已學習

語音交互的入門指南文章被收錄于該專欄

共 15 篇文章17792 人已學習

東哥的設(shè)計分享

產(chǎn)品設(shè)計師公眾號【東哥的設(shè)計分享】微信【duanzhidong123】

10篇作品 79070總閱讀量

白酒青睞“數(shù)字藏品”，但消費者又肝又氪還搶不過黃牛？

03-152274 瀏覽

京東為什么無法全力投入百億補貼？

03-092527 瀏覽

天降大模型，中國SaaS披上新戰(zhàn)袍

06-061669 瀏覽

智能化監(jiān)控告警系統(tǒng)：基于物聯(lián)網(wǎng)移動網(wǎng)絡(luò)通信服務平臺的設(shè)計與實現(xiàn)

05-116331 瀏覽

情緒與情懷：回顧2022年度十大音樂營銷案例

01-163720 瀏覽

評論

一

等更新~

最近來自安徽回復
leom

這位同學，你這盜用的有點徹底，里面的內(nèi)容有一個字是你寫的嗎？

最近來自廣東回復
四毛

這位雷鳥的同學，你盜用的時候跟原作者申請過了嗎?

最近來自廣東回復
四毛

你用的好多圖和內(nèi)容都是我TCL的同事自己工作辛苦產(chǎn)出的工作沉淀，麻煩你刪除并道歉！

最近來自廣東回復
愛產(chǎn)品的小白產(chǎn)品

兄弟你瘦了，看著疲憊了

最近來自廣東回復
東哥的設(shè)計分享作者

不好意思，最近太忙了～我盡量抓緊時間更新！感謝各位讀者的關(guān)注～

最近來自廣東回復
賈碧瑩

求更，急

最近來自北京回復
Haha

大神你繼續(xù)更新啊，求更

最近來自湖北回復
嚕嚕啦

第二講抓緊更啊。。。。

最近來自天津回復

美團、東方甄選APP開啟自播模式，直播殺入“本地生活”新賽道？

07-226155 瀏覽
智能對話時代來臨：GUI正在向CUI演變

04-194926 瀏覽
木鳥對壘途家：新一輪滑雪戰(zhàn)開卷

11-244839 瀏覽

語音交互規(guī)范（第一講）

一、AI語音交互發(fā)展

二、什么是AI語音交互？

三、為什么要建立AI語音交互規(guī)范？

四、AI語音交互規(guī)范主要內(nèi)容是什么？

五、語音交互的原則

1. 通用原則

2. 交互的可用性要素

3. 人性化的表達

六、語音交互框架

1. 語音交互流程

2. 語音交互框架

3. 遠場與近場

4. 正常/異常狀態(tài)

5. 對話澄清

6. 多倫對話

7. 話術(shù)

8. 話術(shù)（TTS）設(shè)計

9. 用戶對話引導

10. 情感表達機制

七、小結(jié)

一、AI語音交互發(fā)展

二、什么是AI語音交互？

三、為什么要建立AI語音交互規(guī)范？

四、AI語音交互規(guī)范主要內(nèi)容是什么？

五、語音交互的原則

七、小結(jié)