智能語(yǔ)音機(jī)器人底層系統(tǒng)設(shè)計(jì)邏輯
編輯導(dǎo)語(yǔ):未來(lái)最大的交互,不是現(xiàn)在的人機(jī)交互,而是人與人工智能的交互。人工智能行業(yè)現(xiàn)今取得了不少的成就,也逐漸進(jìn)入了千萬(wàn)家庭,陪伴在了很多人的身邊,其中就包括智能語(yǔ)音機(jī)器人。本文筆者將以智能客服領(lǐng)域?yàn)槌霭l(fā)點(diǎn),結(jié)合自己的工作實(shí)踐進(jìn)行詳細(xì)分析。
3 月 4 日,中共中央政治局常務(wù)委員會(huì)召開(kāi)會(huì)議,指出要加快推進(jìn)包括5G 網(wǎng)絡(luò)、人工智能、數(shù)據(jù)中心等新型基礎(chǔ)設(shè)施建設(shè)進(jìn)度。
結(jié)合此前人工智能賦能技術(shù)在疫情防控中發(fā)揮的重要作用,加上新基建政策,可以預(yù)見(jiàn)的是未來(lái)人工智能必將迎來(lái)新一輪的發(fā)展。
據(jù)艾瑞網(wǎng)發(fā)布的《2019年中國(guó)人工智能產(chǎn)業(yè)研究報(bào)告》中顯示,到2022年中國(guó)智能客服業(yè)務(wù)規(guī)模將突破160億元,泛智能客服市場(chǎng)將突破600億,也預(yù)示著這一領(lǐng)域依然擁有廣闊的市場(chǎng)空間。
本篇筆者將著重就智能客服這一應(yīng)用較為成熟的領(lǐng)域,結(jié)合自己的工作實(shí)踐進(jìn)行詳細(xì)分析。
一、智能客服背景
智能語(yǔ)音客服機(jī)器人是在傳統(tǒng)的客服系統(tǒng)基礎(chǔ)上,集成了語(yǔ)音識(shí)別、語(yǔ)義理解、知識(shí)圖譜、深度學(xué)習(xí)等多項(xiàng)智能交互技術(shù),能準(zhǔn)確理解用戶的意圖或提問(wèn),再根據(jù)豐富的內(nèi)容和海量知識(shí)圖譜,給予用戶滿意的回答,目前已廣泛應(yīng)用于金融、保險(xiǎn)、汽車(chē)、房產(chǎn)、電商、政府等多個(gè)領(lǐng)域。
對(duì)比于傳統(tǒng)客服,智能客服具有為企業(yè)降本增效,提升商機(jī)轉(zhuǎn)化率,提升用戶體驗(yàn)、更加方便簡(jiǎn)潔、移動(dòng)性及時(shí)性社交性能一體化的優(yōu)點(diǎn)。
智能客服機(jī)器人應(yīng)用場(chǎng)景十分豐富,
- 從交互模式上來(lái)看:可以分為文本客服機(jī)器人、語(yǔ)音客服機(jī)器人兩大類;
- 從場(chǎng)景和功能類型來(lái)看:又可分為問(wèn)答機(jī)器人、任務(wù)機(jī)器人、閑聊機(jī)器人三大類。
那么語(yǔ)音外呼機(jī)器人這個(gè)形態(tài)的產(chǎn)品在實(shí)際場(chǎng)景中如何應(yīng)用的呢?
下面我會(huì)從語(yǔ)音外呼機(jī)器人工作流程、外呼系統(tǒng)搭建、應(yīng)用案例,應(yīng)用重難點(diǎn)等4個(gè)模塊來(lái)做詳細(xì)闡述。
二、智能外呼機(jī)器人工作流程
AI外呼機(jī)器人是集合了自動(dòng)撥打電話、多輪語(yǔ)音交互、客戶意向智能分級(jí)、外呼任務(wù)自定義等多功能于一體智能語(yǔ)音對(duì)話機(jī)器人。
以下是一個(gè)基本的智能外呼機(jī)器人工作流程:
如上圖所示,一個(gè)完整的智能外呼流程(不涉及轉(zhuǎn)人工)包含了四個(gè)環(huán)節(jié),各環(huán)節(jié)會(huì)由外呼系統(tǒng)整體串聯(lián)起來(lái)進(jìn)行運(yùn)作:
- 用戶接聽(tīng):外呼工作流程的開(kāi)始,外呼系統(tǒng)需識(shí)別用戶接聽(tīng)信號(hào)。
- 客戶機(jī)器人響應(yīng):這一環(huán)節(jié)關(guān)鍵在策略輸出,外呼系統(tǒng)需根據(jù)用戶應(yīng)答,識(shí)別用戶意圖或動(dòng)作,根據(jù)機(jī)器人預(yù)設(shè)任務(wù)流和策略給出響應(yīng)話術(shù)。
- 用戶應(yīng)答/動(dòng)作:這一模塊主要在外呼系統(tǒng)需對(duì)用戶的意圖和動(dòng)作進(jìn)行精準(zhǔn)識(shí)別,做用戶狀態(tài)記錄,以便一下步策略的實(shí)施。
- 用戶/客服機(jī)器人掛機(jī):當(dāng)機(jī)器人走完任務(wù)流會(huì)主動(dòng)掛斷,或用戶提前自主掛斷,外呼工作流結(jié)束。
三、外呼系統(tǒng)設(shè)計(jì)
以上工作流的實(shí)現(xiàn)依賴于外呼系統(tǒng)同時(shí)涉及多方技術(shù),下面整體來(lái)介紹下外呼系統(tǒng)的底層架構(gòu)。
上圖為筆者結(jié)合所學(xué)及所做機(jī)器人的實(shí)際業(yè)務(wù)邏輯梳理的呼叫系統(tǒng)架構(gòu),如圖,整體上語(yǔ)音外呼系統(tǒng)可分為五大模塊:
1. 通訊管理模塊
由通訊線路和FreeSwitch電話系統(tǒng)構(gòu)成,通過(guò)SIP和RTP協(xié)議,實(shí)現(xiàn)進(jìn)行各種信令和語(yǔ)音流的傳輸。其中,通訊線路包括三大運(yùn)營(yíng)商、各家集成線路商,用于提供線路資源將電話撥打出去。
電話系統(tǒng)采用的是開(kāi)源的FreeSwitch,主要用于處理外呼請(qǐng)求和傳輸SIP信令和語(yǔ)音流。
2. 語(yǔ)音模塊
負(fù)責(zé)語(yǔ)音相關(guān)操作,包括語(yǔ)音識(shí)別(ASR)、語(yǔ)音合成(TTS)、錄音播放等。
其中ASR和TTS這塊,目前一般采用阿里云、科大訊飛等技術(shù)較為成熟的供應(yīng)商服務(wù),主要通過(guò)接口形式對(duì)接使用。
3. 中控模塊
主要任務(wù)是實(shí)現(xiàn)與其他模塊之間的通信互聯(lián),負(fù)責(zé)將ASR識(shí)別后的文本傳輸給機(jī)器人模塊,將機(jī)器人模塊的指令策略轉(zhuǎn)化為電話系統(tǒng)的執(zhí)行指令,并將數(shù)據(jù)同步至Saas后臺(tái)(中控模塊命名各家公司都有所不同)。
4. 后臺(tái)管理模塊
負(fù)責(zé)機(jī)器人外呼任務(wù)的發(fā)起和相關(guān)業(yè)務(wù)操作,主要包括外呼任務(wù)的創(chuàng)建,通話流水查詢,客戶管理,數(shù)據(jù)統(tǒng)計(jì)等功能。
5. 機(jī)器人管理模塊
此為整個(gè)外呼流程中的核心AI模塊,通過(guò)自然語(yǔ)言處理(NLP)和對(duì)話管理(DM),進(jìn)行用戶意圖理解,對(duì)話狀態(tài)追蹤,機(jī)器人應(yīng)答策略匹配等,實(shí)現(xiàn)人機(jī)對(duì)話交互。
關(guān)于NLP和DM模塊比較復(fù)雜,筆者將會(huì)在下一篇文章中單獨(dú)對(duì)任務(wù)機(jī)器人對(duì)話系統(tǒng)的設(shè)計(jì)做詳細(xì)闡述,這里就不過(guò)多補(bǔ)充了。
四、應(yīng)用案例
下面以58同城二手車(chē)回訪的業(yè)務(wù)場(chǎng)景,具體分析下外呼機(jī)器人是如何通過(guò)外呼系統(tǒng)進(jìn)行作業(yè)的,外呼系統(tǒng)各模塊間又是如何耦合實(shí)現(xiàn)業(yè)務(wù)需求的。
1. 對(duì)話管理設(shè)計(jì)
正常情況下,外呼業(yè)務(wù)場(chǎng)景一旦確定,產(chǎn)品需先梳理出任務(wù)場(chǎng)景的主干流程,選定深度意圖,設(shè)置匹配QA,設(shè)置槽位,準(zhǔn)備話術(shù),設(shè)計(jì)對(duì)話狀態(tài)追蹤,設(shè)計(jì)對(duì)話策略等一系列工作。
這里的對(duì)話管理的設(shè)計(jì)配置,涉及到外呼系統(tǒng)里機(jī)器人管理模塊。
如:上圖對(duì)話框中機(jī)器人話術(shù)均為事先根據(jù)二手車(chē)回訪業(yè)務(wù)提前設(shè)計(jì)好的主干話術(shù)。
2.外呼任務(wù)創(chuàng)建
對(duì)話管理模塊配置完善后,業(yè)務(wù)人員可在Saas后臺(tái)創(chuàng)建外呼名單,通訊管理模塊接受任務(wù)指令,拉取話單進(jìn)行電話外呼。
3.撥打流程
撥打流程涉及模塊較多,主要包括通訊管理模塊,語(yǔ)音模塊,中控模塊,機(jī)器人管理模塊。
- 運(yùn)營(yíng)商的通信線路根據(jù)業(yè)務(wù)人員創(chuàng)建的外呼任務(wù),開(kāi)始逐個(gè)撥打用戶電話;
- 用戶接通電話后,開(kāi)始進(jìn)入對(duì)話處理循環(huán)流程;
- 通訊管理模塊的FS將用戶語(yǔ)音流傳輸給語(yǔ)音模塊進(jìn)行ASR識(shí)別為文本信息,然后將動(dòng)作/文本信息一起輸送到中控模塊;
- 中控模塊將用戶文本/動(dòng)作信息推送至機(jī)器人模塊,并將機(jī)器人返回的策略指令轉(zhuǎn)化成電話系統(tǒng)的執(zhí)行指令;
- 電話系統(tǒng)結(jié)合語(yǔ)音模塊,進(jìn)行語(yǔ)音合成后,執(zhí)行話術(shù)播放或轉(zhuǎn)人工、掛機(jī)等機(jī)器人動(dòng)作策略,隨后開(kāi)始新一輪對(duì)話循環(huán)處理流程;
- 機(jī)器人/用戶掛機(jī)后,中控模塊將相關(guān)錄音文件、系統(tǒng)信息,狀態(tài)信息等數(shù)據(jù)進(jìn)行存儲(chǔ)并同步至管理后臺(tái)。
五、智能外呼機(jī)器人應(yīng)用重難點(diǎn)
我們考慮一個(gè)外呼機(jī)器人的外呼質(zhì)量會(huì)從兩方面去看,一個(gè)是能保證外呼流程的通暢性,另一個(gè)是保證外呼任務(wù)的完成率。
決定機(jī)器人外呼質(zhì)量的影響因素有很多,筆者從產(chǎn)品的角度去理解,除去目標(biāo)客戶的精準(zhǔn)度、客戶接聽(tīng)電話的環(huán)境、客戶狀態(tài)等非可控因素外,主要還受限于以下幾個(gè)方面:
1. 電話線路的穩(wěn)定性
在呼叫失敗的原因中,很大部分是由于供應(yīng)商提供的線路不穩(wěn)定。
關(guān)于這一點(diǎn)的問(wèn)題規(guī)避,更多的還是申請(qǐng)基礎(chǔ)運(yùn)營(yíng)商的線路或?qū)ふ业秸?guī)渠道的認(rèn)證供應(yīng)商,以保證線路質(zhì)量。
2. FreeSwitch的并發(fā)量
FreeSwitch的具體性能根據(jù)實(shí)際使用環(huán)境差異較大,如果因前期預(yù)估不足,設(shè)置的FS并發(fā)量過(guò)低,超過(guò)并發(fā)則會(huì)出現(xiàn)呼叫異?;蛘Z(yǔ)音卡頓等現(xiàn)象。
應(yīng)從系統(tǒng)的實(shí)際業(yè)務(wù)需求去考慮并發(fā)數(shù),保證FS的性能穩(wěn)定。
3. ASR識(shí)別準(zhǔn)確率
雖然目前很多供應(yīng)商標(biāo)明的語(yǔ)音識(shí)別率都達(dá)到了97%甚至98%,但此指標(biāo)對(duì)環(huán)境的要求較高。
而實(shí)際環(huán)境在噪音較大,口音,語(yǔ)言混合等場(chǎng)景下,ASR識(shí)別準(zhǔn)確率均有一定程度的下降。
4. 語(yǔ)義理解
在對(duì)話機(jī)器人中語(yǔ)言理解(NLU)模塊主要包括意圖識(shí)別和槽位識(shí)別,這兩點(diǎn)直接影響語(yǔ)義理解的效果。
語(yǔ)音場(chǎng)景下,經(jīng)常出現(xiàn)用戶回復(fù)單語(yǔ)氣詞的情況,如“嗯”,“啊”等,或語(yǔ)音特有意圖,如“大點(diǎn)聲”,“說(shuō)快點(diǎn)”,要求“重說(shuō)”等,在意圖設(shè)計(jì)時(shí)需考慮到此類特殊場(chǎng),以及其應(yīng)答策略。
前面提到的ASR識(shí)別錯(cuò)誤會(huì)導(dǎo)致語(yǔ)義理解部分受影響,目前可采用加入多模態(tài)學(xué)習(xí)的優(yōu)化方案,同時(shí)融合音頻特征,糾正語(yǔ)音識(shí)別結(jié)果,此方案經(jīng)驗(yàn)證對(duì)意圖識(shí)別模塊準(zhǔn)確率會(huì)有近2%的提升。
5. 對(duì)話管理模塊設(shè)計(jì)合理性
機(jī)器人對(duì)話管理模塊設(shè)計(jì)的合理性,直接決定了整個(gè)呼叫任務(wù)流程的體驗(yàn)感和完成率。
對(duì)話管理模塊的重點(diǎn)在于對(duì)話狀態(tài)追蹤(DST)和對(duì)話策略設(shè)計(jì)(DPL)的合理性,如:打斷、無(wú)聲等語(yǔ)音特有場(chǎng)景,如何在提升用戶體驗(yàn)的同時(shí)確保外呼任務(wù)流的正常正常進(jìn)行。
6. 話術(shù)設(shè)計(jì)的合理性
話術(shù)設(shè)計(jì)也是語(yǔ)音任務(wù)機(jī)器人設(shè)計(jì)中非常重要的一個(gè)部分,為提升用戶的體驗(yàn)。
話術(shù)設(shè)計(jì)可遵循以下幾個(gè)原則:
- 話術(shù)設(shè)計(jì)更貼合應(yīng)用場(chǎng)景;
- 主干話術(shù)設(shè)計(jì)精簡(jiǎn)有吸引力;
- 話術(shù)擬人化;
- 不同狀態(tài)下話術(shù)變化。
六、結(jié)語(yǔ)
目前,隨著AI技術(shù)的不斷進(jìn)步,市場(chǎng)需求的進(jìn)一步擴(kuò)大,智能語(yǔ)音機(jī)器人在實(shí)際應(yīng)用場(chǎng)景中的表現(xiàn)也越來(lái)越好,逐漸能勝任更多的業(yè)務(wù)工作。
不過(guò)其難點(diǎn)仍然存在,期待未來(lái)在更多AI技術(shù)的賦能下,智能客服機(jī)器人能力有更大程度的提升,能讓我們?cè)谏钪畜w驗(yàn)到更貼心智能的機(jī)器人服務(wù)。
以上內(nèi)容基于筆者結(jié)合學(xué)習(xí)和工作實(shí)踐的思考,若有理解不到位之處,還望大家指正,更希望通過(guò)這篇文章能與各位多多交流。
參考資料:
- IDC《中國(guó)人工智能市場(chǎng)軟件及應(yīng)用半年度研究報(bào)告(2019H2)》
- 艾瑞網(wǎng)《2019年中國(guó)人工智能產(chǎn)業(yè)研究報(bào)告》
- 58同城《智能語(yǔ)音機(jī)器人助力企業(yè)提效增收》
本文由 @岑為 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議
- 目前還沒(méi)評(píng)論,等你發(fā)揮!