一個(gè)智能外呼機(jī)器人的誕生

6 評論 6468 瀏覽 33 收藏 16 分鐘

導(dǎo)讀:AI經(jīng)過近幾年的快速發(fā)展,融入越來越多的業(yè)務(wù)服務(wù),誕生了許多觸手可及的產(chǎn)品,給眾多行業(yè)賦能提效,也給普通消費(fèi)者帶來了不一樣的產(chǎn)品體驗(yàn)。相信很多同學(xué)都接聽過機(jī)器人打來的電話,如基金推薦、外賣提醒、賣房推銷等,高效、穩(wěn)定的外呼給商家側(cè)提升了極大的效率。那么,這種智能外呼機(jī)器人產(chǎn)品是如何落地的呢?

一、產(chǎn)品架構(gòu)

首先來看看整體的產(chǎn)品架構(gòu):

  • 技術(shù)基礎(chǔ):智能外呼機(jī)器人核心是AI的基礎(chǔ)技術(shù),賦予產(chǎn)品識(shí)別語音、語義理解、合成語音的能力,簡單來說就是如何準(zhǔn)的確地識(shí)別客戶所表達(dá)的意思,一般稱作識(shí)別意圖。而另一方面,F(xiàn)s、sip構(gòu)建的話務(wù)服務(wù)賦予產(chǎn)品對外通話的能力,可以撥通客戶的手機(jī)進(jìn)行交流。
  • 資源許可:構(gòu)建的機(jī)器人服務(wù)需要耗費(fèi)一定的資源,一般將整個(gè)過程分為話務(wù)、TTS、ASR、機(jī)器人方面的資源。如果要完成完整的外呼服務(wù),一般是1:1的關(guān)系。如果是saas產(chǎn)品,可以將整個(gè)許可打包成一個(gè)商品出售。按這樣區(qū)分可以清晰劃分產(chǎn)品框架,后續(xù)的運(yùn)維、擴(kuò)容也十分方便,也利于計(jì)算成本、產(chǎn)品定價(jià)。
  • 話務(wù)模塊:話務(wù)模塊是管理話務(wù)能力方面的功能,語音通訊、錄音等。
  • 語音服務(wù):該模塊是管理語音方面的能力,包括ASR服務(wù)、TTS服務(wù)。也會(huì)有一些產(chǎn)品將這些能力納入話務(wù)模塊。
  • 算法模塊:算法模塊是外呼機(jī)器人的核心能力,需要完成數(shù)據(jù)的處理、模型的構(gòu)建與訓(xùn)練等,讓機(jī)器人具備識(shí)別能力。
  • 對話管理:機(jī)器人識(shí)別客戶的意圖之后,需要做出一定的回應(yīng)。怎么說、說什么由對話管理去控制。
  • 運(yùn)營管理:基于上述模塊的協(xié)作完成一個(gè)外呼服務(wù)的構(gòu)建,對于業(yè)務(wù)人員來說則需要在運(yùn)營層面去管理外呼名單、外呼策略等,讓機(jī)器人運(yùn)轉(zhuǎn)起來。

對產(chǎn)品有全局的架構(gòu)思維,有助于全面地看待問題,無論是產(chǎn)品設(shè)計(jì)還是后續(xù)的運(yùn)營都是很有幫助的。

二、業(yè)務(wù)流程

智能外呼,簡單來說就是模擬人的對話能力,教會(huì)機(jī)器人去識(shí)別語音內(nèi)容,然后根據(jù)內(nèi)容做出應(yīng)答。在運(yùn)營管理發(fā)起外呼動(dòng)作,整體的業(yè)務(wù)流會(huì)經(jīng)過以下幾個(gè)步驟:

1.由話務(wù)服務(wù)出局通話請求,撥通客戶的電話后,收集客戶語音并實(shí)時(shí)返回至語音服務(wù)模塊;

2.語音服務(wù)將客戶的語音經(jīng)過ASR處理,輸出客戶的文本給到算法模塊;

3.算法模塊經(jīng)過算法分析,識(shí)別客戶的意圖,了解客戶想表達(dá)的意思。有一點(diǎn)需要注意的是,不一定非要語音才能分析意圖,比如客戶靜默太長時(shí)間,可輸出一個(gè)靜默的意圖,讓機(jī)器人再次喚醒客戶對答。也不一定是對文本內(nèi)容直接分析,比如機(jī)器人未播完話術(shù)時(shí)被客戶打斷,這時(shí)候應(yīng)該輸出一個(gè)打斷的意圖,停止播報(bào),讓客戶說完再識(shí)別。各種各樣的情景,跟人與人之間的對話情景對應(yīng);

4.得到客戶的意圖后,對話控制根據(jù)對話流程,輸出機(jī)器人需要對答的內(nèi)容。對答文本流轉(zhuǎn)至TTS合成語音(如果文本不涉及變量,可以一次性保存為錄音,不占用TTS資源),或者調(diào)用已錄好的音頻,傳至話務(wù)服務(wù)模塊,對客戶輸出語音。然后再次得到客戶語音,循環(huán)這個(gè)過程直至結(jié)束后將對話數(shù)據(jù)返給外呼管理模塊,進(jìn)行后續(xù)的分析。

三、產(chǎn)品設(shè)計(jì)

1. 話務(wù)服務(wù)模塊

依托于FS強(qiáng)大的拓展性,搭建一個(gè)電話軟交換平臺(tái),可對接運(yùn)營商的sip線路,也可用網(wǎng)關(guān)設(shè)備搭建話務(wù)中心,提供呼叫控制、資源分配、錄音、計(jì)費(fèi)等能力。一般大企業(yè)會(huì)有獨(dú)立的話務(wù)服務(wù),專供需要的業(yè)務(wù)系統(tǒng)接入,而自建外呼服務(wù)或者構(gòu)建saas產(chǎn)品則需要從0到1去搭建了。

2. 語音服務(wù)模塊

ASR、TTS是基礎(chǔ)底層技術(shù),自研成本非常高,而且經(jīng)過長期的發(fā)展也很成熟,市面上有科大、阿里云、騰訊云等廠商的服務(wù)。一般有兩種模式,一種是接入云服務(wù),按調(diào)用次數(shù)收費(fèi),如果有開放的開發(fā)環(huán)境建議使用這種模式,可以隨時(shí)升級調(diào)優(yōu)。另外一種是買斷服務(wù),購買完整的語音服務(wù),包括模型、資源,一般在較為封閉的開發(fā)環(huán)境使用,比如銀行業(yè)務(wù)。但這種模式成本較大,而且調(diào)試升級不方便。

3. 對話管理

對話管理是智能外呼機(jī)器人產(chǎn)品的核心模塊,涉及VUI設(shè)計(jì)、話術(shù)管理等。VUI設(shè)計(jì)是指語音交互流程,就是機(jī)器人的應(yīng)答邏輯,是機(jī)器人的主心骨。我對于VUI的設(shè)計(jì)主要有以下幾個(gè)步驟:

1)梳理外呼業(yè)務(wù)的主流程

產(chǎn)品必定會(huì)有一個(gè)流程,以期望客戶按我們的設(shè)計(jì)走,完成一定的動(dòng)作,達(dá)到業(yè)務(wù)目標(biāo)。所以在設(shè)計(jì)前應(yīng)當(dāng)梳理清楚我們要做的是什么業(yè)務(wù),業(yè)務(wù)涉及什么環(huán)節(jié),業(yè)務(wù)目標(biāo)又是什么。以一個(gè)信用卡欠款催收為例:

2)歸納意圖

在業(yè)務(wù)運(yùn)轉(zhuǎn)過程找中,會(huì)遇到哪些情況,然后歸類起來,形成一個(gè)意圖,代表客戶反饋給機(jī)器人的狀態(tài)。可將意圖分為三種類別:通用意圖、業(yè)務(wù)意圖、QA。

  • 通用意圖:顧名思義就是整個(gè)人機(jī)對話環(huán)節(jié)都可能會(huì)發(fā)生的情況。咱們可以想想現(xiàn)實(shí)中打電話,對方可能會(huì)正在忙沒法接電話,可能信號不好聽不清等等,可以歸納出“正忙、聽不清”的意圖;
  • 業(yè)務(wù)意圖:與業(yè)務(wù)相關(guān)的情況,比如客戶表示是不是本人、已還清欠款等情況,可歸納出“是本人、非本人、已還款”的意圖;
  • QA:通用意圖以及業(yè)務(wù)意圖是固定的,在實(shí)際運(yùn)營中會(huì)有些頻率不高或者未想到的語料,可以在線上添加QA語料,然后在后臺(tái)經(jīng)過關(guān)鍵詞提取、預(yù)定訓(xùn)練方式實(shí)現(xiàn)模型建設(shè),可減少算法投入成本,也比較靈活。如果某個(gè)QA出現(xiàn)頻率高,可以考慮增加一個(gè)通用意圖或者業(yè)務(wù)意圖。

確定意圖后,有助于我們梳理流程框架:

3)編寫對話劇本

確定了環(huán)節(jié)、意圖后,還是比較零散的信息,典型的對話場景是怎么樣的?實(shí)際的對話流又是怎么體現(xiàn)的?這時(shí)候可以借助對話劇本去模擬人機(jī)對話。如果客戶按推薦的流程走,并完成了目標(biāo),稱之為愉悅路徑。如果客戶沒有按推薦的流程走,無法完成外呼目標(biāo),則成為非愉悅路徑。

舉個(gè)例子:

編寫對話劇本其實(shí)就是梳理主流程、異常分支如何處理,尤其是非愉悅路徑,通話環(huán)境的情況很復(fù)雜,各種不在目標(biāo)內(nèi)的情況要做好處理。

4)設(shè)計(jì)對話跳轉(zhuǎn)邏輯

經(jīng)過對話劇本的編寫,VUI有了雛形,接下來需要整合成一個(gè)完整的流程。對于VUI,我理解為一個(gè)龐大的決策樹,在某個(gè)節(jié)點(diǎn),根據(jù)客戶的反饋決定往哪個(gè)分支走,主體設(shè)計(jì)是環(huán)節(jié)+意圖+跳轉(zhuǎn)。

對話的跳轉(zhuǎn)邏輯設(shè)計(jì)是個(gè)十分復(fù)雜的過程,需要反復(fù)推敲跳轉(zhuǎn)是否合理,是否符合業(yè)務(wù)場景,是否覆蓋了常見的情況。從開場白到完成業(yè)務(wù)目標(biāo)會(huì)有多種分支,而且有時(shí)候跳轉(zhuǎn)較多,單純看路徑會(huì)比較抽象,可以借助對話劇本具象化。另外建議設(shè)置好結(jié)束點(diǎn),路徑設(shè)計(jì)不宜過長,機(jī)器人沒法像人這么靈活,對話輪次過多反而會(huì)阻礙業(yè)務(wù)目標(biāo)的達(dá)成。如果某個(gè)意圖出現(xiàn)頻率高,而且處理方式是一致的,可以提煉出來作為一個(gè)全局節(jié)點(diǎn)。

5)設(shè)計(jì)話術(shù)

確定了對話跳轉(zhuǎn)邏輯后,需要明確每個(gè)節(jié)點(diǎn)機(jī)器人的應(yīng)答話術(shù)。話術(shù)內(nèi)容的設(shè)計(jì)也很考究,基本原則是通用化、封閉化。應(yīng)答內(nèi)容盡量通用化,往主流程引導(dǎo),兜住未知的情景,復(fù)雜的內(nèi)容引導(dǎo)客戶去確認(rèn)。雖然AI大大提升了效率,但是還沒有達(dá)到可以處理全部開放化的情景,比較適合做標(biāo)準(zhǔn)化的工作。舉個(gè)例子,你想確認(rèn)客戶的地址是否正確,不應(yīng)該去問”請問您所在的地級市是哪里“,答案千千萬萬,而且asr識(shí)別不準(zhǔn),可行性可想而知,倒不如改為”請問您是在xxx地方嗎?“,這樣范圍可控。

參照對話跳轉(zhuǎn)邏輯設(shè)計(jì)每個(gè)節(jié)點(diǎn)話術(shù),包括環(huán)節(jié)+客戶意圖+機(jī)器人話術(shù)+跳轉(zhuǎn)節(jié)點(diǎn):

經(jīng)過5個(gè)步驟的思考以及設(shè)計(jì),對話管理模塊的功能已完成,產(chǎn)品展示層面比較多的是畫布的模式,可以自由組合各個(gè)環(huán)節(jié)、節(jié)點(diǎn)以及話術(shù)。但VUI設(shè)計(jì)是復(fù)雜性的功能,不建議普通客戶去操作,交由專業(yè)人員管理,或者采用模板的方式推廣。

4. 算法模塊

VUI里面涉及的意圖是由算法分析出來的,建議在意圖設(shè)計(jì)的環(huán)節(jié)也保持與算法的同事溝通。算法模型是核心資產(chǎn),也是產(chǎn)品護(hù)城河。目前市面上會(huì)有廠商提供NLP服務(wù),但作為核心能力,建議采用自研,契合自身業(yè)務(wù)去構(gòu)建算法能力。智能產(chǎn)品需要眾多的語料去完善其模型,即使產(chǎn)品上線后也需要不斷去調(diào)優(yōu),一套完整的算法優(yōu)化流程尤為重要。

作為產(chǎn)品經(jīng)理,重點(diǎn)關(guān)注其中的標(biāo)注結(jié)果,核對分類是否正確、是否存在與產(chǎn)品設(shè)計(jì)違背的地方、是否可以達(dá)到可用的效果,這樣可以減少效果與最終目標(biāo)的不適應(yīng)情況。另外還有需要關(guān)注模型校驗(yàn)的結(jié)果是否符合預(yù)期,生產(chǎn)對客的效果如何。

雖然AI技術(shù)很強(qiáng)大,但也不是無敵,也要看與各個(gè)技術(shù)的配合度以及局限性。語音機(jī)器人特別依賴ASR的準(zhǔn)確率,曾經(jīng)踩過一個(gè)坑,詢問客戶的所在地,以判斷是否可辦理金融業(yè)務(wù),但ASR對短句的轉(zhuǎn)譯能力差,無法精準(zhǔn)轉(zhuǎn)寫,導(dǎo)致識(shí)別準(zhǔn)確率很低,效果很不理想。如果前期關(guān)注到ASR的局限性,就很有可能會(huì)規(guī)避這個(gè)問題。

算法能力的構(gòu)建涉及多個(gè)角色、多個(gè)流程以及持續(xù)性優(yōu)化,如果業(yè)務(wù)比較成熟,可以搭建一套運(yùn)營后臺(tái)系統(tǒng)去支撐這部分工作,發(fā)現(xiàn)熱點(diǎn)知識(shí)、拒識(shí)等內(nèi)容,實(shí)行標(biāo)注質(zhì)檢工作等。

5. 運(yùn)營管理

經(jīng)過各個(gè)模塊的搭建,已經(jīng)具備了機(jī)器人外呼能力、識(shí)別能力、對答能力,運(yùn)營管理模塊就負(fù)責(zé)如何使用機(jī)器人,根據(jù)業(yè)務(wù)需要設(shè)計(jì)各種外呼策略,比如重?fù)堋⒍〞r(shí)外呼、防騷擾等。

四、結(jié)語

智能外呼機(jī)器人是AI落地較為廣泛的產(chǎn)品,涉及了多個(gè)領(lǐng)域的知識(shí),也需要多種角色參與,因此需要掌握的東西比較多,很考驗(yàn)產(chǎn)品的整合能力。同時(shí)也是十分重運(yùn)營的產(chǎn)品,不是搭建完成就完事了。如果功能建設(shè)完成了,我認(rèn)為只是從0到0.5,要達(dá)到真正的對客效果,還需要持續(xù)優(yōu)化,采集更多的語料去豐富意圖、提升識(shí)別效果等。

以上為本人的一點(diǎn)經(jīng)驗(yàn)之談,歡迎大家一起交流。

 

本文由 @骨灰級小白 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 剛才我接到移動(dòng)的智能外呼,和它聊了30秒才發(fā)現(xiàn)是機(jī)器人。
    發(fā)現(xiàn)之后我嘗試不去正面回答它的問題,嘗試轉(zhuǎn)移話題,結(jié)果發(fā)現(xiàn)它居然能無縫銜接我轉(zhuǎn)移的話題,雀氏厲害

    來自廣東 回復(fù)
  2. 智能外呼,簡單來說就是模擬人的對話能力,科技真的越來越發(fā)達(dá)了

    來自廣東 回復(fù)
    1. 技術(shù)是第一生產(chǎn)力~

      回復(fù)
  3. 智能外呼機(jī)器人真的需要進(jìn)一步優(yōu)化,我們一起來 學(xué)習(xí)吧

    來自云南 回復(fù)
  4. 智能外呼機(jī)器人是AI落地較為廣泛的產(chǎn)品,涉及了多個(gè)領(lǐng)域的知識(shí),也需要多種角色參與,因此需要掌握的東西比較多,很考驗(yàn)產(chǎn)品的整合能力”這句話說得好難

    來自江蘇 回復(fù)
    1. 其實(shí)對產(chǎn)研來講落地過程都是一樣的,只不過要操心的事情會(huì)多一些

      回復(fù)