營業(yè)廳大屏+數(shù)字人產(chǎn)品運(yùn)用深度解析

4 評論 2761 瀏覽 14 收藏 15 分鐘

科技的發(fā)展,數(shù)字人已經(jīng)滲透到各個行業(yè)里邊,營業(yè)廳大屏都開始采用數(shù)字人產(chǎn)品,下邊的筆者舉例子來分析此現(xiàn)象,方便更好地了解市場趨勢和用戶需求情況,感興趣的同學(xué)可以進(jìn)來看看,或許可以給你一些啟發(fā)和感想。

本文旨在收集、分析銀行行業(yè)在營業(yè)廳大屏上的數(shù)字人運(yùn)用的情況(案例與需求),以便更好地了解市場趨勢和用戶需求。

一、銀行網(wǎng)點(diǎn)情況分析

1. 銀行網(wǎng)點(diǎn)情況

根據(jù)《中國零售銀行發(fā)展策略》報告,2022年,中國零售銀行營業(yè)廳中大屏設(shè)備的普及率達(dá)到了70%,表明大屏設(shè)備在銀行營業(yè)廳中的應(yīng)用已經(jīng)相當(dāng)普遍。

  1. 如建設(shè)銀行的年度報告,其中提到該行在2021年共設(shè)有14,315個網(wǎng)點(diǎn),其中包括5,585個自助銀行和9,389臺自助設(shè)備,以及2,960個智能柜臺。
  2. 農(nóng)業(yè)銀行的年度報告則提到該行在2021年共設(shè)有22,765個網(wǎng)點(diǎn),其中包括6,587個自助銀行和19,070臺自助設(shè)備。

銀行網(wǎng)點(diǎn)數(shù)量與人員的變化情況:

2022年,國有大行及部分股份制銀行合計(jì)裁撤約2800家銀行網(wǎng)點(diǎn),創(chuàng)下歷史新高。其中,六大行網(wǎng)點(diǎn)凈減少1000余家,縣域及農(nóng)村金融機(jī)構(gòu)減少幅度最大,達(dá)1516家,占網(wǎng)點(diǎn)總減少量的54%。

銀行統(tǒng)計(jì)2022年人員數(shù)量減少的情況因各家銀行而異,總體上降幅在0.5%至1.5%之間,舉例如下:

  • 工商銀行:員工總數(shù)從43.41萬人減少到42.76萬人,降幅約為1.5%;
  • 農(nóng)業(yè)銀行:員工總數(shù)從45.52萬人減少到45.22萬人,離職人數(shù)約3000人;
  • 中國銀行:員工總數(shù)沒有提及,但提到比上年末減少8200人;
  • 建設(shè)銀行:員工總數(shù)從28.73萬人減少到28.59萬人,降幅約為0.5%;
  • 郵儲銀行:員工總數(shù)從9.35萬人減少到9.18萬人,降幅約為1.8%。

銀行營業(yè)廳智能硬件升級趨勢:

  • 進(jìn)行數(shù)字化、智能化升級,提供更加便捷、高效、安全的金融服務(wù)。
  • 越來越多的銀行開始引入大屏設(shè)備以提升客戶體驗(yàn)和服務(wù)效率。如數(shù)字人在銀行領(lǐng)域的應(yīng)用場景包括客戶服務(wù)、業(yè)務(wù)咨詢、金融教育等。
  • 運(yùn)用數(shù)字人能夠進(jìn)行多輪語音交互,協(xié)助客戶辦理業(yè)務(wù)、解答客戶疑問,并準(zhǔn)確定位相應(yīng)回答,高效滿足客戶需求。

2. 線下大屏客群情況

1) 線下大屏用戶畫像

主要面向的是中老年人群:他們對于新技術(shù)的接受度相對較低,更喜歡通過線下渠道進(jìn)行業(yè)務(wù)辦理。

用戶群體特質(zhì)分析:

  • 中老年人群通常有較多的儲蓄和投資需求,
  • 可能包括企業(yè)主、高級管理人員、專業(yè)人士這些用戶群體
  • 以上群體具有較高的金融需求和消費(fèi)能力,對金融產(chǎn)品和服務(wù)有較高的關(guān)注度。

用戶需求分析:

  • 實(shí)時更新金融信息;
  • 方便查詢和辦理業(yè)務(wù);
  • 協(xié)助大堂經(jīng)理,提高服務(wù)效率,進(jìn)行業(yè)務(wù)分流;
  • 提升品牌形象等。

2) 客戶痛點(diǎn)

銀行角度來說:

  • 大屏產(chǎn)品需要滿足以下特點(diǎn):高清畫質(zhì)、穩(wěn)定性好、易于維護(hù)、操作簡便等。
  • 需要針對不同場景和客戶需求,還可以提供定制化的解決方案。
  • 大屏?xí)嬖谛畔⒏虏患皶r、操作復(fù)雜、設(shè)備故障等問題。
  • 數(shù)字化轉(zhuǎn)型的挑戰(zhàn):傳統(tǒng)大屏設(shè)備需要升級換代。

用戶角度來說:

  • 需要提供各種金融服務(wù),如存款、貸款、理財、保險等。
  • 設(shè)備的拾音,語音或者觸屏交互要穩(wěn)定且有效;
  • 智能客服、智能機(jī)器人需要能理解說的內(nèi)容,并能提供一個簡單易懂的輸出內(nèi)容;
  • 可以有文本+圖文+視頻等多形式的輸出;

二、大屏

1. 常見大屏的類型

1) LED屏

LED大屏以其高亮度、高分辨率、大屏幕、長壽命以及低能耗等特點(diǎn),獨(dú)樹一幟。由數(shù)以萬計(jì)的LED燈珠組成,它能夠呈現(xiàn)出清晰、細(xì)膩的圖像和視頻。無論是在明亮的陽光下還是在黑暗的環(huán)境中,LED大屏都能保證畫面的清晰度和色彩的鮮艷度。LED大屏主要特點(diǎn)是高分辨率、無縫拼接等顯示效果,以及靈活多變的外形、可搭載觸摸顯示等優(yōu)勢。

目前在各種銀行、政務(wù)大廳等場景最常見,作為其智能數(shù)字化的一個最直接的體現(xiàn)。

結(jié)合數(shù)字人呈現(xiàn)效果,通過LED大屏呈現(xiàn)出來的數(shù)字人,整體的清晰度可以達(dá)到4K,在數(shù)字人精度足夠高的情況下,呈現(xiàn)出來的效果就十分逼真。

2) 全息倉

全息艙是一款裸眼3D終端顯示設(shè)備。該設(shè)備是利用空間錯視原理,對于2d拍攝圖像進(jìn)行分層透視處理,結(jié)合空間的縱深感,產(chǎn)生裸眼3D的效果的投放設(shè)備。它能夠?yàn)橛脩籼峁┍普娴娜S圖像和沉浸式體驗(yàn)。它是由一個封閉的空間組成,內(nèi)部配備了高分辨率的全息投影裝置。

結(jié)合數(shù)字人呈現(xiàn)效果,通過全息倉呈現(xiàn)出來的數(shù)字人,整體的清晰度因?yàn)楣饩€原因會呈現(xiàn)出不同效果,但是在3D立體感上面就,以裸眼的視角去觀看,就會感覺真的站了一個人在你的面前。

2. 大屏常見第三方集成能力

1)語音模塊

  • 語音識別(ASR):用于大屏設(shè)備,來聽懂用戶說的內(nèi)容;
  • 知識庫(NLP)或者大模型:基于ASR獲取的問題,去NLP或者大模型獲取對飲的答案,這個也是考研最終輸出的答案正確性以及易懂性的關(guān)鍵。目前因?yàn)榻衲甏竽P偷目焖侔l(fā)展,已經(jīng)可以輸出更加易懂與人性化的內(nèi)容了。當(dāng)然基于銀行這類金融行業(yè)的特殊性,業(yè)務(wù)甲方還是會考慮回答內(nèi)容的準(zhǔn)確性,所以更多的還是會選擇NLP(因?yàn)?strong>風(fēng)險可控)。
  • 語音播報(TTS):在獲取需要播報的內(nèi)容后,通過語音播報的方式與客戶交互,可以理解為語音的輸出,一般可以配置音色、語速等。

2) 智能交互模塊

  • 攝像頭識別:可以理解為大屏設(shè)備的眼睛,用于很多業(yè)務(wù)交互的設(shè)計(jì),比如識別到有效對象,觸發(fā)部分特定業(yè)務(wù)。
  • 去除回聲與降噪:常見的會有兩種方案,一種是收音設(shè)備本身就會自帶降噪或者說音色識別等能力,另外一個就是通過算法來實(shí)現(xiàn)。
  • 語音喚醒:通俗易懂就是類似“小度小度”此類,關(guān)鍵詞語喚醒或者打斷原有播報。

3)數(shù)字人模塊(本文主要闡述與數(shù)字相關(guān)的大屏方案)

數(shù)字人形象:

  • 數(shù)字人大屏終端渲染:數(shù)字人渲染直接在大屏上基于大屏的硬件條件,實(shí)時渲染數(shù)字人的效果,包括數(shù)字人的口唇驅(qū)動,全身驅(qū)動,背景等要素的驅(qū)動。
  • 數(shù)字人云端渲染:在云服務(wù)器上進(jìn)行數(shù)字人渲染。

需要對接第三方推拉流廠商,數(shù)字人的渲染是用的云端服務(wù)器的性能,在通過推拉流的服務(wù)推送到“房間”。

推拉流在大屏終端嵌入推拉流SDK,端上的SDK也進(jìn)入“房間”實(shí)現(xiàn)通訊。

3. 大屏的最優(yōu)設(shè)計(jì)建議

1)大屏使用距離

為了讓數(shù)字人真實(shí)存在于場景中,與用戶建立舒適安全的溝通,我們需要探究合適的人物身高與大小以保障用戶與虛擬人之間距離適中交互自然?!诖笃恋氖褂脠鼍爸?,用戶與屏幕需保持 50cm 左右的操作距離。

2)大屏交互方式

①主動服務(wù)

當(dāng)用戶進(jìn)入與數(shù)字人的交互區(qū)域,大屏自動通過圖像人臉識別獲取用戶信息,數(shù)字人進(jìn)入服務(wù)狀態(tài),主動說話并推出服務(wù)卡片,讓用戶能夠快速建立服務(wù)認(rèn)知,聚焦任務(wù)操作。

②指引明確

屏用戶天然習(xí)慣點(diǎn)擊操作,在信息輸入方式上,對于不同類型的任務(wù)需要引導(dǎo)用戶使用 GUI 操作還是語音輸入表達(dá)訴求,強(qiáng)調(diào):“試試說 ” 與 “選擇” 的引導(dǎo)差異。同時在交互中的每一個狀態(tài)下,都需要讓用戶明確我現(xiàn)在可以做什么,如何做,可以獲取什么結(jié)果。要求數(shù)字人與用戶交互的每一個節(jié)點(diǎn)明晰,引導(dǎo)通俗易懂,操作簡單。

③漸進(jìn)式引導(dǎo)

為減少用戶理解成本,我們在信息與操作的引導(dǎo)上采用單一路徑,用戶只需要跟隨虛擬人的逐步引導(dǎo),傻瓜式操作即可流暢完成服務(wù)。

④分支處理

在一問一答的語音交互中,有很多潛在分支需要處理才可以還原自然體驗(yàn)。比如用戶在服務(wù)進(jìn)行中長時間未給出明確操作,至少會有兩種情況:1.我們認(rèn)為用戶可能存在困惑,虛擬人會主動引導(dǎo)用戶進(jìn)行限定內(nèi)容選擇或聚焦提出問題。2.本身反饋內(nèi)容較復(fù)雜冗長用戶未操作則可能是還在消化信息,虛擬人需要延長等待時長等等。

3)大屏最佳操作區(qū)的設(shè)定

根據(jù)人因工程學(xué),確定出大屏的最佳交互區(qū)域最佳可視區(qū),來展示核心卡片信息。以 55 寸大屏,1.68m 平均身高用戶來進(jìn)行方案探索。依照人體站立不屈膝,右側(cè)大臂可旋轉(zhuǎn)橫向和縱向角度計(jì)算出最佳交互區(qū)域。

根據(jù)最佳交互區(qū),我們可以將核心交互卡片放置于此,次級交互放置于外沿,邊緣區(qū)域不適合放置操作內(nèi)容。

4)大屏最佳可視區(qū)的設(shè)定

水平可視區(qū)域:

雙眼區(qū)域大約在左右 60° 以內(nèi),觀察超出左右 60° 的物體時,則需要集中精力才能識別物象,因此核心內(nèi)容區(qū)域在左右 60° 視角內(nèi)較為合理。

垂直可視區(qū)域:

基于對交互區(qū)和可視區(qū)的計(jì)算測量,在頁面布局中,我們將信息卡片最大程度的置于有效視區(qū)和次級交互區(qū)的重疊區(qū)域,用戶可以最舒適的狀態(tài)進(jìn)行閱讀和操作;

4. 典型客戶案例分析

1)浦發(fā)銀行

個人評價:

  • 能用逼真的語氣、語調(diào)進(jìn)行多輪自然對話;
  • 利用 3D 合成技術(shù),復(fù)刻真實(shí)人物,有逼真的外形、表情、肢體動作;
  • 可感知環(huán)境且做出實(shí)時反應(yīng)。
  • 浦發(fā)數(shù)字人正在用自己的“親和力”提升數(shù)字金融服務(wù)的內(nèi)涵,讓浦發(fā)的用戶感受科技金融、數(shù)字金融帶來的魅力。

2)農(nóng)業(yè)銀行

個人評價:

  • 實(shí)時語音對話交互,識別效果較好。
  • 不確定在嘈雜環(huán)境下,此模式的實(shí)際效果。
  • 數(shù)字人的對話框以及內(nèi)容展示區(qū)域較為一般。
  • 數(shù)字人沒有肢體動作,較為死板,交互感一般。

5. 數(shù)字人大屏優(yōu)勢

本文由 @毅鳴 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于 CC0 協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 請問可以通過什么方式聯(lián)系到您,我公司正在廣納人才

    來自浙江 回復(fù)
    1. V:xjd_fourtry

      來自浙江 回復(fù)
  2. 請問可以通過什么方式聯(lián)系到您,我現(xiàn)在正在做這塊的產(chǎn)品,想和您學(xué)習(xí)一下

    來自廣東 回復(fù)
    1. V:xjd_fourtry

      來自浙江 回復(fù)