一文看懂語(yǔ)音技術(shù)商業(yè)化邏輯:對(duì)品牌意味著什么 ?

1 評(píng)論 4445 瀏覽 12 收藏 36 分鐘

語(yǔ)音技術(shù),對(duì)品牌意味著什么?

基于語(yǔ)音的技術(shù)將對(duì)許多行業(yè)產(chǎn)生巨大影響,在短短兩年內(nèi),預(yù)計(jì)50%的搜索將基于語(yǔ)音技術(shù)。

該項(xiàng)技術(shù)的普及率可能因用戶的年齡、地理位置和讀寫能力而有所不同,但一些市場(chǎng)和平臺(tái)已擁有很高的滲透率,而全球10%的搜索已經(jīng)是基于語(yǔ)音的搜索。

在這一領(lǐng)域?qū)?huì)出現(xiàn)新的贏家和輸家,而現(xiàn)有品牌將需要考慮到在收購(gòu)過程中失去對(duì)消費(fèi)者對(duì)話的控制的影響,這加大了在競(jìng)爭(zhēng)中脫穎而出的難度。

然而,語(yǔ)音界面為各品牌提供了前所未有的機(jī)會(huì),讓它們能以一種極為強(qiáng)大的新方式與消費(fèi)者進(jìn)行互動(dòng),而目前來說,很少有品牌利用到了這一點(diǎn)。

當(dāng)前廣泛使用的功能在范圍和用途上均受到限制。就開發(fā)創(chuàng)新的內(nèi)容和體驗(yàn),以及全新的服務(wù)來說,現(xiàn)下各品牌仍有機(jī)會(huì)。

那些能在此情景下崛起的品牌,在提升市場(chǎng)份額方面處于有利地位。此外,市面上有許多工具,讓用戶可以用最低限額的投資來輕松地進(jìn)行語(yǔ)音實(shí)驗(yàn)。

我們的建議是盡快開始一項(xiàng)服務(wù)設(shè)計(jì)和聲音試驗(yàn)的低投資計(jì)劃,可能還要與市場(chǎng)推廣活動(dòng)相結(jié)合,以便讓你的品牌充分利用這項(xiàng)技術(shù)所帶來的機(jī)遇。

我們所說的“語(yǔ)音”是什么意思?

在本文的語(yǔ)境中,我們對(duì)“語(yǔ)音”的定義是自動(dòng)化的語(yǔ)音服務(wù)。它涵蓋了從交互式文字到實(shí)用工具內(nèi)的所有信息,內(nèi)置于定制的硬件設(shè)備,以及手機(jī)和云端應(yīng)用內(nèi)的各種應(yīng)用,可通過品牌產(chǎn)品或人工智能行業(yè)內(nèi)的幾大公司的虛擬助手來進(jìn)行訪問。

很多關(guān)于基于語(yǔ)音的技術(shù)的宣傳都圍繞著智能音箱的普及(75%的美國(guó)家庭預(yù)計(jì)在2020年均擁有智能音箱),以及音響附帶的“語(yǔ)音助手”?,F(xiàn)在已有幾個(gè)公司允許第三方直接整合旗下的智能助理,有點(diǎn)像智能手機(jī)上的應(yīng)用。

此外,需要注意的是,不論是上文提及的還是其他語(yǔ)音助手也可以在其他硬件(通常是手機(jī)和平板電腦)上使用,人們可通過手機(jī)應(yīng)用和深度操作系統(tǒng)集成來使用,但也可以通過定制硬件設(shè)備,甚至是網(wǎng)站來使用語(yǔ)音助手。

從許多方面來看,語(yǔ)音和機(jī)器人背后的技術(shù)都是一樣的,但二者之間在生態(tài)系統(tǒng)和影響這兩方面的差異足以使語(yǔ)音技術(shù)成為一個(gè)非常重要的領(lǐng)域。

語(yǔ)音簡(jiǎn)史

基于語(yǔ)音的交互界面已經(jīng)存在了幾十年,盡管它們最具影響力的方面一直是客戶服務(wù)電話。大多數(shù)與語(yǔ)音相關(guān)的系統(tǒng)都遭遇了各種各樣的問題,從語(yǔ)音識(shí)別到復(fù)雜的生態(tài)系統(tǒng)。

五年前,行業(yè)領(lǐng)先的語(yǔ)音識(shí)別技術(shù)的準(zhǔn)確率僅為75%左右,機(jī)器學(xué)習(xí)技術(shù)、系統(tǒng)和硬件的最新發(fā)展,使得最好的語(yǔ)音識(shí)別系統(tǒng)的準(zhǔn)確率提高到了95%到97%。

不斷接近并跨過這一認(rèn)知門檻成了當(dāng)前語(yǔ)音產(chǎn)業(yè)繁榮的最大因素。人類識(shí)別口語(yǔ)詞匯的準(zhǔn)確率約95%,并能使用語(yǔ)境來糾正錯(cuò)誤。對(duì)于大多數(shù)用戶來說,任何具有較低識(shí)別準(zhǔn)確率的自動(dòng)化系統(tǒng)都會(huì)讓他們失望,因此這在商業(yè)上并不可行。

機(jī)器學(xué)習(xí)在意圖推導(dǎo)方面的相關(guān)發(fā)展(后文另作解釋),這也是產(chǎn)業(yè)繁榮的一個(gè)巨大貢獻(xiàn)因素。幾年前,這一功能的商業(yè)系統(tǒng)已經(jīng)跨過了類似的門檻,并推動(dòng)了機(jī)器人產(chǎn)業(yè)的繁榮;語(yǔ)音其實(shí)就是無文字版本的機(jī)器人。

機(jī)器人本身也已經(jīng)存在了幾十年,但處理自然語(yǔ)言的能力,而不是簡(jiǎn)單地識(shí)別關(guān)鍵字,才帶來了基于對(duì)話的互動(dòng),這反過來又推動(dòng)了相關(guān)平臺(tái)和服務(wù)近期的爆炸式增長(zhǎng)。

在當(dāng)前的語(yǔ)音技術(shù)領(lǐng)域,虛擬自動(dòng)化助理的崛起首屈一指。盡管Siri(以及其他一些不太知名的語(yǔ)音助理)已經(jīng)推出多年,但Alexa和谷歌助理的崛起預(yù)示著一種更廣泛的平臺(tái)方式。

這些新出爐的助手會(huì)在一系列設(shè)備上推廣整個(gè)生態(tài)系統(tǒng)和功能,Alexa可以控制你的燈光,告訴你當(dāng)天的會(huì)議是什么,并幫助你烹飪食譜上的菜品。

語(yǔ)音技術(shù)只是炒作嗎?

當(dāng)然不是。的確,人們對(duì)語(yǔ)音技術(shù)的大肆宣傳,就像之前的3D打印和其他“改變我們生活方式的技術(shù)”的過度炒作一樣,但通過語(yǔ)音界面與計(jì)算機(jī)進(jìn)行互動(dòng)的趨勢(shì)將會(huì)持續(xù)下去。

除此之外,還有一系列極具說服力的統(tǒng)計(jì)數(shù)據(jù),例如,超過20%的移動(dòng)搜索已經(jīng)是基于語(yǔ)音的搜索,并且,預(yù)計(jì)到2020年,這一比例將上升到50%?;蛟S更有趣的是,這些統(tǒng)計(jì)數(shù)據(jù)背后有一些原因也許更值得我們?nèi)ヌ接憽?/p>

在科技圈,人們經(jīng)常說,未來初次上網(wǎng)的10億人中的大部分,其受教育水平很低,還很可能是文盲,因?yàn)椤安话l(fā)達(dá)”國(guó)家的人們也開始接觸互聯(lián)網(wǎng)。對(duì)于這些群體來說,視頻和聲音或許是最重要的,而且聲音可能是他們能接觸到的唯一雙向媒介。

此外,iPad效應(yīng)還揭示出,即使是非常年幼的孩子,還握不住鼠標(biāo)時(shí)也能與觸摸屏互動(dòng),而語(yǔ)音交互甚至能更快、更直觀與孩子互動(dòng)(一旦有人可以說話),而且毫無疑問將成為幾年內(nèi)某些功能的主要交互方式。

此外,也值得考慮到這其中涉及到的風(fēng)險(xiǎn)和利益,尤其是谷歌和亞馬遜這兩家分別在廣告收入和發(fā)掘新產(chǎn)品方面最強(qiáng)大的公司。亞馬遜進(jìn)軍語(yǔ)音市場(chǎng)的舉動(dòng),已經(jīng)對(duì)谷歌的利潤(rùn)產(chǎn)生了明顯的影響,因?yàn)樗沟盟阉鳂I(yè)務(wù)走出了網(wǎng)頁(yè)和谷歌廣告的覆蓋范圍,這也解釋了為什么谷歌要努力讓旗下的谷歌助手取得成功。

為了自身利益,谷歌可以利用他們現(xiàn)有的25億臺(tái)Android設(shè)備。隨著數(shù)字的不斷增長(zhǎng),你可以理解,到2021年預(yù)計(jì)將會(huì)有75億個(gè)已安裝使用的語(yǔ)音助理。在某些方面,對(duì)隱私和安全的擔(dān)憂會(huì)慢慢地被采納,我們將在本文的后續(xù)部分對(duì)此進(jìn)行探討。

反對(duì)語(yǔ)音技術(shù)的一個(gè)常見言論是,對(duì)著設(shè)備大聲說話,尤其是在公共場(chǎng)合會(huì)讓人覺得怪異或者是尷尬(尤其是年齡大一點(diǎn)的人會(huì)這樣覺得,我們指的是20歲以上的人)。

BBH公司的觀點(diǎn)是,這些標(biāo)準(zhǔn)很快就會(huì)改變。例如,十年前,在大多數(shù)情況下,把手機(jī)放在餐桌上簡(jiǎn)直是天方夜譚,如今,這可能是一種專注的表現(xiàn)(取決于細(xì)微差別),或者在某些情況下,在吃飯時(shí)接聽電話或?qū)懚绦乓彩强梢越邮艿摹?/p>

應(yīng)用場(chǎng)景

語(yǔ)音正在迅速為產(chǎn)品和服務(wù)的技術(shù)接觸點(diǎn)的融合創(chuàng)造一個(gè)空間。從許多方面來看,這并不令人驚訝。使用我們的聲音進(jìn)行交流的速度是打字的3倍,而且說話比打字要容易得多。

盡管它帶來了一種全新的社會(huì)規(guī)范,但這是一件很簡(jiǎn)單的事情,用戶只要用30分鐘就可以輕松地享受這個(gè)全新的界面。

在某些情況下,聲音可以輕而易舉地打敗非語(yǔ)音輸入方式,比如手是濕的或者兩只手都空不出來,比如做飯和洗澡,或者眼睛只能專心干一件事時(shí),比如駕駛,還有其他一些對(duì)于我們來說需要一定程度上使用我們的雙手和眼睛的事情。在這些情況下,使用語(yǔ)音輸入顯然更加輕松。

盡管語(yǔ)音在可預(yù)見的未來不太可能完全取代文本,但它無疑會(huì)對(duì)許多與技術(shù)相關(guān)的領(lǐng)域產(chǎn)生重大影響,尤其是電子商務(wù)和搜索領(lǐng)域。

對(duì)市場(chǎng)和品牌的影響

這為各品牌和新的加入者提供了參與語(yǔ)音體驗(yàn)的機(jī)會(huì)。電子商務(wù)行業(yè)的一個(gè)全新的、廣泛使用的系統(tǒng)總是具有巨大的顛覆性,目前還無法詳細(xì)了解語(yǔ)音對(duì)品牌的影響。

首先要考慮的三大因素之一是,許多交互將完全在平臺(tái)上進(jìn)行,減少或移除了搜索營(yíng)銷的機(jī)會(huì)。其次,基于對(duì)話的互動(dòng)并不能很好地支持項(xiàng)目列表,這意味著助理們通常會(huì)推薦單件商品,而不是向用戶展示選項(xiàng)。最后,在很多情況下,整個(gè)購(gòu)買過程將會(huì)在沒有視覺刺激的情況下進(jìn)行。

所有這些因素目前都受到了廣泛關(guān)注,但可以肯定的是,這將對(duì)品牌帶來巨大的影響(特別是快速消費(fèi)品行業(yè)的品牌),尤其是當(dāng)這三大因素與其他因素相結(jié)合,如亞馬遜目前作為市場(chǎng)和自有品牌供應(yīng)商的雙重身份在電子商務(wù)業(yè)的主導(dǎo)地位。

目前正在討論的兩種有可能解決這些新挑戰(zhàn)的策略是,要么向平臺(tái)推銷,比如確保亞馬遜、谷歌等向用戶推薦你的產(chǎn)品,或試圖大幅提升品牌認(rèn)知度,讓用戶通過名字而不是產(chǎn)品類別在平臺(tái)上尋找你的產(chǎn)品。例如,英國(guó)人說“胡佛”就意味著“吸塵器”,或美國(guó)人使用“施樂(Xerox)”就是說的 “復(fù)印”。

在接下來的幾年里,許多品牌將會(huì)出現(xiàn)在語(yǔ)音平臺(tái)上。它們可以采取任何形式,從提供實(shí)用工具的服務(wù),或減輕客戶服務(wù)的負(fù)擔(dān),到通信和營(yíng)銷還有娛樂。

由于語(yǔ)音界面的會(huì)話特性、缺乏有保證的視覺效果以及在感覺溝通中語(yǔ)境所扮演的角色,很少或沒有品牌會(huì)完全依賴于語(yǔ)音。它不會(huì)取代社交、電視、印刷品和網(wǎng)絡(luò),而是成為這些平臺(tái)的補(bǔ)充因素。

同樣值得注意的是,不論哪一個(gè)品牌,都有一小部分用戶不能說話或聽到聲音,對(duì)于他們來說,只有語(yǔ)音界面無法訪問(盡管像Google Assistant這樣的平臺(tái)也有視覺界面)。

從理論上講,語(yǔ)音技術(shù)為品牌提供了一個(gè)前所未有的機(jī)會(huì),可以以一種私人的、甚至是親密的方式與消費(fèi)者建立聯(lián)系,在所有潛在的品牌接觸點(diǎn)中,沒有一個(gè)能有語(yǔ)音那樣的潛力,能大規(guī)模地與消費(fèi)者建立深厚的人際關(guān)系。

與此同時(shí),現(xiàn)有的助理平臺(tái)都給想要在某種程度上實(shí)現(xiàn)情感聯(lián)系的品牌提出了一些嚴(yán)肅的問題。

谷歌助理為各品牌提供了最為豐富的平臺(tái)機(jī)會(huì),但相比谷歌自有品牌來說依然還是有區(qū)別,而亞馬遜Alexa則對(duì)品牌有額外的限制。話雖如此,語(yǔ)音技術(shù)的確代表了一個(gè)全新的擁有一些引人注目的品牌特征的渠道,盡管其缺點(diǎn)可能代表著一個(gè)提升品牌認(rèn)知度的重要機(jī)會(huì)。

語(yǔ)音帶來的類人特征

眾所周知,人們把人類的特征分配到他們的所有互動(dòng)中,但是這種現(xiàn)象在口語(yǔ)對(duì)話中尤其明顯,這是如此,人們會(huì)對(duì)語(yǔ)音助理產(chǎn)生感情。超過三分之一的普通用戶希望自己的助手是人,四分之一的人則對(duì)自己的助理產(chǎn)生過幻想。

基于語(yǔ)音的服務(wù)首次允許品牌完全構(gòu)建代表它們的實(shí)體的特征。與選擇品牌代言人相比,這一過程的深度和廣度都是相似的,重要的是要考慮代表品牌或服務(wù)的聲音的各個(gè)方面。

設(shè)計(jì)語(yǔ)音界面時(shí)值得考慮的因素包括:(虛擬)說話者的性別、種族和年齡,以及他們的口音。也許可以有多種不同的聲音,但這就提出了一個(gè)問題,即如何選擇使用哪一種聲音。也許是通過提供的服務(wù)或者客戶來源(如果知道的話)或其他數(shù)據(jù)點(diǎn)。

另一個(gè)有趣的因素是虛擬角色與用戶和品牌的關(guān)系。語(yǔ)音助理是否像主人一樣?是一個(gè)顧問?也許是家庭成員之一?是否代表了品牌本身?或者它是以第三方的身份談?wù)撈放??在它說“我來幫你查一下”時(shí),這是否意味著你可以使用與助理本身截然不同的品牌核心服務(wù)?

當(dāng)然,還有一些技術(shù)因素需要考慮,這取決于你所創(chuàng)建的服務(wù)和它所依賴的平臺(tái),在這平臺(tái)上你也許根本不可能創(chuàng)建一個(gè)定制的語(yǔ)音,或者平臺(tái)上可能存在著對(duì)定制化可能性的限制。下文將對(duì)此進(jìn)行更詳細(xì)的探討。

在某些情況下,你甚至有可能探索更豐富的因素,比如聲音的音質(zhì)和一些“柔和”的方面,比如語(yǔ)言所帶來的溫暖。

最后,值得注意的是,語(yǔ)音機(jī)器人與單獨(dú)的用戶進(jìn)行的是雙向?qū)υ?,這些對(duì)話完全是由品牌所控制的,在對(duì)話中,沒有人會(huì)有糟糕的一天,或者感到疲憊。

語(yǔ)音服務(wù)設(shè)計(jì)

無論是基于實(shí)用性、娛樂性還是其他特征,在構(gòu)建基于語(yǔ)音的服務(wù)時(shí),一些核心因素都會(huì)發(fā)揮作用。這些因素導(dǎo)致為品牌打造全新服務(wù)的情況并不少見。顯然,重要的是要考慮到?jīng)]有屏幕對(duì)用戶體驗(yàn)產(chǎn)生的影響。

舉個(gè)例子,在一個(gè)語(yǔ)音界面上,搜索結(jié)果的列表讓人很難滿意。你可以做一個(gè)實(shí)驗(yàn),大聲讀出谷歌搜索結(jié)果的第一頁(yè)就行。這意味著,用戶體驗(yàn)往往更“受引導(dǎo)”,而較少依賴用戶去選擇,盡管也存在著很多其他的含義。

考慮到這一點(diǎn),我們也要注意到,越來越多的語(yǔ)音平臺(tái)用戶可能擁有他們和語(yǔ)音助手都能訪問的屏幕,要么是內(nèi)置在設(shè)備中(比如Echo Show),要么是通過智能手機(jī)或生態(tài)系統(tǒng)的屏幕,比如谷歌助理。雖然不能完全依賴這些屏幕,但它們可以用來豐富用戶體驗(yàn)。

另一個(gè)重要的因素是界面的對(duì)話性質(zhì),這對(duì)服務(wù)設(shè)計(jì)的細(xì)節(jié)產(chǎn)生了巨大的影響,但也可能意味著用戶可選擇有高比例內(nèi)容的選擇服務(wù),或者至少是通過決策矩陣進(jìn)行線性旅行是有意義的。此類界面往往對(duì)復(fù)雜的流程極為有利,因?yàn)樵谶@些過程中,基于屏幕的界面往往會(huì)變得混亂并讓人感到困惑。

最后,和社交一樣,周圍環(huán)境對(duì)于用戶訪問語(yǔ)音服務(wù)的方式非常重要。如果他們正在使用手機(jī)時(shí),他們可能在公共場(chǎng)所或家中,他們也許匆忙也許悠閑,所有這些都會(huì)影響到服務(wù)質(zhì)量。如果用戶通過智能音響訪問該服務(wù),他們很有可能在家,但可能會(huì)有其他人在場(chǎng),這就再次影響了服務(wù)的細(xì)節(jié)。

一般來說,非常適合于使用語(yǔ)音的服務(wù)在范圍上通常是有限的,并且只能提供給用戶很少的交互。更復(fù)雜的現(xiàn)有服務(wù)通常需要人工智能工具來進(jìn)一步簡(jiǎn)化它們的訪問過程,然后才適合使用語(yǔ)音進(jìn)行訪問。

語(yǔ)音技術(shù)優(yōu)化因素

在過去的兩三年里,隨著基礎(chǔ)技術(shù)達(dá)到了重要的臨界點(diǎn),語(yǔ)音技術(shù)的前景發(fā)生了巨大的變化。從谷歌、亞馬遜到IBM和三星,許多大型科技公司似乎都在語(yǔ)音領(lǐng)域提供了服務(wù),但它們各自提供的服務(wù)存在巨大差異。

1.設(shè)備和環(huán)境

需要指出的是,許多設(shè)備的確擁有超越語(yǔ)音功能的能力。一般來說,智能音箱只播放聲音,但當(dāng)它們?cè)谙蛴脩麸@示它們?cè)诼牶突貞?yīng)的時(shí)候也會(huì)有燈光,這也因此有助于引導(dǎo)對(duì)話。

更新后的Alexa設(shè)備,比如Echo Show和Echo Spot,現(xiàn)在可以通過內(nèi)置的屏幕和攝像頭傳送信息,而谷歌助理在智能手機(jī)上最常用的功能是,默認(rèn)情況下,屏幕會(huì)用文本來顯示對(duì)話。

在智能手機(jī)和其他一些設(shè)備上,用戶可以選擇通過文本而非語(yǔ)音來進(jìn)行整個(gè)對(duì)話,這將改變他們接收到的輸入類型,以及輸出中會(huì)出現(xiàn)的細(xì)微差別。

基于屏幕的會(huì)話界面正在快速發(fā)展,還包括交互式模塊,如列表、幻燈片、按鈕和支付界面。很快,語(yǔ)音控制助手也將可以使用附近的聯(lián)網(wǎng)電視來補(bǔ)充會(huì)話界面,不過在這里展示的內(nèi)容與智能手機(jī)界面不同。

應(yīng)該清楚的是,除了廣泛的可用功能外,影響語(yǔ)音交互的另一個(gè)主要因素是周圍環(huán)境。用戶可能是在個(gè)人設(shè)備上,也可能是在共享的公共空間中使用語(yǔ)音助理,比如廚房或辦公室,這將影響他們進(jìn)行舒適交互的方式。

2.平臺(tái)和生態(tài)系統(tǒng)

① 亞馬遜Alexa

也許最著名的英美語(yǔ)音服務(wù)是亞馬遜的Alexa,一開始可以通過Echo音箱設(shè)備來訪問,但支持訪問的亞馬遜和第三方硬件也越來越多。

亞馬遜在市場(chǎng)上擁有相當(dāng)大的先發(fā)優(yōu)勢(shì)(72%的智能音箱市場(chǎng)份額),而且這可以說是亞馬遜Echo系列設(shè)備的商業(yè)成功,這些設(shè)備所支持的其他公司提供的服務(wù)最近數(shù)量激增。

Alexa是一個(gè)面向消費(fèi)者的平臺(tái),可以讓品牌廠商創(chuàng)造消費(fèi)者可以安裝的“技能”。終端用戶可以通過一個(gè)配套應(yīng)用來配置Alexa。除此之外,用戶還可以在應(yīng)用商店中安裝來自第三方的“技能”。

一項(xiàng)安裝的技能就可以讓終端用戶向Alexa詢問一些特殊的額外問題,這些問題能顯示出該技能所提供的服務(wù),例如,“Alexa,我的銀行存款余額是多少?”

目前,在所有市場(chǎng)中,Alexa的技能數(shù)量約為2萬(wàn),2016年底這一數(shù)字還只有6000。

盡管目前許多技能的使用率極低,但亞馬遜最近推出了融資模式,以繼續(xù)激勵(lì)第三方開發(fā)者加入其生態(tài)系統(tǒng)。

據(jù)估計(jì),到2017年底,Alexa設(shè)備的銷售量大約有3200萬(wàn)臺(tái)(在第四季度時(shí)約為2000萬(wàn)),毫無疑問,這個(gè)平臺(tái)的覆蓋范圍很廣,但Alexa技能的模式和亞馬遜的整體市場(chǎng)戰(zhàn)略的結(jié)合讓各品牌方處于亞馬遜的控制之下。

② 谷歌助理(Google Assistant)

就在亞馬遜推出Echo音箱一年后,谷歌在2016年5月推出了這款Google Home設(shè)備,這款設(shè)備內(nèi)置谷歌助理。谷歌一直在積極地向消費(fèi)者和合作伙伴以及品牌推銷其谷歌助理(以及家用硬件設(shè)備)。

谷歌已經(jīng)占據(jù)了15%的智能音箱市場(chǎng)份額,是前一年的兩倍,而智能手機(jī)語(yǔ)音助理的市場(chǎng)份額為46%,預(yù)計(jì)到2022年這一比例將上升到60%。

谷歌的智能助理也在以不可思議的速度更新,新功能層出不窮,可以說,它已經(jīng)在給用戶和第三方開發(fā)者提供功能方面領(lǐng)先一步了?;蛟S最有趣的是,與其他產(chǎn)品相比,谷歌助理在品牌整合方面采取了一種有趣而不同的方式,正如Actions on Google這樣的應(yīng)用平臺(tái)。

通過這個(gè)平臺(tái),品牌不僅可以開發(fā)服務(wù),還可以開發(fā)整個(gè)會(huì)話界面,包括他們所提供服務(wù)的語(yǔ)音輸出。用戶不需要安裝第三方應(yīng)用,只要直接要求與這些應(yīng)用對(duì)話即可,就像有人會(huì)要求總機(jī)或接待員與某個(gè)特定的人通話一樣。一旦與某款應(yīng)用進(jìn)行對(duì)話,用戶就可以通過基于谷歌助理的語(yǔ)音界面使用身份驗(yàn)證、允許通知、切換設(shè)備和支付等功能。

通過將谷歌助理與Android緊密結(jié)合,這個(gè)平臺(tái)擁有巨大的潛力;目前有25億臺(tái)使用中的Android設(shè)備。該軟件也可為第三方硬件制造商使用,進(jìn)一步提升了該生態(tài)系統(tǒng)的潛力。

③ 微軟小娜(Cortana)

每一臺(tái)Windows 10設(shè)備都裝載了微軟小娜,其月活躍用戶數(shù)達(dá)到了驚人的1.45億人次(用戶可能主要是通過XBox訪問),但微軟對(duì)Cortana的推廣和更新要低于谷歌和亞馬遜對(duì)旗下產(chǎn)品的推廣和更新力度。Cortana提供了類似于Alexa的“技能”界面,但它的開發(fā)時(shí)間相對(duì)較晚,在核心功能和可用整合數(shù)量方面也尚不及Alexa。

盡管微軟小娜在智能音響設(shè)備上的份額很小,但微軟龐大的整體用戶群,以及它在與工作相關(guān)的軟件和游戲生態(tài)系統(tǒng)中占據(jù)的主導(dǎo)地位,確實(shí)讓Cortana在市場(chǎng)上擁有了強(qiáng)大(并且不斷增長(zhǎng))的存在感。

④ 百度DuerOS

百度可以說開創(chuàng)了語(yǔ)音界面的最新潮流,它結(jié)合了突破性的技術(shù)和龐大的用戶群,以及不同的文化和社會(huì)經(jīng)濟(jì)傾向,更偏向于使用語(yǔ)音技術(shù)而非文字技術(shù)。

百度最近發(fā)布了DuerOS(新一代對(duì)話式AI操作系統(tǒng)),這是一個(gè)讓第三方硬件開發(fā)者打造自己的語(yǔ)音驅(qū)動(dòng)設(shè)備的平臺(tái),通過“百度大腦”提供了一套用于各種用途的人工智能平臺(tái)(其中很多都涉及語(yǔ)音功能)。目前,大多數(shù)消費(fèi)者通過百度僅支持中文的服務(wù)與其語(yǔ)音技術(shù)進(jìn)行互動(dòng)(即沒有第三方整合)。

⑤ Siri、Bixby和Watson

蘋果的Siri和三星的Bixby都是語(yǔ)音助手,目前支持在特定設(shè)備上使用,也可以在制造商的生態(tài)系統(tǒng)中使用。這兩種語(yǔ)音助手都不能被稱為平臺(tái),因?yàn)樗鼈儾惶峁┑谌皆L問來創(chuàng)建服務(wù)。

目前,這兩個(gè)語(yǔ)音助手的市場(chǎng)份額都是有限的,因?yàn)榭芍С值氖謾C(jī)數(shù)量有限,但它們有使用門檻,且語(yǔ)音識(shí)別準(zhǔn)確率也較低,使得它們?cè)谂c其他助手的對(duì)比中顯得很有限。IBM的Watson也許是最有效的工具,可以被看作是品牌可以用來創(chuàng)建定制服務(wù)的一套工具。

3.內(nèi)容和服務(wù)

在為基于語(yǔ)音的對(duì)話界面設(shè)計(jì)服務(wù)時(shí),需要考慮很多因素;這些因素均在上文提到過,會(huì)影響可用的功能范圍。

① 效用

目前可用的大部分語(yǔ)音服務(wù)都是實(shí)用型工具,它們可以通過其他方法獲得簡(jiǎn)單的功能。既有更普通的功能(播放特定的廣播電臺(tái)或聽新聞),也有更具未來感的(在電視上調(diào)整燈光或播放特定的電影),還能訪問特定于供應(yīng)商的功能,比如點(diǎn)一份披薩或者叫一輛出租車。

許多品牌開始在這一領(lǐng)域提供服務(wù),從家庭自動(dòng)化或類似于WeMo、Plex或Philips Hue這樣的小企業(yè),到更廣泛使用的服務(wù),如Uber和Dominos,但有趣的是,這一領(lǐng)域還有提供創(chuàng)新服務(wù)的大品牌。例如,梅賽德斯和現(xiàn)代都允許用戶啟動(dòng)自己的汽車,并在不同的語(yǔ)音助理平臺(tái)上預(yù)熱汽車。

② 娛樂

各種各樣的游戲、笑話和音效庫(kù)都可以從所有的主要平臺(tái)獲得,這些平臺(tái)來自于各種各樣的提供商,這些提供商要么是平臺(tái)提供商本身(比如谷歌或亞馬遜),要么是小公司或個(gè)人開發(fā)者。不過,有少數(shù)幾個(gè)品牌開始更多地嘗試這一平臺(tái)的可能性。例如,Netflix和谷歌推出了《陌生人的伴侶》第2季,而BBC最近為Alexa制作了一段互動(dòng)小說。這一領(lǐng)域的娛樂項(xiàng)目潛力尚未得到開發(fā),只是處于初步探索階段。

③ 工具

有許多工具可以用于構(gòu)建語(yǔ)音服務(wù),以及相關(guān)的(通?;谌斯ぶ悄埽┑墓δ?。總的來說,基于云計(jì)算的服務(wù)就算不免費(fèi)也很廉價(jià),而且易于使用。一些嚴(yán)肅的項(xiàng)目可能需要人們自行開發(fā)定制解決方案,但這對(duì)于大多數(shù)需求來說都有些多余。

對(duì)所有可用工具的完整介紹不在本文涵蓋的范圍之內(nèi),但值得注意的工具有IBM的Watson Services、谷歌的Speech API和DialogFlow,以及微軟的認(rèn)知服務(wù)(Cognitive Services)。

所有這些都意味著,原型設(shè)計(jì)和實(shí)驗(yàn)可以快速、低成本地完成,而生產(chǎn)就緒的應(yīng)用程序也可以在一個(gè)使用模型上進(jìn)行成本估價(jià),這種模式在小范圍內(nèi)是非常劃算的。

④ 語(yǔ)言合成

有關(guān)于各品牌尤其值得注意的是,其圍繞語(yǔ)音合成的選擇,因?yàn)檫@些都是終端用戶與之互動(dòng)的品牌的一部分。如果提供的服務(wù)有一個(gè)靜態(tài)的、有限的、針對(duì)所有用戶輸入的可能響應(yīng),那么就有可能使用錄制好的語(yǔ)音。在某些情況下,這種方法可以進(jìn)行擴(kuò)展,與記錄并剪切結(jié)合的方法一同使用。

對(duì)于擁有廣泛輸出的服務(wù),生成的聲音是唯一可行的方法,但即使是這種情況,也有多種選擇。有很多免費(fèi)的、或多或少的“計(jì)算機(jī)”聲音可供使用,但我們建議探索其他的方法去創(chuàng)建像衛(wèi)星導(dǎo)航一樣的語(yǔ)音合成系統(tǒng)。

機(jī)器學(xué)習(xí)技術(shù)的快速發(fā)展,讓生成的語(yǔ)音聽起來非常真實(shí),甚至像真人一樣,這值得關(guān)注。這一技術(shù)目前還沒有普及,但谷歌已經(jīng)在美國(guó)使用Wavenet來輔助谷歌助理,而Adobe也正在開發(fā)一個(gè)類似的項(xiàng)目。

語(yǔ)音背后的技術(shù)

人們所說的“聲音”其實(shí)是一套不同的技術(shù),它們需要一同運(yùn)作。值得注意的是,Speech To Text是處理一些音頻和輸出文本的“語(yǔ)音識(shí)別”組件。

近年來,這一領(lǐng)域取得了巨大的進(jìn)步,以至于一些系統(tǒng)在不同的條件下比人類更擅長(zhǎng)于語(yǔ)音識(shí)別。據(jù)報(bào)道,今年6月,谷歌系統(tǒng)的準(zhǔn)確率達(dá)到了95%(與人類相同,比4年的準(zhǔn)確率上升了20%),而百度則被認(rèn)為擁有語(yǔ)音識(shí)別最準(zhǔn)確的系統(tǒng),其準(zhǔn)確率在97%以上。

每個(gè)特定服務(wù)的核心都是意圖推導(dǎo),一組基于計(jì)算出一條文本暗示潛在用戶意圖的技術(shù)集合,這將用戶請(qǐng)求與該服務(wù)能夠提供的響應(yīng)相匹配。

機(jī)器人和機(jī)器人平臺(tái)的數(shù)量最近的增長(zhǎng)(和炒作)與這項(xiàng)技術(shù)有關(guān),而且?guī)缀跛械恼Z(yǔ)音系統(tǒng)都是加入語(yǔ)音識(shí)別的機(jī)器人,這項(xiàng)技術(shù)至關(guān)重要。有許多平臺(tái)提供了這種功能(尤其是IBM Watson,以及免費(fèi)的DialogFlow)。

另一套重要的語(yǔ)音相關(guān)技術(shù)是語(yǔ)音合成。實(shí)現(xiàn)這一目標(biāo)的方法有很多,而且這些選項(xiàng)與特定語(yǔ)音服務(wù)的功能密切相關(guān)。本文前面已經(jīng)探討了與此相關(guān)的工具和選擇,但是它們的成本和質(zhì)量都存在著巨大差別,因?yàn)榛诜?wù)的范圍和可以提供給用戶的輸出類型存著著差異。

隱私問題

與其他數(shù)字服務(wù)相比,創(chuàng)建語(yǔ)音優(yōu)先服務(wù)需要多加考慮。首先也是最重要的一點(diǎn)是,用戶的隱私受到越來越多的關(guān)注,因?yàn)橛脩舻囊纛l記錄被發(fā)送并經(jīng)常存儲(chǔ)在平臺(tái)和/或品牌那里。

根據(jù)對(duì)用戶提供服務(wù)的方式,這可能只是一個(gè)涉及平臺(tái)的問題,也可能是該品牌需要直接解決的問題。

最近,C4 Show《名人搜索》引發(fā)了對(duì)Alexa的強(qiáng)烈抵制,因?yàn)橛脩魝冎苯涌吹搅舜鎯?chǔ)的錄音有被泄露的危險(xiǎn)。也有人擔(dān)心錄音具有的“永遠(yuǎn)”的存儲(chǔ)能力,盡管主要的平臺(tái)一再試圖向用戶保證,只有從關(guān)鍵字開始的短語(yǔ)才會(huì)被記錄下來并被發(fā)送到云端。然而,就像大多數(shù)事情一樣,合理的價(jià)值交換是最安全的方式。從本質(zhì)上講,應(yīng)當(dāng)確保產(chǎn)品的實(shí)用性或娛樂性。

本文前面提到的另一個(gè)注意事項(xiàng)是,可能你的品牌暫未提供語(yǔ)音優(yōu)先界面的正確服務(wù),或者至少是服務(wù)可能需要進(jìn)行改動(dòng)以完全適合這種格式。我們?cè)谘杏憰?huì)上發(fā)現(xiàn),品牌語(yǔ)音服務(wù)最有趣的用例往往需要向全新領(lǐng)域擴(kuò)展?;蛟S最有趣的是,這個(gè)領(lǐng)域允許收集關(guān)于使用該服務(wù)的用戶的一整套全新的有趣的數(shù)據(jù),除了實(shí)際的音頻記錄,新環(huán)境中使用的新服務(wù)應(yīng)該會(huì)帶來有意思的新想法。

對(duì)品牌的建議

我們相信,從長(zhǎng)遠(yuǎn)來看,許多品牌將受益于通過語(yǔ)音界面提供部分或全部的核心數(shù)字服務(wù),而且最近的技術(shù)擴(kuò)散在中短期內(nèi)創(chuàng)造了機(jī)會(huì)。

一個(gè)很好的起點(diǎn)是開始將語(yǔ)音平臺(tái)加入到數(shù)字服務(wù)的長(zhǎng)期規(guī)劃中。理想情況下,品牌應(yīng)該從長(zhǎng)遠(yuǎn)角度規(guī)劃整體的語(yǔ)音(或語(yǔ)言助理,包括機(jī)器人)策略。這將包括哪些服務(wù)最適合這些不同類型的媒體,以及它們?nèi)绾闻c客戶服務(wù)、客戶關(guān)系管理、社交和廣告功能互動(dòng),以及衡量工作進(jìn)展的路線圖。

短期來看,我們認(rèn)為品牌應(yīng)該進(jìn)行試驗(yàn),用現(xiàn)成的工具快速制作原型產(chǎn)品,甚至創(chuàng)造出短期的產(chǎn)品,或許還要與營(yíng)銷活動(dòng)相結(jié)合。重點(diǎn)關(guān)注這些試驗(yàn)的關(guān)鍵領(lǐng)域應(yīng)該是,整體品牌風(fēng)格、語(yǔ)調(diào)和客戶服務(wù)腳本如何轉(zhuǎn)化為語(yǔ)音角色,以及用戶如何應(yīng)對(duì)這種角色的變化。

這種試驗(yàn)可以結(jié)合使用輕量級(jí)的語(yǔ)音優(yōu)先服務(wù)設(shè)計(jì)來服務(wù)于營(yíng)銷活動(dòng),但也能用于建立一套完整的指導(dǎo)和學(xué)習(xí)工具,為未來的核心品牌服務(wù)所使用。

 

選自:medium;編譯:網(wǎng)易智能;參與:Rosie

來源:微信公眾號(hào):網(wǎng)易智能(ID:smartman163)

本文由 @網(wǎng)易智能 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!