機(jī)器學(xué)習(xí)算法生成的界面,真的能被用戶理解嗎?
機(jī)器學(xué)習(xí)算法可以基于用戶信息和行為數(shù)據(jù),為用戶推薦感興趣的內(nèi)容,但是當(dāng)這些內(nèi)容被展示到界面上時(shí),用戶真的能夠理解嗎?
一個(gè)基于機(jī)器學(xué)習(xí)的人機(jī)交互研究表明:在使用由機(jī)器學(xué)習(xí)算法所驅(qū)動(dòng)的應(yīng)用界面中,用戶在操作時(shí)會(huì)有一定的使用困難,并且只能形成較弱的心智模型。(譯者注:用戶通常無法理解自己的使用行為,與應(yīng)用內(nèi)所呈現(xiàn)的內(nèi)容推薦結(jié)果有什么關(guān)聯(lián)。)
我們正處于信息大爆炸的時(shí)代,對信息的跟蹤捕捉和人工整理歸納變得越來越難。但幸運(yùn)的是,現(xiàn)代數(shù)據(jù)科學(xué)可以對龐大的數(shù)據(jù)和信息進(jìn)行歸類整理,在界面上直接展示與我們相關(guān)的內(nèi)容(例如網(wǎng)易云音樂推薦歌單)。
機(jī)器學(xué)習(xí)算法可以基于用戶信息和行為數(shù)據(jù),為用戶推薦感興趣的內(nèi)容。如今,機(jī)器學(xué)習(xí)技術(shù)能更多地被開發(fā)者利用,這推動(dòng)了大批的公司利用大數(shù)據(jù)算法去改善產(chǎn)品和提升用戶體驗(yàn)。
利用人工智能去提升用戶體驗(yàn)的3個(gè)典型例子有:
1. 內(nèi)容推薦:(例:為用戶推薦潛在感興趣的電影/商品)
2. 廣告或內(nèi)容(如新聞?lì)^條)的選擇性展示:根據(jù)用戶需求提供定制化的折扣和優(yōu)惠信息。(如用戶最近有搜索過汽車購買內(nèi)容,推送給用戶的可能是與汽車購買折扣相關(guān)的廣告)
3. 定制個(gè)性化捷徑,用戶可以一鍵觸發(fā)下一步的操作
遺憾的是,這一系列的算法對用戶通常是不可見的:用戶在操作過程中,無法感知自己的哪些行為會(huì)被定義為“影響算法的行為”。并且算法的產(chǎn)出通常很難以理解。
由算法所提供的內(nèi)容建議或推薦有可能命中用戶需求,有可能表面上看起來是隨機(jī)的,甚至有可能是毫無意義的。通常的情況是,這些算法對展示內(nèi)容的分類標(biāo)準(zhǔn)是不可見的,它們會(huì)把展示內(nèi)容按照特定的、并不互斥的分類進(jìn)行分組。
雖然從算法角度出發(fā),這樣的內(nèi)容展示/推薦機(jī)制是有意義的,但是用戶通常很難理解推薦內(nèi)容的邏輯,而且還可能會(huì)與傳統(tǒng)的內(nèi)容構(gòu)建方式產(chǎn)生沖突。
在本文中,我們會(huì)探討 Facebook,Instagram,Google news,Netflix 用戶以及 Uber 司機(jī)與機(jī)器學(xué)習(xí)人機(jī)交互過程中遇到的一些問題。我們所采用持續(xù)一周的日記研究方式,在研究中,14 位真實(shí)用戶會(huì)用 v-log 的形式記錄下他們的人機(jī)交互過程。
黑盒模型
若想與任何系統(tǒng)進(jìn)行順暢的人機(jī)交互,用戶必須對該系統(tǒng)建立一個(gè)心智模型。
大部分人都不是軟件工程師,對軟件程序的執(zhí)行過程都沒有清晰的概念。但是人們通常都能根據(jù)他們之前對應(yīng)用程序、用戶界面甚至是對世界的認(rèn)知去形成一個(gè)相對正確的心智模型。
在很多情況下,測試者將一個(gè)新的系統(tǒng)當(dāng)成黑盒,并且會(huì)通過改變測試過程中所有潛在的輸入方式(如:瀏覽的內(nèi)容或?yàn)g覽的路徑)去改變系統(tǒng)的產(chǎn)出。
機(jī)器學(xué)習(xí)算法對于用戶來說就是一種黑盒系統(tǒng)。參與調(diào)研的用戶可以理解:機(jī)器學(xué)習(xí)算法會(huì)將他們的交互行為作為產(chǎn)出內(nèi)容的判斷依據(jù)。
為了與算法進(jìn)行順暢的人機(jī)交互,用戶必須形成一個(gè)對人機(jī)學(xué)習(xí)機(jī)制有足夠認(rèn)知的心智模型,通過這個(gè)心智模型,用戶需要理解機(jī)器學(xué)習(xí)算法是如何去改變產(chǎn)出結(jié)果,從而滿足用戶需求的。在形成這個(gè)心智模型的過程中通常會(huì)出現(xiàn)兩種阻礙:
1. 不明確的用戶輸入:用戶的何種行為會(huì)對產(chǎn)出造成影響并不明確。
2. 對產(chǎn)出缺乏控制:即使用戶知道他們的何種行為會(huì)被算法判定為有效的輸入,用戶依然無法確定這些輸入對產(chǎn)生所需結(jié)果是否有效。
我們將對以上的原因進(jìn)行分類探討:
不明確的用戶輸入
對輸入行為若沒有一個(gè)明確的認(rèn)知或判斷,將很難在黑盒實(shí)驗(yàn)里構(gòu)建一個(gè)準(zhǔn)確的用戶心智模型。導(dǎo)致用戶輸入行為不明確的原因包括
1. 算法對于用戶來說是不透明的:算法無法告訴用戶,在他們的人機(jī)交互過程中,哪些行為是重要行為,會(huì)對算法構(gòu)成影響。用戶對于“潛在輸入行為”的定義了解不充分。用戶的行為不會(huì)僅僅局限于當(dāng)前的應(yīng)用,這些“潛在的輸入行為”也包括在操作過程中的其他行為數(shù)據(jù)(如:閱讀第三方網(wǎng)站)。
2. 用戶輸入行為與界面呈現(xiàn)的結(jié)果存在時(shí)間延遲:用戶的某些輸入行為不會(huì)直接影響界面上輸出結(jié)果的變化。
在我們所討論的機(jī)器學(xué)習(xí)系統(tǒng)中,Netflix 很好地幫助用戶去了解他們的何種行為會(huì)對 app 的推薦系統(tǒng)有影響。Netflix 的主頁通常是一長串的影片信息流,這些信息流列表會(huì)有相應(yīng)的標(biāo)簽解釋為什么這條信息會(huì)出現(xiàn)在用戶的首頁——因?yàn)槟阍^看過相關(guān)的內(nèi)容/因?yàn)槟阍砑舆^某些內(nèi)容到你的播放列表等等。
(譯者注:補(bǔ)充閱讀Netflix相關(guān)介紹)
Netflix 的用戶推薦系統(tǒng)中會(huì)對推薦原因作解釋,告訴用戶他們的某種操作導(dǎo)致了現(xiàn)在的推薦結(jié)果
人們非常喜歡這類型的推薦,不僅僅是用戶感覺到對 App 內(nèi)容的控制權(quán),更重要的是,他們認(rèn)為當(dāng)前頁面所展示的內(nèi)容對于他們來說是有用的。
即便是這樣, Netflix 在幫助用戶去了解用戶的操作行為與首頁的推薦內(nèi)容之間的關(guān)聯(lián)性仍無法做到最好,因?yàn)?用戶當(dāng)前的操作行為 并不會(huì)立刻直觀地影響App的推薦內(nèi)容。
舉個(gè)例子,一個(gè)用戶在最近一次使用 Netflix 的時(shí)候觀看了單口相聲,但是她“最佳推薦”里的播放列表似乎沒有出現(xiàn)這個(gè)內(nèi)容相關(guān)的信息。這時(shí)候的用戶可能會(huì)很疑惑:“我以為‘最佳推薦’里的內(nèi)容會(huì)根據(jù)我曾經(jīng)的觀看記錄而有所改變,但是看來兩者似乎并沒有太大的關(guān)系,我的‘最佳推薦’列表里并沒有出現(xiàn)很多相關(guān)的喜劇”。
一個(gè) Facebook 用戶曾把他的首頁信息流的一個(gè)廣告關(guān)閉,但是在接下來的信息流里卻再次看到了這個(gè)廣告。另外一些用戶認(rèn)為“最佳推薦”里的內(nèi)容和自己播放列表里的內(nèi)容重合度非常高,他們也會(huì)疑惑:“我不知道‘最佳推薦’里的內(nèi)容是怎樣進(jìn)行篩選的,我相信內(nèi)容篩選的算法和我曾經(jīng)的觀看行為會(huì)有一定的關(guān)聯(lián)。但無論怎樣我希望這個(gè)算法能更精準(zhǔn)一些,因?yàn)槔锩嫱扑]的內(nèi)容要么有一些是我很久之前已經(jīng)看過的,要么是我已經(jīng)添加到播放列表的,要么就是我根本不感興趣的。所以我有時(shí)候也很奇怪為什么會(huì)推薦這些內(nèi)容給我?”
Facebook 與 Instagram 的用戶會(huì)更難理解他們的何種行為會(huì)對自己首頁的信息流內(nèi)容造成影響。用戶會(huì)認(rèn)為,信息流中自己曾經(jīng)參與過互動(dòng)的內(nèi)容(互動(dòng)包括:點(diǎn)贊等相關(guān)操作),會(huì)成為機(jī)器學(xué)習(xí)算法展示信息流內(nèi)容的參考。但一些關(guān)于“潛在輸入行為”的定義很明顯是牽強(qiáng)的,有時(shí)甚至是錯(cuò)誤的。(譯者注:有些用戶會(huì)誤以為自己現(xiàn)實(shí)生活中的聊天內(nèi)容也會(huì)被應(yīng)用監(jiān)控,成為 “潛在輸入行為”。)
這也意味著,對于大部分用戶來說,機(jī)器學(xué)習(xí)算法的邏輯關(guān)系并不清晰明確。舉個(gè)例子,一個(gè)用戶昨天和朋友聊到忽然很想吃越南粉,這是一樣平常他很少吃的東西。然后不久后,他就看到了一個(gè)越南粉春卷的廣告?!斑@是一件多么有趣又可怕的事情!”這個(gè)用戶說“我很懷疑這些應(yīng)用是不是甚至竊取了我們的聊天內(nèi)容?!?/p>
另一個(gè)剛從再應(yīng)用里看到夏威夷航空廣告的用戶,半認(rèn)真半開玩笑地說:“或者算法也知道我需要一個(gè)假期?!?/p>
另一個(gè)懷孕的媽媽也表示:“自從我懷孕之后,我看到的廣告都是關(guān)于懷孕,嬰兒用品或者是人壽保險(xiǎn)相關(guān)的?!?/p>
從上面的例子我們可以看出,當(dāng)機(jī)器學(xué)習(xí)算法對于用戶“潛在輸入行為”沒有明確公開的定義時(shí),用戶會(huì)產(chǎn)生相當(dāng)多的疑惑——他們會(huì)假設(shè)自己的所有行為(包括應(yīng)用內(nèi)的操作和現(xiàn)實(shí)世界中的行為)都會(huì)被機(jī)器學(xué)習(xí)算法所記錄并作為參考,最終他們會(huì)認(rèn)為這些 APP 或操作系統(tǒng)非?!翱膳隆辈?huì)侵犯日常生活的隱私。用戶對自己隱私被侵犯的感知越來越明顯,尤其是被Goolge、Facebook等公司掌握了大量的用戶數(shù)據(jù)的情況下。
Google 新聞的用戶通常會(huì)為其高度定制化的信息流而感到愉悅,但他們?nèi)匀徊磺宄@個(gè)高度定制化的信息流來源于他們?nèi)粘5哪男┎僮餍袨椤R粋€(gè)參與實(shí)驗(yàn)的用戶表示:“Google News 似乎在迎合我的興趣——在信息流中我能看到三篇與汽車相關(guān)的文章,而汽車正是我感興趣的主題。我對“為你推薦”這個(gè)頁面上的內(nèi)容是如何產(chǎn)生的非常感興趣。它會(huì)為我推薦本地的消息,因此很明顯它能獲取到我的地理位置信息,地理位置信息對于內(nèi)容的篩選非常有用?!?/p>
雖然 Uber 本身不需要對信息進(jìn)行推薦,但據(jù)說它同樣使用了機(jī)器學(xué)習(xí)去預(yù)測用戶的需求,并以高峰溢價(jià)、推廣活動(dòng)、游戲化的任務(wù)系統(tǒng)* 等手段去激勵(lì)司機(jī)。
(譯者注:Uber開發(fā)了一套硅谷稱之為“Gamification”游戲化的策略。最主要的體現(xiàn)就是搭建“任務(wù)系統(tǒng)”。比如在某高峰時(shí)段完成5單,可以額外獲得100美金,每周完成100單可以額外再獲得1000美金等等,就和打游戲做任務(wù)一樣。補(bǔ)充閱讀Uber 相關(guān)閱讀?游戲化任務(wù)系統(tǒng)相關(guān)解釋)
Uber 的算法并不是基于司機(jī)的行為,相反,Uber 算法中的“輸入”更多的是來源于外部的數(shù)據(jù),例如歷史交通路況。即便是在這種情況下,對于哪些數(shù)據(jù)能被定義為“輸入”的清晰認(rèn)知,依舊會(huì)影響司機(jī)是否會(huì)被 Uber 的促銷手段影響自己的判斷。舉個(gè)例子,一個(gè)司機(jī)被 Uber 告知,他需要去接一個(gè)位于 2.3 英里以外的乘客,這段路程行駛時(shí)長為 15 分鐘,并且這一單乘客有可能會(huì)溢價(jià)支付。
這位司機(jī)表示:“Uber 的這個(gè)新的預(yù)測功能有時(shí)候挺讓人惱怒的。以前我一般接到的單都是只需要 5 分鐘左右的車程就可以接到乘客,但現(xiàn)在 Uber 告訴我,這個(gè)接乘客需要 15 分鐘車程的單子很有可能會(huì)得到溢價(jià)獎(jiǎng)勵(lì)。我曾經(jīng)試過接到這樣的單子,但是乘客并沒有溢價(jià)支付。我認(rèn)為這個(gè)只是 Uber 引誘司機(jī)免費(fèi)地去接遠(yuǎn)距離乘客的單子的一種手段。我并不喜歡這種不確定的溢價(jià)支付?!睂τ谒緳C(jī)來說,他們對為什么溢價(jià)支付會(huì)出現(xiàn)以及它出現(xiàn)的前提條件并不了解,這會(huì)令他們?nèi)ベ|(zhì)疑 Uber 的意圖。
對算法的產(chǎn)出結(jié)果缺乏控制
在我們所研究的系統(tǒng)中,產(chǎn)出結(jié)果往往不僅僅以用戶的交互行為為決定因素,還會(huì)根據(jù)一些外部事件去進(jìn)行調(diào)整,這些外部事件包括:當(dāng)前時(shí)刻應(yīng)用內(nèi)其他人的發(fā)帖內(nèi)容,新聞事件,最新電影的上演,甚至有可能是交通情況等等。這些大批量、廣范圍的數(shù)據(jù)會(huì)令整個(gè)算法變得更復(fù)雜,更難以理解和控制。同時(shí),將用戶自身的行為數(shù)據(jù)與這些第三方的數(shù)據(jù)分離開來也會(huì)變得更困難。
當(dāng)應(yīng)用內(nèi)同系列的信息展示是取決于某個(gè)特定的自動(dòng)預(yù)測算法時(shí),這一系列的信息的展示順序甚至是這一系列信息最終是否會(huì)被完全展示都會(huì)取決于一個(gè)相關(guān)性衡量指標(biāo):高相關(guān)性的信息會(huì)被優(yōu)先展示,接下來展示的會(huì)是相關(guān)性稍低的信息。當(dāng)某條信息的相關(guān)性低于某一個(gè)臨界值時(shí),它甚至有可能根本不會(huì)被展示出來。(Netflix 曾經(jīng)公開展示過一個(gè)帶有明確匹配分值的相關(guān)性衡量指標(biāo),但這個(gè)指標(biāo)對用戶來說并沒有直接的利益關(guān)系,本次調(diào)研中的參與者完全忽略了這個(gè)匹配分值。)
雖然有些人認(rèn)為一個(gè)好的相關(guān)性衡量指標(biāo)不會(huì)將重要信息安排在列表中較后的位置,然而事實(shí)是,這些系統(tǒng)只能收集到用戶很碎片化的信息。這些用戶是復(fù)雜的個(gè)體,他們的需求不僅僅是基于過去的使用習(xí)慣,更可能是基于當(dāng)前的內(nèi)容甚至是當(dāng)下的心情。(舉個(gè)例子,其中一個(gè)參與調(diào)研的用戶表示:“我希望我可以隱藏我 Facebook 首頁上所有帶有悲傷情緒的帖子?!贝送?,一些帖子與用戶的興趣可能有著強(qiáng)相關(guān)性,但是出現(xiàn)的頻率非常低,因此系統(tǒng)無法收集到足夠多的信息去判斷這些信息與用戶興趣的關(guān)聯(lián)性。)所以,即使是一個(gè)好的相關(guān)性衡量系統(tǒng)也有可能無法準(zhǔn)確地預(yù)測信息與用戶興趣的相關(guān)性,至少偶爾也會(huì)出現(xiàn)這種情況。
一個(gè)不完善的相關(guān)性衡量系統(tǒng)會(huì)引發(fā)以下的一些問題:
1. 用戶一些感興趣的信息會(huì)被遺漏(在信息檢索的層面上,這會(huì)被視作低召回率)
若信息流自動(dòng)過濾掉一些與用戶高相關(guān)性的信息,用戶在閱讀信息時(shí)會(huì)花費(fèi)很高的成本。在 Facebook 和 Instagram 之類的應(yīng)用內(nèi),當(dāng)用戶錯(cuò)過了一條他最親密的好友的信息,這會(huì)對用戶造成很大的困擾并帶來較差的用戶體驗(yàn)。
事實(shí)上,會(huì)給參與調(diào)研的用戶帶來很糟糕的體驗(yàn)的主要原因是,這些應(yīng)用內(nèi)的信息流若只包含帖子中的部分內(nèi)容而過濾掉其他內(nèi)容。其中一位參與者表示:“為了看到我希望看到的某些用戶所發(fā)的帖子,我甚至需要和應(yīng)用內(nèi)的算法作斗爭。”
用戶試圖通過 自己對該系統(tǒng)的理解而建立起的心智模型去引導(dǎo)算法(雖然用戶對系統(tǒng)的理解往往可能是不正確的或是碎片化的。一些用戶會(huì)通過對信息流里他所有感興趣的內(nèi)容進(jìn)行點(diǎn)贊,試圖引導(dǎo)算法去了解自己的興趣并不再過濾掉相關(guān)的信息。在這種情況下,“點(diǎn)贊”的含義已經(jīng)不僅僅是它字面所表達(dá)出來的社交層面的意思(“點(diǎn)贊”通常用于表達(dá)對某種內(nèi)容或帖子的欣賞),而開始變成用戶試圖控制算法的一種手段。
即使是一些自認(rèn)為自己可以操縱算法的人也很經(jīng)常會(huì)懷疑這種行為的有效性。他們會(huì)不斷地直接訪問自己所感興趣的用戶或組織的主頁信息流以確保自己不會(huì)錯(cuò)過任何信息。
但過濾掉一些和用戶高相關(guān)性的信息亦不盡然會(huì)為用戶帶來高的閱讀成本。例如,在 Netflix 和 Spotify 之類的平臺,用戶可能感興趣的新聞信息/歌曲成千上萬,過濾掉這其中的一些信息并不一定會(huì)引發(fā)用戶的抱怨。(譯者注:因?yàn)橛脩魺o法感知到自己感興趣的信息被過濾掉了)
2. 信息流展示的內(nèi)容順序是不可預(yù)知的/難以理解的
信息流過濾掉一些用戶感興趣的消息不僅僅是因?yàn)?算法并沒將其息包含在內(nèi)容列表內(nèi),也有可能是因?yàn)檫@些信息的權(quán)重并不高,因此沒有出現(xiàn)在信息流的頭部位置。歸根結(jié)底,這種考慮與“注意力經(jīng)濟(jì)*”有關(guān)(譯者注:注意力經(jīng)濟(jì)是指企業(yè)最大限度地吸引用戶或消費(fèi)者的注意力,通過培養(yǎng)潛在的消費(fèi)群體,以期獲得最大未來商業(yè)利益的一種特殊的經(jīng)濟(jì)模式。) :如果用戶對新聞或社交媒體的注意力有限,那么用戶可能會(huì)遺漏掉一些對他們很重要的信息內(nèi)容,因?yàn)檫@些內(nèi)容在信息流的列表里處于較尾部的位置。(譯者注:信息量太大,而用戶對信息閱讀的精力有限,往往只會(huì)閱讀到頭部的內(nèi)容。)
對于一些我們所看到的信息推薦系統(tǒng),推薦列表的順序?qū)τ谟脩魜碚f是毫無意義的:用戶無法理解為什么在 Facebook 的信息流里,某一條內(nèi)容會(huì)排列在另一條內(nèi)容的前面。也并不知道為什么在 Netflix 的輪播模塊里,某一部電影會(huì)展示在另一部電影之前。Facebook,Instagram 和 Google News 經(jīng)常受到的用戶投訴的其中一項(xiàng)內(nèi)容就是:用戶抱怨信息流展示的內(nèi)容不是按時(shí)間順序排列的(譯者注:新版的微博信息流同樣不是以時(shí)間線順序展示的)。因此,用戶無法確保他們已經(jīng)完全地閱讀完某個(gè)用戶的所有信息并且沒有無遺漏掉其它內(nèi)容。同樣地,對于新聞內(nèi)容,這次調(diào)研中的參與者會(huì)擔(dān)心,一些他們感興趣的但是并不太重要的信息內(nèi)容(例如汽車相關(guān)的文章)會(huì)位于信息流中的頭部位置,因此他們會(huì)遺漏掉一些最近一般感興趣但可能重要的內(nèi)容。
在 Netflix 的情況里,根據(jù)特定的分類方法(如:因?yàn)槟阍?jīng)看過某些電影內(nèi)容)而構(gòu)成的推薦列表會(huì)模糊了用戶對之前已經(jīng)形成的自然分類的方法的認(rèn)知(如:按時(shí)間排序)。例如,對于視頻內(nèi)容,用戶普遍關(guān)注的維度是時(shí)間(如:用戶知道自己只有一小時(shí)的時(shí)間去觀看視頻)或者是視頻內(nèi)容的種類。然而,在 Netflix 創(chuàng)建的類別中,電視節(jié)目與完整長度的電影被混雜在一起,且被以無明確標(biāo)識的順序呈現(xiàn)在用戶面前,用戶的篩選過程會(huì)非常困難。
3. 一些用戶并不太感興趣的內(nèi)容會(huì)被推薦給用戶(在信息檢索的范疇內(nèi),這被定義為信息匹配精度低)
糟糕的推薦體系會(huì)對花費(fèi)用戶巨大的注意力成本——用戶必須仔細(xì)檢查信息,判斷他們?yōu)椴幌嚓P(guān)內(nèi)容,再跳過他們。然而,糟糕的推薦算法在不同的系統(tǒng)下并不一定會(huì)對用戶造成相同的影響。在 Netflix 這種平鋪輪播的列表布局下,不敢興趣的推薦內(nèi)容相對會(huì)更容易被跳過,因?yàn)檫@些不敢興趣的內(nèi)容并不會(huì)占用頁面內(nèi)太多的位置,用戶可以輕易地略過它。
Netflix: 推薦列表單個(gè)內(nèi)容占用頁面空間較少,用戶可以很容易地跳過
但是,在諸如 Spotify 或者 StichFix(服裝運(yùn)輸服務(wù)平臺)等平臺上,用戶略過一個(gè)不敢興趣的推薦成本會(huì)變得很高。用戶不愿意花費(fèi)時(shí)間去嘗試聽一首他們所不喜歡的歌曲,或者穿一條不是自己風(fēng)格的褲子。Facebook 的情況介乎于上述的兩者之間:一個(gè)與用戶不相關(guān)的帖子或者是廣告會(huì)在首頁信息流占用一定的空間,用戶必須手動(dòng)滑動(dòng)才能跳過。
Facebook:用戶需要更大的操作成本去跳過 Facebook 上的不感興趣的廣告
跳過頁面上不感興趣的內(nèi)容所花費(fèi)的成本,將決定了用戶直接對帖子/廣告內(nèi)容提供反饋的可能性。例如,在 Spotify 的平臺上,用戶會(huì)參與推薦內(nèi)容的篩選并標(biāo)記他們不感興趣的內(nèi)容。這樣做不僅是為了幫助調(diào)整推薦系統(tǒng)的算法,更是為了盡量避免自己花費(fèi)時(shí)間去收聽一些不感興趣的曲目。
在 Facebook,我們的確注意到用戶偶爾會(huì)使用到“隱藏該廣告”的按鈕。但由于這個(gè)按鈕的入口比較深,有些用戶并不愿意花費(fèi)這個(gè)操作成本去隱藏廣告。相對于隱藏不感興趣的推薦內(nèi)容,用戶更愿意去“點(diǎn)贊”一些自己感興趣的內(nèi)容。
Facebook:很少用戶會(huì)使用收在“更多”按鈕里的“隱藏廣告”按鈕
4. 推薦列表內(nèi)的內(nèi)容所占用的頁面范圍越多(或者是用戶跳過的成本越高),內(nèi)容的反饋按鈕就應(yīng)該越明顯。
如果推薦列表的內(nèi)容能被用戶很容易地跳過,內(nèi)容反饋入口的外露優(yōu)先級可以降低。
5. 內(nèi)容的個(gè)性化定制不應(yīng)該增加用戶的使用成本
我們在上面看到,在用戶體驗(yàn)中,最成功的推薦算法應(yīng)該能 成功地向用戶傳達(dá)合理的、關(guān)于“輸入行為”的心智模型。尤其是,本次調(diào)研的用戶非常喜歡 Netflix 的推薦列表上的內(nèi)容,因?yàn)檫@些內(nèi)容清晰地展示了用戶“輸入行為”與呈現(xiàn)內(nèi)同的關(guān)系(如 你曾看過的/你曾添加到播放列表的等等)。
然而,這種方法可能會(huì)導(dǎo)致一個(gè)問題:同一個(gè)內(nèi)容會(huì)被多次推薦。例如:在 Netflix 中,一部影片可能會(huì)出現(xiàn)在“曾經(jīng)看過”模塊,它同樣有可能會(huì)出現(xiàn)在“我的列表”或者“熱門推薦”模塊中。用戶在瀏覽頁面的過程中,會(huì)為這些重復(fù)出現(xiàn)的內(nèi)容花費(fèi)更多的注意力。至少,用戶需要辨別出哪些內(nèi)容他們曾經(jīng)看到過并跳過他們。其中一位參與調(diào)研的用戶表示:“為什么首頁中會(huì)有這么多的列表模塊?并且模塊中的內(nèi)容在不斷重復(fù)?我非常討厭這些重復(fù)內(nèi)容的列表。每一次查看列表我都會(huì)看到相同的東西,這讓我非常困擾。這對我來說簡直就是浪費(fèi)時(shí)間?!?/p>
Netflix:同一部電影「發(fā)生了什么?西蒙小姐」同時(shí)出現(xiàn)在“為你推薦”列表和“性感爵士樂”列表
但是,在用戶交互過程中,重復(fù)消耗的注意力成本不僅限于內(nèi)容的重復(fù)出現(xiàn)。Netflix 承認(rèn),他們嘗試去做超越內(nèi)容個(gè)性化層面的更高的個(gè)人定制化頁面,這包括用戶個(gè)性化的頁面布局(甚至是基于特定場景下的頁面布局),為視頻封面做個(gè)性化定制。但這一系列的個(gè)性化定制都有可能會(huì)增加用戶的交互成本:
1. 模塊限定的視頻封面縮略圖,內(nèi)容描述與大標(biāo)題
對某一項(xiàng)內(nèi)容針對特定的用戶進(jìn)行個(gè)性化定制,這在很大程度長可以吸引用戶的注意力。在研究過程中,我們的參與者用戶被提供大量的內(nèi)容。他們快速地瀏覽頁面,縮略圖,粗略地閱讀頁面上的文字內(nèi)容。一位 Facebook 用戶表示:“我通常并不會(huì)仔細(xì)閱讀別人寫了什么東西,我只是粗略地掃一眼?!倍硪晃?Netflix 的用戶則表示:“在列表中,我通常會(huì)找一些和其他內(nèi)容不同的,更有趣的內(nèi)容,通常一個(gè)特別的封面圖片能吸引到我的注意力?!?/p>
在 Netflix,同一部影片,不同的用戶可能會(huì)看到兩個(gè)不同的封面。更甚的情況是,同一部影片,同一個(gè)用戶會(huì)在兩個(gè)不同的模塊中看到這部電影不同的封面。
Netflix:同一個(gè)用戶在不同的模塊中看到的「查帕奎迪克」的封面也是不同的
理論上,這種做法可能會(huì)提高用戶“點(diǎn)贊”和觀看該影片的機(jī)會(huì)——因?yàn)閼?yīng)用內(nèi)不同的推薦模塊能強(qiáng)調(diào)這部影片的不同的亮點(diǎn),任何一個(gè)亮點(diǎn)都有可能會(huì)引起用戶的注意。遺憾的是,這種做法可能會(huì)令這部影片喪失記憶點(diǎn),因此會(huì)浪費(fèi)用戶的時(shí)間:用戶有可能會(huì)在這個(gè)過程中多次點(diǎn)入同一影片的詳情頁去瀏覽影片的內(nèi)容介紹,最終卻發(fā)現(xiàn)自己對這部影片仍然是不感興趣的或者是其實(shí)已經(jīng)曾將這部影片添加到播放列表了。
2. 不同模塊的不同布局
Netflix 同樣會(huì)針對不同的用戶,不同的場景,甚至是不同的設(shè)備去定制化頁面布局。因此,“繼續(xù)瀏覽”可能在某些模塊中會(huì)在列表的靠前位置,而在下一個(gè)模塊中會(huì)處于靠后的位置。這種做法是頁面自適應(yīng)的一個(gè)例子,并減少了用戶對適應(yīng)頁面布局的學(xué)習(xí)成本。因此,那些喜歡在開始瀏覽頁面的時(shí)候就查看最新內(nèi)容的用戶,會(huì)優(yōu)先主動(dòng)訪問“最近新增內(nèi)容”列表。
這種情況下,當(dāng)該用戶打開應(yīng)用時(shí),如果頁面定位在上次瀏覽的地方,頁面上的信息對于該用戶來說基本沒有意義。因?yàn)?Netflix 對于用戶來說是一個(gè)更側(cè)重于瀏覽性質(zhì)的頁面,改變不同模塊中的推薦列表的順序并不會(huì)對整體用戶造成較大的影響,然而,這種方法其實(shí)已被證明會(huì)明顯地降低用戶體驗(yàn)。
一些總結(jié)
日常中,我們所使用到的極大依賴于機(jī)器學(xué)習(xí)算法進(jìn)行內(nèi)容推薦的應(yīng)用/系統(tǒng)寥寥無幾。以下是幾點(diǎn)小建議:
1. 努力地去創(chuàng)建一個(gè)準(zhǔn)確的基于算法的心智模型。想做到這一點(diǎn),需要讓用戶清楚地知道他們的何種交互行為,會(huì)對算法產(chǎn)出的推薦內(nèi)容有直接影響。
2. 讓用戶能夠簡易地控制機(jī)器學(xué)習(xí)算法所產(chǎn)生的結(jié)果。允許用戶通過已知的,熟悉的,易于明白的邏輯(例如:時(shí)間線邏輯)去對這些結(jié)果進(jìn)行分類整理。若用戶對關(guān)閉一個(gè)不合適的推薦的成本越高,app 越應(yīng)該提供一個(gè)越便捷的反饋入口給用戶。
3. 如果推薦的內(nèi)容均適合在不同的模塊被推薦(譯者注:既是“今日熱門”也是“曾經(jīng)看過”),盡量不要重復(fù)推薦此內(nèi)容。
4. 對用戶進(jìn)行個(gè)性化定制的同時(shí),在改變同一頁面上不同模塊的布局時(shí)需要多加注意,避免用戶在瀏覽時(shí)出現(xiàn)較大的視覺跳躍。
5. 內(nèi)容元素應(yīng)該盡量包括與用戶強(qiáng)相關(guān)的信息內(nèi)容(譯者注:如網(wǎng)易云x—音樂給用戶推薦歌單的時(shí)候會(huì)標(biāo)注推薦原因——”因?yàn)槟阍詹剡^某些歌曲”),這些信息在用戶篩選大量內(nèi)容的時(shí)候?qū)?huì)非常有用。
6. 提前預(yù)加載內(nèi)容描述或標(biāo)題,以便于用戶在快速瀏覽時(shí)更便捷地篩選判斷。
遵循以上 6 條用戶體驗(yàn)原則,將能提人工智能算法的效益,讓人工智能不僅僅再是”花哨的技術(shù)”,為用戶的使用過程提供更好的幫助,提升用戶體驗(yàn)。
作者: Raluca Budiu
翻譯:隕石旁
原文地址:https://www.nngroup.com/articles/machine-learning-ux/
本文由 @隕石旁 翻譯發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
- 目前還沒評論,等你發(fā)揮!