關(guān)于個(gè)性化推薦算法及應(yīng)用場(chǎng)景的幾點(diǎn)思考

0 評(píng)論 21439 瀏覽 115 收藏 9 分鐘

最近參加了一場(chǎng)直播。主要講了個(gè)性化推薦算法及應(yīng)用場(chǎng)景?,F(xiàn)自己總結(jié)一下主講內(nèi)容,以備自己思考。有些地方個(gè)人也不是太理解,同時(shí)也想與大家交流溝通下。

一、影響推薦系統(tǒng)效果的主要因素

  1. 優(yōu)化目標(biāo),怎么說(shuō)呢目標(biāo)結(jié)果是什么,是為了用戶(hù)還是為了商業(yè)目的。這兩者本身是存在矛盾的,為了不同目標(biāo)怎優(yōu)化結(jié)果不一樣。就好比用戶(hù)喜歡吃瓜果蔬菜營(yíng)養(yǎng)健康的綠色食品這樣有利于健康,但我們發(fā)現(xiàn)讓他吃大魚(yú)大肉最賺錢(qián)。
  2. 基于用戶(hù)場(chǎng)景的推薦,比如說(shuō)是晚上睡覺(jué)前看的,還是白天閑暇時(shí)看的,有一個(gè)時(shí)間段。再比如說(shuō)上次觀看的終端是什么,是移動(dòng)端或者是pc端,有一個(gè)上次觀看銜接的問(wèn)題。還有一個(gè)就是地域問(wèn)題。
  3. 用戶(hù)體驗(yàn),主要是用戶(hù)對(duì)于系統(tǒng)的信任,用戶(hù)嘗新的成本,是否接受的問(wèn)題,怎么嘗試一些好的手段讓用戶(hù)很貼心,很暖心,有驚喜的感覺(jué)。哎,發(fā)現(xiàn)推薦的都是我喜歡的,這個(gè)系統(tǒng)好了解我喲。具體做法舉例在下文“說(shuō)服用戶(hù)接受這件事兒”闡述。
  4. 直播場(chǎng)景的推薦(冷啟動(dòng)問(wèn)題)

二、推薦系統(tǒng)的優(yōu)化目標(biāo)有兩類(lèi)

  1. 用戶(hù)—–相關(guān)性,多樣性。例如根據(jù)用戶(hù)瀏覽過(guò)的文章的主題詞,標(biāo)簽,熱度,轉(zhuǎn)載,時(shí)效,相似度等等。用戶(hù)的特征性別,職業(yè),年齡,興趣,定期點(diǎn)擊行為。
  2. 平臺(tái)—–商業(yè)化變現(xiàn)。比如說(shuō)開(kāi)通原創(chuàng)的預(yù)先推薦,或者說(shuō)有內(nèi)容合作的供應(yīng)商優(yōu)先等等因素。

三、推薦系統(tǒng)的服務(wù)對(duì)象

  1. 用戶(hù);用戶(hù)是為了能夠更方便找到他想看的東西
  2. 平臺(tái)本身;平臺(tái)希望鏈接服務(wù)提供商,內(nèi)容提供商和用戶(hù),他希望賺錢(qián)
  3. 內(nèi)容提供商;內(nèi)容提供商更多露出,他在這個(gè)渠道上獲得的無(wú)論是點(diǎn)擊量還是品牌效應(yīng),那么他可以通過(guò)一些方法變現(xiàn)。無(wú)論是廣告還是離線(xiàn)渠道的收買(mǎi)。

所以一個(gè)推薦算法要同事服務(wù)三個(gè)利益不同的相關(guān)方,這本身導(dǎo)致了一個(gè)矛盾性。所以會(huì)有一些糾結(jié)的地方,實(shí)際上由于他們的目的不。

四、推薦算法模型:

  1. 協(xié)同濾波:就是相似的人給相似的內(nèi)容。怎么定義相似的人呢那就是之前的行為相同。
  2. 矩陣分解法:基本原理是把用戶(hù)作為一個(gè)維度,然后建一個(gè)二維矩陣,把這個(gè)二維矩陣找到一個(gè)低緯的表示,這可能只有50或者100維,這個(gè)個(gè)數(shù)還是跟內(nèi)容一樣,所以每個(gè)內(nèi)容有一個(gè)100維的小表示,每個(gè)用戶(hù)也有一個(gè)100維的小表示。這兩個(gè)作為一個(gè)點(diǎn)擊,可以恢復(fù)出原來(lái)的東西。
  3. 神經(jīng)網(wǎng)絡(luò)矩陣分解:基本原理把這個(gè)nade看成一個(gè)黑箱,級(jí)別讓你的想法就是用nade來(lái)訓(xùn)練一個(gè)用戶(hù)的表示和一個(gè)內(nèi)容表示,但是這個(gè)表示可以不像矩陣分解那么死,因?yàn)樗Y(jié)合的時(shí)候不再是一代數(shù)的點(diǎn)程,而是基于一個(gè)神經(jīng)網(wǎng)絡(luò),實(shí)際上帶來(lái)了更多的自由度。唯一的差別就是表達(dá)能力增強(qiáng)了。

五、基于用戶(hù)場(chǎng)景的推薦,不同場(chǎng)景下算法選擇問(wèn)題

  1. 貨架場(chǎng)景—協(xié)調(diào)濾波,矩陣分解,CF-NADE
  2. 自動(dòng)播放場(chǎng)景—用戶(hù)行為軌跡

這個(gè)用戶(hù)場(chǎng)景比如說(shuō)我在手機(jī)上看,和我在客廳里看,實(shí)際上對(duì)視頻的長(zhǎng)短還有很多內(nèi)容會(huì)有不同,因?yàn)槭謾C(jī)上有可能是在公共場(chǎng)合、辦公室,但是在家里可能就會(huì)稍微私密一些。還有時(shí)間,假如說(shuō)我手機(jī)是早上看,家里面我是晚上看,也會(huì)不一樣。所以這些都叫所謂的上下文吧,就是場(chǎng)景信息。

實(shí)際上就對(duì)用戶(hù)做了一個(gè)切分,當(dāng)用戶(hù)在這個(gè)組合場(chǎng)景底下的時(shí)候,所借鑒的歷史行為也是原來(lái)發(fā)生在這個(gè)組合底下的,這樣就不會(huì)出現(xiàn)晚上看了什么成人動(dòng)漫,早上被推一個(gè)成人動(dòng)漫的情況,因?yàn)閷?shí)際上把用戶(hù)切成兩個(gè)了。但是這樣切分也是有風(fēng)險(xiǎn)的,因?yàn)橛锌赡苓@個(gè)人成天都喜歡看成人動(dòng)漫。所以這個(gè)會(huì)把我們本來(lái)就比較稀疏的數(shù)據(jù)變得更稀疏。

但是發(fā)現(xiàn)對(duì)整個(gè)觀看時(shí)長(zhǎng)的提升以及對(duì)廣告點(diǎn)擊率的提升還是比較顯著的,大概在4%左右,就是用AB測(cè)試得到的結(jié)果。

剛才主要在講watch,其實(shí)用戶(hù)在網(wǎng)站上還有其他行為,像Search、Browse、瀏覽,還有Rating,Rating比較少一點(diǎn)。

所以這幾類(lèi)行為實(shí)際上用戶(hù)做的時(shí)候,如果把用戶(hù)整個(gè)生命周期,從他sign up開(kāi)始到他退訂為止看成一個(gè)軌跡的話(huà),那他做了一系列的事。

我們現(xiàn)在是說(shuō)對(duì)每個(gè)用戶(hù)的軌跡做建模。剛才你如果想象是CF-NADE,就是說(shuō)把用戶(hù)所有的行為當(dāng)成一些個(gè)體扔到一個(gè)大袋子里面去,然后篩一篩,說(shuō)統(tǒng)計(jì)上是怎么樣的。實(shí)際上它的時(shí)間順序已經(jīng)丟失了,里面用戶(hù)具體的動(dòng)態(tài)也沒(méi)有考慮,如果根據(jù)用戶(hù)行為做這種模型time series model其實(shí)可以達(dá)到最好的效果。

六、說(shuō)服用戶(hù)接受這件事兒

說(shuō)服用戶(hù)這件事,因?yàn)閯偛胖v得所有模型,其實(shí)最后就是一個(gè)展示,無(wú)論是用貨架的方法來(lái)展示,還是用自動(dòng)播放的方法來(lái)展示。但是這個(gè)展示的有效性很大程度上是取決于你有沒(méi)有打動(dòng)用戶(hù),要打動(dòng)用戶(hù)試圖給出一些推薦的理由,比如我們給這個(gè)用戶(hù)推了這個(gè)劇,我們會(huì)說(shuō)是因?yàn)槟憧催^(guò)他的前傳,這樣的話(huà)用戶(hù)會(huì)覺(jué)得,你確實(shí)是有道理的。還有一個(gè)增強(qiáng)用戶(hù)對(duì)系統(tǒng)的信任,如果你的系統(tǒng)是黑盒,扔出來(lái)一堆劇說(shuō)看吧,那估計(jì)很難說(shuō)服用戶(hù)。大家可以回想一下,在錄像店的體驗(yàn),如果是那種小店的話(huà),你跟那個(gè)店主特別熟,他給你推一個(gè)張媛又拍了一個(gè)新片你可以看。你會(huì)知道,他真的知道你了解你,給你推這個(gè)東西,我們想達(dá)到的就是讓計(jì)算機(jī)能夠被用戶(hù)所信任。

還有一個(gè)展示的問(wèn)題,要降低用戶(hù)嘗新的成本。因?yàn)橛脩?hù)點(diǎn)進(jìn)去,如果看了20分鐘發(fā)現(xiàn)這個(gè)片很爛的話(huà),那這個(gè)體驗(yàn)就比較差,浪費(fèi)了20分鐘。我們?cè)趺礃幼層脩?hù)快速的知道這個(gè)片到底適不適合他?我們做了一個(gè)自動(dòng)壓縮的方法。
大家看到它有這樣一個(gè)下拉菜單,我們對(duì)于生成短視頻有三種不同的模式:

  • 模式一:動(dòng)作模式,我們會(huì)找短視頻里最激烈的片段。
  • 模式二:indicative模式,我們會(huì)找對(duì)話(huà)比較多的片段。
  • 模式三:對(duì)話(huà)比較多模式

寫(xiě)在最后,用戶(hù)推薦系統(tǒng)是一個(gè)不斷調(diào)試,不斷優(yōu)化的過(guò)程。在此過(guò)程中尋找適合本公司商業(yè)模式和用戶(hù)喜好的個(gè)性推薦系統(tǒng)。本文寫(xiě)的不是很細(xì)致,歡迎大家留言交流。

 

本文由 @penny 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!