推薦策略:如何解決重復(fù)推薦問題

7 評論 15004 瀏覽 103 收藏 10 分鐘

你是否有這樣的體會:信息流推薦的內(nèi)容我已經(jīng)看過。這是由于推薦算法存在重復(fù)推薦的問題,那么,針對不同的信息流,是否有改善該問題的方法?

前段時間接觸了與推薦策略相關(guān)的工作,如今產(chǎn)品也順利走上“正確的道路”。關(guān)于常見推薦算法規(guī)則及原理,網(wǎng)上有很多不錯的相關(guān)文章,大家可以去搜索瀏覽。

下面主要聊聊推薦算法實驗和常見推薦算法優(yōu)缺點,以及內(nèi)容重復(fù)推薦相關(guān)話題。

評測算法的方法

好的算法模型并不是一蹴而就的,而是不斷訓(xùn)練慢慢打磨出來的。

那么,在打磨的路上如何評測推薦算法效果以及不同算法之間的優(yōu)劣呢?

這里有3種實驗方法供你參考。

1. 模擬實驗

模擬實驗主要通過用戶產(chǎn)生的行為日志,比如對該條內(nèi)容進行瀏覽、收藏、點贊等用戶行為來生成推薦標(biāo)準(zhǔn)的數(shù)據(jù)集,再把數(shù)據(jù)集按規(guī)則分成“訓(xùn)練組”和“測試組”,在“訓(xùn)練組”上調(diào)教用戶興趣模型,在“測試組”上進行預(yù)測。

該實驗好處在于,不需要真實用戶參與,只需要從日志系統(tǒng)提取用戶行為數(shù)據(jù)就可以快速計算出推薦效果。但缺點是無法得知用戶真實轉(zhuǎn)化指標(biāo),比如推薦點擊率。

2. 用戶調(diào)研

監(jiān)控一批已體驗推薦相關(guān)的用戶,持續(xù)觀察分析用戶行為。

針對用戶行為羅列相關(guān)問題,在調(diào)研中進行詢問,最后根據(jù)問題及答案來了解推薦效果及滿意度。

值得關(guān)注的是,準(zhǔn)確率高不等于用戶滿意度高,更應(yīng)該留意一些由推薦產(chǎn)生的內(nèi)容有沒有給他帶來一些“驚喜”,更多偏向于用戶主觀感受。

也正因如此,從行為觀察到問題歸納、用戶邀約、最后調(diào)研結(jié)果分析等,實驗調(diào)查流程及成本都比較高。

3. A/B測試

通過劃分用戶群,針對不同用戶群采用不同推薦算法,統(tǒng)計出不同用戶群體轉(zhuǎn)化指標(biāo)生成測試報告,謹(jǐn)記該實驗唯一的變量就是算法規(guī)則,不允許有其它變量。

還有一點需要考慮清楚的是,滿足什么樣的條件用戶去跑測試流程,A/B測試缺點在于周期長,短期迸發(fā)的測試結(jié)果無法保證真實性。所以,該實驗適用于模擬實驗和用戶調(diào)研中效果比較好的算法模型,并不適用于跑所有算法,那樣效率實在太差。

一類算法只能解決一部分問題,單一的算法難以達(dá)到真正的個性化,還需要算法與算法之間打組合拳,接下來聊聊目前常見推薦算法一些優(yōu)缺點。

熱度算法

1. 優(yōu)點

能夠有效過濾掉低質(zhì)量內(nèi)容,呈現(xiàn)給到用戶都是大部分人都“喜歡過”的。對新用戶相對友好,無需產(chǎn)生任何交互也能產(chǎn)生推薦列表;不存在推薦列表為空的情況,并且熱度是相對的,熱點不會一直都是熱點,具有一定時效性。

基礎(chǔ)熱度分可以人為干預(yù),比如,今天的熱點新聞基礎(chǔ)熱度分要比今天普通新聞的基礎(chǔ)熱度分要高。

2. 缺點

針對用戶層面精準(zhǔn)觸達(dá)精確度不是很夠。

因為推薦列表是按熱度進行排序,并不是基于個人興趣喜好排序,單一的熱度算法可以被“刷榜”,因此要做好相對措施。

采用熱度算法典型例子:抖音

游客登錄瀏覽前面幾條視頻多數(shù)為近期熱度值為Top5內(nèi)的,且上熱門推薦是需要經(jīng)過多個熱度池大量用戶檢驗,最后還要人工審核才能上首頁推薦。

但不會持續(xù)超過1周,除非有大量的用戶進行模仿跟拍,反推用戶行為視頻熱度權(quán)重,用戶“跟拍”行為的熱度權(quán)重遠(yuǎn)大于收藏、點贊及分享。

基于內(nèi)容推薦算法

1. 優(yōu)點

對產(chǎn)品用戶體量沒有要求,不會因產(chǎn)品用戶數(shù)的大小影響到該算法。因為每個用戶產(chǎn)生行為相互獨立,用戶行為特征都是由自己的來決定,不存在干擾之說。

另外,該算法有較強的實時性,每當(dāng)有一條新的內(nèi)容就可以立馬“被推薦”,推薦機會和舊內(nèi)容是一樣的,與時間新舊無必然聯(lián)系。

2. 缺點

無法為新用戶產(chǎn)生推薦列表,新用戶沒有歷史行為數(shù)據(jù)也無法預(yù)測。

當(dāng)沒有用戶行為特征,無法與內(nèi)容進行匹配推薦。所以,多數(shù)產(chǎn)品會利用注冊預(yù)填信息、首次登錄成功著陸頁的彈窗選擇等手段,并結(jié)合熱度推薦來進行冷啟動。

但要注意這些動作是否會過分地打擾到用戶,權(quán)衡用戶流失和推薦精準(zhǔn)度問題。

其次,基于內(nèi)容推薦確定性非常強,所有推薦的內(nèi)容都是由用戶的瀏覽歷史決定。單獨使用該算法難以挖掘用戶的潛在興趣,所以該算法一般會與其他算法并存的原因也在這。

基于用戶協(xié)同算法

1. 優(yōu)點

在于能挖掘用戶潛在興趣,不斷調(diào)整給用戶制造驚喜。同時也有較強的實時性,有新內(nèi)容同樣立馬能“被推薦”。

但與基于內(nèi)容推薦差異在于,該算法除了平臺本身產(chǎn)生的新內(nèi)容外,還包含了用戶交互行為所產(chǎn)生的新內(nèi)容。

2. 缺點

啟動門檻相對較高,對產(chǎn)品用戶數(shù)以及平臺內(nèi)容有一定數(shù)量要求,并且對用戶學(xué)習(xí)樣本要求也高,學(xué)習(xí)樣本書不足時推薦效果不理想,容易成為人工智障。

在KANO模型的需求分析上屬于興奮需求,所以在產(chǎn)品冷啟動時一般不會優(yōu)先考慮該算法。但在算法冷啟動時,應(yīng)該主動調(diào)教用戶,如果能把用戶圈到不同推薦雛形,對該算法會有一定幫助。

最后聊聊關(guān)于重復(fù)推薦問題

推薦算法最根本的意義,在于解決信息過載。如果推薦給到用戶,是千篇一律的內(nèi)容,那將毫無意義。

解決重復(fù)推薦可以從根源上壓制,比如“閱后即焚”,當(dāng)用戶看過該條內(nèi)容后即標(biāo)記為已讀,已讀狀態(tài)的內(nèi)容不再推薦給該用戶。

要定義清楚用戶產(chǎn)生什么行為才定義為“看過”,是點擊詳情頁就算,還是點開了“查看剩余全文”等行為,需要根據(jù)自身業(yè)務(wù)進行考慮。

上述的“閱后即焚”可以解決內(nèi)容單條重復(fù),但還無法解決同質(zhì)化的問題。

以信息流產(chǎn)品為例,有A和B兩篇文章:

1)A和B屬于列表頁和詳情頁都一致的文章

對用戶而言只需要看A和B其中一篇就可以。所以,應(yīng)該展示其中一篇適當(dāng)?shù)膬?nèi)容給予推薦,這里面的“適當(dāng)”可以有兩個維度:如發(fā)文時間(過濾搬運)、發(fā)布者信息(如果是新聞機構(gòu)號權(quán)威一般大于個人號)。

2)A和B兩篇文章屬于列表頁相同,但詳情頁不相同的情況

那么用戶點擊過A文章,短時間內(nèi)大概率不會再看B文章。因為在用戶的視角,他認(rèn)為A和B是重復(fù)的,所以會大概率錯過B文章,對于這類情況應(yīng)該拉開推薦間隔。

3)A和B兩篇文章屬于列表頁不同,但詳情頁相同的情況

需要考慮用戶是否有“看過”其中一篇文章。如果看過A文就沒必要再推B文;但如果都沒有看過,那么可以進行推薦。因為列表頁的差異會影響用戶行為,一個標(biāo)題一張封面都會導(dǎo)致用戶是否會查看文章,所以這種情況A和B都有推薦的必要性。

#專欄作家#

動物園園長,微信公眾號:首席吹牛官,人人都是產(chǎn)品經(jīng)理專欄作家?;ヂ?lián)網(wǎng)圈十八線作詞人,國家一級退堂鼓表演藝術(shù)家。顏良而文丑,歡迎交流。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 同問,列表頁a和b相同是指什么意思?

    來自浙江 回復(fù)
  2. 想問一下,如何解決推薦類別過于集中的問題,比如有些用戶的推薦列表里可能出現(xiàn)連續(xù)10多個搞笑類別的內(nèi)容

    來自上海 回復(fù)
    1. 可以通過類目打散進行調(diào)整,比如精排之后,通過設(shè)置‘連續(xù)10個視頻,同一類型的視頻不超過2個’類似這種規(guī)則

      來自浙江 回復(fù)
  3. 最近在學(xué)習(xí)推薦相關(guān)內(nèi)容,學(xué)習(xí)了

    來自北京 回復(fù)
  4. 事先把用戶框進推薦雛形里 這點不是很理解,求詳

    回復(fù)
  5. 列表頁是指什么呢?

    來自廣東 回復(fù)
    1. 列表頁標(biāo)題? 詳情頁內(nèi)容?

      回復(fù)