推薦策略:如何解決重復(fù)推薦問題
你是否有這樣的體會:信息流推薦的內(nèi)容我已經(jīng)看過。這是由于推薦算法存在重復(fù)推薦的問題,那么,針對不同的信息流,是否有改善該問題的方法?
前段時間接觸了與推薦策略相關(guān)的工作,如今產(chǎn)品也順利走上“正確的道路”。關(guān)于常見推薦算法規(guī)則及原理,網(wǎng)上有很多不錯的相關(guān)文章,大家可以去搜索瀏覽。
下面主要聊聊推薦算法實驗和常見推薦算法優(yōu)缺點,以及內(nèi)容重復(fù)推薦相關(guān)話題。
評測算法的方法
好的算法模型并不是一蹴而就的,而是不斷訓(xùn)練慢慢打磨出來的。
那么,在打磨的路上如何評測推薦算法效果以及不同算法之間的優(yōu)劣呢?
這里有3種實驗方法供你參考。
1. 模擬實驗
模擬實驗主要通過用戶產(chǎn)生的行為日志,比如對該條內(nèi)容進行瀏覽、收藏、點贊等用戶行為來生成推薦標(biāo)準(zhǔn)的數(shù)據(jù)集,再把數(shù)據(jù)集按規(guī)則分成“訓(xùn)練組”和“測試組”,在“訓(xùn)練組”上調(diào)教用戶興趣模型,在“測試組”上進行預(yù)測。
該實驗好處在于,不需要真實用戶參與,只需要從日志系統(tǒng)提取用戶行為數(shù)據(jù)就可以快速計算出推薦效果。但缺點是無法得知用戶真實轉(zhuǎn)化指標(biāo),比如推薦點擊率。
2. 用戶調(diào)研
監(jiān)控一批已體驗推薦相關(guān)的用戶,持續(xù)觀察分析用戶行為。
針對用戶行為羅列相關(guān)問題,在調(diào)研中進行詢問,最后根據(jù)問題及答案來了解推薦效果及滿意度。
值得關(guān)注的是,準(zhǔn)確率高不等于用戶滿意度高,更應(yīng)該留意一些由推薦產(chǎn)生的內(nèi)容有沒有給他帶來一些“驚喜”,更多偏向于用戶主觀感受。
也正因如此,從行為觀察到問題歸納、用戶邀約、最后調(diào)研結(jié)果分析等,實驗調(diào)查流程及成本都比較高。
3. A/B測試
通過劃分用戶群,針對不同用戶群采用不同推薦算法,統(tǒng)計出不同用戶群體轉(zhuǎn)化指標(biāo)生成測試報告,謹(jǐn)記該實驗唯一的變量就是算法規(guī)則,不允許有其它變量。
還有一點需要考慮清楚的是,滿足什么樣的條件用戶去跑測試流程,A/B測試缺點在于周期長,短期迸發(fā)的測試結(jié)果無法保證真實性。所以,該實驗適用于模擬實驗和用戶調(diào)研中效果比較好的算法模型,并不適用于跑所有算法,那樣效率實在太差。
一類算法只能解決一部分問題,單一的算法難以達(dá)到真正的個性化,還需要算法與算法之間打組合拳,接下來聊聊目前常見推薦算法一些優(yōu)缺點。
熱度算法
1. 優(yōu)點
能夠有效過濾掉低質(zhì)量內(nèi)容,呈現(xiàn)給到用戶都是大部分人都“喜歡過”的。對新用戶相對友好,無需產(chǎn)生任何交互也能產(chǎn)生推薦列表;不存在推薦列表為空的情況,并且熱度是相對的,熱點不會一直都是熱點,具有一定時效性。
基礎(chǔ)熱度分可以人為干預(yù),比如,今天的熱點新聞基礎(chǔ)熱度分要比今天普通新聞的基礎(chǔ)熱度分要高。
2. 缺點
針對用戶層面精準(zhǔn)觸達(dá)精確度不是很夠。
因為推薦列表是按熱度進行排序,并不是基于個人興趣喜好排序,單一的熱度算法可以被“刷榜”,因此要做好相對措施。
采用熱度算法典型例子:抖音
游客登錄瀏覽前面幾條視頻多數(shù)為近期熱度值為Top5內(nèi)的,且上熱門推薦是需要經(jīng)過多個熱度池大量用戶檢驗,最后還要人工審核才能上首頁推薦。
但不會持續(xù)超過1周,除非有大量的用戶進行模仿跟拍,反推用戶行為視頻熱度權(quán)重,用戶“跟拍”行為的熱度權(quán)重遠(yuǎn)大于收藏、點贊及分享。
基于內(nèi)容推薦算法
1. 優(yōu)點
對產(chǎn)品用戶體量沒有要求,不會因產(chǎn)品用戶數(shù)的大小影響到該算法。因為每個用戶產(chǎn)生行為相互獨立,用戶行為特征都是由自己的來決定,不存在干擾之說。
另外,該算法有較強的實時性,每當(dāng)有一條新的內(nèi)容就可以立馬“被推薦”,推薦機會和舊內(nèi)容是一樣的,與時間新舊無必然聯(lián)系。
2. 缺點
無法為新用戶產(chǎn)生推薦列表,新用戶沒有歷史行為數(shù)據(jù)也無法預(yù)測。
當(dāng)沒有用戶行為特征,無法與內(nèi)容進行匹配推薦。所以,多數(shù)產(chǎn)品會利用注冊預(yù)填信息、首次登錄成功著陸頁的彈窗選擇等手段,并結(jié)合熱度推薦來進行冷啟動。
但要注意這些動作是否會過分地打擾到用戶,權(quán)衡用戶流失和推薦精準(zhǔn)度問題。
其次,基于內(nèi)容推薦確定性非常強,所有推薦的內(nèi)容都是由用戶的瀏覽歷史決定。單獨使用該算法難以挖掘用戶的潛在興趣,所以該算法一般會與其他算法并存的原因也在這。
基于用戶協(xié)同算法
1. 優(yōu)點
在于能挖掘用戶潛在興趣,不斷調(diào)整給用戶制造驚喜。同時也有較強的實時性,有新內(nèi)容同樣立馬能“被推薦”。
但與基于內(nèi)容推薦差異在于,該算法除了平臺本身產(chǎn)生的新內(nèi)容外,還包含了用戶交互行為所產(chǎn)生的新內(nèi)容。
2. 缺點
啟動門檻相對較高,對產(chǎn)品用戶數(shù)以及平臺內(nèi)容有一定數(shù)量要求,并且對用戶學(xué)習(xí)樣本要求也高,學(xué)習(xí)樣本書不足時推薦效果不理想,容易成為人工智障。
在KANO模型的需求分析上屬于興奮需求,所以在產(chǎn)品冷啟動時一般不會優(yōu)先考慮該算法。但在算法冷啟動時,應(yīng)該主動調(diào)教用戶,如果能把用戶圈到不同推薦雛形,對該算法會有一定幫助。
最后聊聊關(guān)于重復(fù)推薦問題
推薦算法最根本的意義,在于解決信息過載。如果推薦給到用戶,是千篇一律的內(nèi)容,那將毫無意義。
解決重復(fù)推薦可以從根源上壓制,比如“閱后即焚”,當(dāng)用戶看過該條內(nèi)容后即標(biāo)記為已讀,已讀狀態(tài)的內(nèi)容不再推薦給該用戶。
要定義清楚用戶產(chǎn)生什么行為才定義為“看過”,是點擊詳情頁就算,還是點開了“查看剩余全文”等行為,需要根據(jù)自身業(yè)務(wù)進行考慮。
上述的“閱后即焚”可以解決內(nèi)容單條重復(fù),但還無法解決同質(zhì)化的問題。
以信息流產(chǎn)品為例,有A和B兩篇文章:
1)A和B屬于列表頁和詳情頁都一致的文章
對用戶而言只需要看A和B其中一篇就可以。所以,應(yīng)該展示其中一篇適當(dāng)?shù)膬?nèi)容給予推薦,這里面的“適當(dāng)”可以有兩個維度:如發(fā)文時間(過濾搬運)、發(fā)布者信息(如果是新聞機構(gòu)號權(quán)威一般大于個人號)。
2)A和B兩篇文章屬于列表頁相同,但詳情頁不相同的情況
那么用戶點擊過A文章,短時間內(nèi)大概率不會再看B文章。因為在用戶的視角,他認(rèn)為A和B是重復(fù)的,所以會大概率錯過B文章,對于這類情況應(yīng)該拉開推薦間隔。
3)A和B兩篇文章屬于列表頁不同,但詳情頁相同的情況
需要考慮用戶是否有“看過”其中一篇文章。如果看過A文就沒必要再推B文;但如果都沒有看過,那么可以進行推薦。因為列表頁的差異會影響用戶行為,一個標(biāo)題一張封面都會導(dǎo)致用戶是否會查看文章,所以這種情況A和B都有推薦的必要性。
#專欄作家#
動物園園長,微信公眾號:首席吹牛官,人人都是產(chǎn)品經(jīng)理專欄作家?;ヂ?lián)網(wǎng)圈十八線作詞人,國家一級退堂鼓表演藝術(shù)家。顏良而文丑,歡迎交流。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
同問,列表頁a和b相同是指什么意思?
想問一下,如何解決推薦類別過于集中的問題,比如有些用戶的推薦列表里可能出現(xiàn)連續(xù)10多個搞笑類別的內(nèi)容
可以通過類目打散進行調(diào)整,比如精排之后,通過設(shè)置‘連續(xù)10個視頻,同一類型的視頻不超過2個’類似這種規(guī)則
最近在學(xué)習(xí)推薦相關(guān)內(nèi)容,學(xué)習(xí)了
事先把用戶框進推薦雛形里 這點不是很理解,求詳
列表頁是指什么呢?
列表頁標(biāo)題? 詳情頁內(nèi)容?