推薦系統(tǒng)案例:小紅書的底層邏輯
小紅書的內(nèi)容推薦模型是怎樣的?這篇文章里,作者就對小紅書的推薦模型邏輯進行了拆解,感興趣的同學(xué),可以來看一下。
一、小紅書用戶隱私政策
收集和使用的個人信息
根據(jù)收集的用戶個人信息,我們可以發(fā)現(xiàn)小紅書的業(yè)務(wù)模式始終是基于內(nèi)容進行過濾、檢索的信息流生活平臺,在這一平臺上生活美妝是其主題。
二、小紅書內(nèi)容推薦模型
工業(yè)界常見的推薦模型一般包括特征服務(wù)、索引、召回、粗排、精排、重排、樣式創(chuàng)意等環(huán)節(jié),我將基于此對小紅書的推薦模型邏輯進行拆解。
1. 特征服務(wù)與物料索引
在“設(shè)置-我的內(nèi)容偏好”中,我們可以發(fā)現(xiàn)“為我們推薦可能感興趣的內(nèi)容”,其中如“狗狗日常”、“藝術(shù)繪畫”便是平臺所使用的用戶特征、物料特征、情景特征。
此外,平臺內(nèi)部還有不對C端公開的細化標(biāo)簽,比如“狗狗日?!钡摹熬┌汀迸c“藏獒”便會被推送到不同用戶界面處。平臺基于這些物料特征為物料進行預(yù)訓(xùn)練、打標(biāo),以供后續(xù)召回、排序等環(huán)節(jié)的使用。
2. 召回模型:Item-CF算法與雙塔模型
小紅書主要采用Item-CF算法類似的邏輯,然而這一算法普遍存在以下表征:
- 核心問題:如何計算物料與物料之間、用戶與用戶之間的相似度。
- 優(yōu)點:算法邏輯較簡單,容易實現(xiàn),同時又有不錯的效果,具備一定的個性化。
- 缺點:與規(guī)則召回缺點方向一致,冷啟動問題明顯,存在一定的馬太效應(yīng),頭部熱門問題易與其他產(chǎn)生關(guān)聯(lián)。
為解決用戶冷啟動問題,以小紅書為代表的內(nèi)容消費平臺采用雙塔模型的思想,在召回階段中往往會增加一路使用內(nèi)容多模態(tài)表征的i2i召回進行優(yōu)化,這路召回由于只使用了純內(nèi)容的特征,和老物品便可以公平比較,不會產(chǎn)生因為新物品后驗行為少而導(dǎo)致無法被召回的問題,近期引入了LLM對i2i召回進行優(yōu)化。
在現(xiàn)有的多模態(tài)i2i召回方法,在文本側(cè)一般都是用一個BERT經(jīng)過預(yù)訓(xùn)練后生成embedding然后基于embedding的相似度來進行召回,但是這樣可能也會存在一些問題:
- BERT表征能力不足。僅使用Bert生成的embedding只能代表文本的語義信息,和下游推薦任務(wù)的目標(biāo)存在一定的不一致
- 標(biāo)簽類別信息重點程度不足。一篇圖文筆記的標(biāo)簽和類別往往代表他的中心思想,對于確定兩個筆記是否相關(guān)至關(guān)重要,但現(xiàn)有的Bert方法只是將標(biāo)簽和類別視為內(nèi)容的一個組成部分。
小紅書發(fā)現(xiàn)使用筆記內(nèi)容生成標(biāo)簽和類別的過程和生成筆記的embedding十分類似,都是講筆記的關(guān)鍵信息壓縮成有限的內(nèi)容,因此引入一個生成標(biāo)簽和類別的任務(wù)可能會提升最終embedding的質(zhì)量,因此設(shè)計了3個方法:
- 筆記壓縮prompt構(gòu)建
- 生成式對比學(xué)習(xí)(Generative-Contrastive Learning)
- 協(xié)同監(jiān)督微調(diào)(Collaborative Supervised Fine-Tuning)
筆記壓縮prompt構(gòu)建用來定義模型在訓(xùn)練時的輸入,生成式對比學(xué)習(xí)和協(xié)同監(jiān)督微調(diào)分別對應(yīng)兩個預(yù)訓(xùn)練任務(wù),前者引入了推薦中的協(xié)同過濾信號作為標(biāo)簽進行對比學(xué)習(xí)來訓(xùn)練更好的文本表征,后者其實就是根據(jù)筆記內(nèi)容來生成對應(yīng)的標(biāo)簽和類別,以此強化embedding的可用性,結(jié)果表明將LLM引入i2i推薦任務(wù)可以提高推薦性能和用戶體驗。
此外,還觀察到單日對新筆記的評論數(shù)量顯著增加了3.58%。這表明LLM的引入有利于冷啟動。NoteLLM最終推全上線。
3. 排序策略
3.1. 粗排策略
行業(yè)內(nèi)普遍采用基于模型的粗排策略。使用DNN模型構(gòu)建CTR預(yù)估模型,并進行離線AUC指標(biāo)評估與線上AB Test測試。
3.2. 精排策略
在內(nèi)容推薦場景,對于內(nèi)容推薦平臺如小紅書等來說其核心的業(yè)務(wù)指標(biāo)是DAU、互動率。小紅書采用GBDT+Sparse D&W的模型算法通過構(gòu)建click、hide、like、fav、comment、share、follow等模型特征來進行模型訓(xùn)練,并輸出訓(xùn)練結(jié)果,即CES評分=點贊數(shù)×1分+收藏數(shù)×1分+評論數(shù)×4分+轉(zhuǎn)發(fā)數(shù)×4分+關(guān)注數(shù)×8分。
3.3. 重排策略
3.3.1. 全局最優(yōu)的排序策略
一個界面里有四個帖子,很明顯小紅書采用的是序列優(yōu)化策略,會根據(jù)我點擊物料的行為進行排序,最終排出我最喜歡的東西,你會發(fā)現(xiàn)實習(xí)求職多數(shù)在上面,大多在左上角哦!
3.3.2. 基于用戶體驗的策略調(diào)整
一個界面里有四個帖子,很明顯小紅書采用的是全局最優(yōu)策略,在這一策略中,我們發(fā)現(xiàn)圖片、品類、作者都是各不相同的,品類也各有不同。但是由于作者酷愛小貓與苦尋實習(xí),所以每次的推薦頁面均有小貓與實習(xí)職業(yè)相關(guān)內(nèi)容。
3.3.3. 適當(dāng)?shù)牧髁空{(diào)控
流量調(diào)控策略只有一種,即直接在重排層針對這部分物料進行相應(yīng)權(quán)重的調(diào)整,例如小紅書的蒲公英平臺、特定活動的流量扶持計劃便是流量調(diào)控的一種表現(xiàn)形式。
本文由 @策略產(chǎn)品經(jīng)理規(guī)劃 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!