搜廣推策略產(chǎn)品:灰盒“l(fā)ook alike”策略在微信看一看上的應(yīng)用(下篇)

0 評(píng)論 3239 瀏覽 10 收藏 9 分鐘

如何通過(guò)RALM模型框架實(shí)現(xiàn)種子人群擴(kuò)展的思想,達(dá)成“準(zhǔn)而全”的營(yíng)銷投放述求呢?本文作者通過(guò)微信看一看廣告資源位場(chǎng)景下的實(shí)例,對(duì)“Look alike”策略進(jìn)行了分析,一起來(lái)看一下吧。

上篇講完“l(fā)ook alike”常見(jiàn)的機(jī)器學(xué)習(xí)&深度學(xué)習(xí)策略,我們今天找個(gè)具體在微信看一看廣告資源位場(chǎng)景下的實(shí)例,更加深切感受一下look alike的策略,如何通過(guò)RALM模型框架實(shí)現(xiàn)種子人群擴(kuò)展的思想,如何達(dá)成“準(zhǔn)而全”的營(yíng)銷投放訴求。

一、RALM模型框架在微信看一看中的應(yīng)用

RALM模型框架說(shuō)明

大體的過(guò)程主要分成三個(gè)模塊,分別是最下層的離線訓(xùn)練、到在線異步處理,再到在線服務(wù)。

1. 離線訓(xùn)練

離線訓(xùn)練架構(gòu)圖

離線訓(xùn)練,主要包含representation learning(用戶表示學(xué)習(xí))和look alike learning(用戶相似性學(xué)習(xí)),進(jìn)行完 look alike learning 之后,可以把 user 經(jīng)過(guò)全連接層的 user 表達(dá) Eu緩存起來(lái)。全量用戶,有10多億,可以 catch 到 KV 中??梢蕴峁┙o在線服務(wù)做緩存,線上不用做實(shí)時(shí)全量傳播。

1)representation learning(用戶表示學(xué)習(xí))

用戶表示學(xué)習(xí)

這個(gè)模型有點(diǎn)類似經(jīng)典的Youtube 的 DNN雙塔模型,左側(cè)下班部分是用戶的各種Feature,通過(guò)embeding lookup 然后再pooling,最后把所有的特征做融合,過(guò)一個(gè)全連接層就輸出了User emedding;右邊則是感興趣的item,也會(huì)做embedding生成。最后要預(yù)測(cè)內(nèi)容:用戶在點(diǎn)擊了這么多 item 之后,下一個(gè)要點(diǎn)擊的 item,最后要預(yù)測(cè)的就是表達(dá)用戶興趣的 embedding。(每個(gè)域表示一個(gè)行為分布,例如電商下單行為、公眾號(hào)閱讀行為)

2)Look-alike learning(用戶相似性學(xué)習(xí))

用戶相似性學(xué)習(xí)

一個(gè)種子用戶需要包含的信息,可以先做假設(shè),種子用戶的表達(dá)= 共性信息+個(gè)性信息。

  • 每個(gè)用戶都有自己的興趣,但對(duì)整個(gè)群體的人群信息存在不同的貢獻(xiàn)度,我們稱為群體的共性信息:global info。共性信息和目標(biāo)用戶無(wú)關(guān),只和用戶群體自身有關(guān)。
  • 種子用戶群體的個(gè)性信息。種子群體中一定存在一小部分用戶和 target 用戶興趣相似,這時(shí),當(dāng) target 人群變化時(shí),信息會(huì)變化,稱為 local info。

獲取global info的用戶的embedding,首先用 global attention,只和 user 相關(guān),和 attention merge 的方法類似,也是一個(gè) self-attention。作用是把種子用戶乘以矩陣轉(zhuǎn)換,再乘以種子用戶自己,所做的就是捕捉用戶群體自身內(nèi)部的興趣分布。

local info呢,它的公式是把種子用戶的矩陣乘以 w,再乘以 target user 的 embedding,再做一層 softmax,再乘以種子用戶自己,這是一個(gè)典型的乘法 attention。它的作用是提取種子用戶群體中和 target user 相關(guān)的部分,捕獲種子用戶的 local info。是一個(gè)用公式得到的這兩種 local & global embedding 之后,進(jìn)行加權(quán)和,這就是種子用戶群體的全部信息。

2. 在線異步處理

在線異步處理架構(gòu)圖

離線訓(xùn)練結(jié)束后,是在線異步處理,主要作用是某些可以離線且和線上請(qǐng)求無(wú)關(guān)的計(jì)算,可以先計(jì)算完,如更新種子用戶。每個(gè) item 候選集都會(huì)對(duì)應(yīng)一個(gè)種子用戶列表,更新種子用戶列表,可以每一分鐘更新一次,這和訪問(wèn)用戶無(wú)關(guān),只和候選集的 item 有關(guān)。可以實(shí)時(shí)拉取用戶的點(diǎn)擊日志,更新點(diǎn)擊某個(gè)候選集的種子列表,保證種子用戶實(shí)時(shí)性。

  • 可以把 global embedding 預(yù)計(jì)算 ( gl 只和種子用戶有關(guān),是 self-attenion,可在線做異步處理,如每隔一分鐘算一次 )。
  • 計(jì)算 k-means 聚類中心,也是只和種子用戶有關(guān),可以提前計(jì)算好,如推到推薦系統(tǒng)內(nèi)存中。
  • 所有的東西都是定時(shí)更新,不需要線上實(shí)時(shí)計(jì)算。

3. 在線服務(wù)

在線服務(wù)說(shuō)明

線上把聚類中心、global embedding 和所有用戶的 embedding 都已緩存好,只需要拉取 user embedding,和候選集的 global embedding 和聚類中心。線上只需要計(jì)算 local embedding,是 target user 到種子用戶的 attention,這需要根據(jù)線上請(qǐng)求的 urn 來(lái)實(shí)時(shí)計(jì)算。再計(jì)算一次 cosine,就可以得到相似度,這個(gè)計(jì)算量很小。

4. 最后實(shí)驗(yàn)結(jié)果

在微信看一看上的實(shí)驗(yàn)結(jié)果

算出 look alike 相似度之后,相似度的分?jǐn)?shù),可直接給到排序服務(wù),做曝光依據(jù)。這是當(dāng)時(shí)原文作者寫論文之前做的在線計(jì)劃 AB testing結(jié)果,對(duì)比的是用戶畫像匹配推送的策略,上線之后,在擴(kuò)大曝光規(guī)模的前提下,CTR 基本正向穩(wěn)定+1.09%(說(shuō)明獲取到了更多相關(guān)性的流量),種類豐富性+8.435%,標(biāo)簽豐富多樣性+15.938%,說(shuō)明在擴(kuò)展過(guò)程中同時(shí)也獲得了更多多樣性展開(kāi)的流量。

二、關(guān)于look-alike定向策略總結(jié)與思考

Look-alike策略RALM模型的在微信看一看策略大體如上,整體上的思路從用戶興趣特征出發(fā),去探究用戶的個(gè)性興趣和人群共性興趣去探索種子人群的邊界,并且在上線實(shí)驗(yàn)中也取得了明顯的收益效果,通過(guò)離線+在線計(jì)算的方式保證了種子人群的實(shí)時(shí)性和效果。

業(yè)界還有非常多關(guān)于Look alike的論文,我在這里就不一一枚舉了,像是阿里媽媽目標(biāo)人群擴(kuò)展策略、網(wǎng)易云音樂(lè)種子人群擴(kuò)展策略等等。

和大家一起在策略產(chǎn)品道路上“日拱一卒,功不唐捐”,幫助你成為極具職場(chǎng)壁壘的策略產(chǎn)品,如果有幫助到大家歡迎點(diǎn)贊、收藏以及評(píng)論一下。

作者:策略產(chǎn)品Arthur,5年大廠策略產(chǎn)品專家。

本文由 @策略產(chǎn)品Arthur 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自 Unsplash,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!