搜推策略產(chǎn)品十做十不做
搜索推薦到底該怎么做呢?是要照著老板說的做,還是根據(jù)用戶反饋?zhàn)??本文作者總結(jié)了搜推策略產(chǎn)品的十做十不做,并對(duì)其中的三點(diǎn)進(jìn)行了分析,一起來看一下吧。
搜索推薦到底怎么做?按老板說的做,照競(jìng)品抄,根據(jù)用戶反饋?zhàn)?、通過數(shù)據(jù)分析做?8年京東、美團(tuán)搜推經(jīng)驗(yàn),建議大家那些該做,那些不該做的,搜推策略產(chǎn)品十做十不做,但要根據(jù)具體情況定。
01 硬加權(quán)不做,但柔性智能化流量調(diào)控要做
什么叫硬加權(quán),就是給某個(gè)商品的排序直接從后面提到前面,這個(gè)叫硬加權(quán)。比如有運(yùn)營(yíng)來找你,說我這個(gè)東西這么好,怎么排序靠后呢,你得給我加權(quán)呀、或者是某個(gè)業(yè)務(wù)找到你,說我這個(gè)業(yè)務(wù)是今年公司重點(diǎn),但流量不足呀,你得加權(quán)呀……
為什么不能硬加權(quán),硬加權(quán)損效率呀!為什么損效率呀,用點(diǎn)黑話,是因?yàn)橛脩舨籅uy in呀,就是用戶不點(diǎn)呀!
那為什么柔性智能化流量調(diào)控可以做呢?這有幾個(gè)關(guān)鍵點(diǎn),一個(gè)是前置的篩選分層,如果是電商就是精細(xì)化選品,看哪些品是預(yù)期可以多獲得一些流量,也能承接得住的。
比如阿里今年雙11出了一個(gè)價(jià)格力加權(quán),就是你這個(gè)商品優(yōu)惠力度大,我可以多給你流量;再比如阿里的優(yōu)質(zhì)商家商品流量加權(quán),也是說這個(gè)商品有一定的潛力,我多給他一些流量,應(yīng)該也能承接的?。贿€有就是中間的賽馬機(jī)制,效率好的晉升,效率差的汰換,同時(shí)要有運(yùn)營(yíng)診斷指導(dǎo),為什么效率差,商品價(jià)格高、沒什么評(píng)論積累、主圖標(biāo)題不清晰等。
當(dāng)然還有很多,不一一展開說了。還有一個(gè)重要的點(diǎn)是,對(duì)于協(xié)同部門要疏不是堵,就是你給他提供抓手,可以讓他有玩的東西,然后一點(diǎn)一點(diǎn)有軼序地玩。
02 亂七八糟標(biāo)簽不用做,但用戶商品基礎(chǔ)標(biāo)簽、營(yíng)銷標(biāo)簽、人群節(jié)日標(biāo)簽要做
什么叫亂七八糟的標(biāo)簽?就是一提起推薦,大家就說你是基于那些標(biāo)簽推薦的, 我們能不能在商品或內(nèi)容上打些標(biāo)簽,然后你們用呀?我們之前打的標(biāo)簽?zāi)銈冇昧藛?,效果怎么樣?你看我們還需要打什么標(biāo)簽……這里說明下,標(biāo)簽對(duì)于推薦來講是重要的,但不是最重要的,尤其是在大數(shù)據(jù)量的情況下。所以,不要提到推薦,大家就認(rèn)為標(biāo)簽做好了,推薦就做好了,推薦沒做好,就是標(biāo)簽沒做好。
1. 推薦原理
回答什么是亂七八糟標(biāo)簽前,我先基于我的理解給大家科普下推薦原理。其實(shí)這也不能怪大家,早期推薦技術(shù)也沒那么先進(jìn),然后數(shù)據(jù)量可能也不多,所以,大家就冷啟的時(shí)候讓你選興趣點(diǎn)標(biāo)簽,推薦的時(shí)候根據(jù)文本標(biāo)簽推薦,模型上也是LR、GBDT一類的。
這就讓沒搞過搜推的人覺得,啊,推薦就是標(biāo)簽推薦,但他不知道,現(xiàn)在都是DNN了,都是基于用戶行為推薦,基于I2I推薦,基于KNN,基于Embedding、Vector推薦,只有個(gè)別情況下,數(shù)據(jù)挖掘不到的,才會(huì)通過早期的文本標(biāo)簽做召回推薦。
舉些例子吧,要不然,這么說,懂的人懂,不懂的人還是覺得推薦就是標(biāo)簽推薦,推薦沒做好,就是沒標(biāo)簽,或者標(biāo)簽不準(zhǔn),或者標(biāo)簽用得不好……那以電商為例,基本可以通過共購買,共點(diǎn)擊等數(shù)據(jù)挖掘到相似或相關(guān)的商品。
比如你點(diǎn)擊了小米的手機(jī),那可能會(huì)推薦給你華為的手機(jī),因?yàn)楹芏嗳它c(diǎn)了小米后,也會(huì)點(diǎn)華為,甚至最后還購買了華為,這么說還是籠統(tǒng),更細(xì)節(jié)是你點(diǎn)的是小米支持5G的,8G+512G內(nèi)存+存儲(chǔ)的、5英寸的、雙攝的……那算法就通過大數(shù)據(jù)幫你找到的是華為P40\P50,而不會(huì)找到Nokia。
那你這例子不還是說推薦就是基于標(biāo)簽推薦的嗎?這里其實(shí)又涉及到了算法可解釋的問題,通常業(yè)務(wù)會(huì)問,你這排序的邏輯是什么,為什么這么排,為什么這個(gè)排前面,那個(gè)排在后面?你看給我推了這個(gè),你看我是這樣的用戶,我年薪百萬,怎么不給我推那個(gè)?你這個(gè)推的多Low呀,一點(diǎn)都不高端……那算法同學(xué)呢,一般的回答就是,呃,這是算法推薦的,是DNN深度學(xué)習(xí)的,是黑盒的,是不可解釋的,我們也不知道為什么這么推;產(chǎn)品經(jīng)理呢一般會(huì)說:啊,你點(diǎn)過這些吧,這是根據(jù)你的行為和畫像推薦的。
2. 模型可解釋
我先撈干的,理論上DNN深度神經(jīng)網(wǎng)絡(luò)是不可解釋的,不像GBDT的樹模型那樣是可解釋的,這說的是從模型的角度,什么Feature Important角度是不可解釋的。但實(shí)際上任何模型也都是可解釋的,因?yàn)槿说倪x擇是可解釋的,人的購物決策和瀏覽內(nèi)容的偏好是可解釋的,只不過是你要根據(jù)不同人、不同時(shí)間、不同地點(diǎn)、不同場(chǎng)景、不同……太多了,這樣就不好解釋了,而且你還是要解釋給不了解算法的人。
那這就變成,本來是可解釋的也解釋不清楚了,或者解釋清楚了也聽不清楚……大部分情況下,排序就兩種結(jié)果:有用戶行為的非新用戶就是點(diǎn)什么推什么,無行為的新用戶就是熱門推薦。
就像行業(yè)里的頭條、抖音、快手什么的,早期甚至現(xiàn)在都是你第一次打開就是美女、時(shí)效熱點(diǎn)事件、當(dāng)?shù)靥厣珒?nèi)容等;然后你就一直看,算法就認(rèn)為你喜歡,就一直找相似的推;然后你美味佳肴吃夠了,偶爾也想來點(diǎn)粗糧,這時(shí)你就劃掉那些美女了,或者自己搜索點(diǎn)什么,那算法就認(rèn)為你喜歡上其他內(nèi)容了,那就幫你找新的相似的內(nèi)容。
但這些說的都是表面哈,我來講點(diǎn)深度的。其實(shí)算法里有個(gè)概念叫特征,特征是什么呢?就是能表達(dá)這個(gè)商品或者內(nèi)容好壞的東西,其實(shí)就像“白、富、美”就是表達(dá)一個(gè)女人的特征。那算法里一般用什么特征呢,比如內(nèi)容類關(guān)鍵的就是點(diǎn)擊量、點(diǎn)贊量、評(píng)論數(shù)、點(diǎn)擊率、完播率、停留時(shí)長(zhǎng)、好評(píng)率……然后這些特征呢,還有周期,比如7天點(diǎn)擊量、3天點(diǎn)擊量、1小時(shí)點(diǎn)擊量等。好這樣估計(jì)有些人能理解推薦一些了。
03 為了多樣性而做的多樣性不做,但基于人群、用戶行為、時(shí)令節(jié)日、空間等變化的多樣性要做
1. 什么是多樣性
一般推薦結(jié)果的多樣性就是,連續(xù)Top N個(gè)結(jié)果是不同的,不同的維度一般是類目維度。這個(gè)是通俗的定義,如果要科學(xué)定義的話,其實(shí)是通過基尼系數(shù)、熵等來衡量的。
這里再多說一些多樣性,僅是類目維度的多樣性還不夠,有些場(chǎng)景下需要下分到二、三、四級(jí)類、甚至是詞維度,同時(shí)還可以根據(jù)圖片、價(jià)格、商家、品牌、屬性、作者等等很多維度不同的多樣性。那大家如何理解多樣性的呢?這里就會(huì)根據(jù)不同的屁股、不同的認(rèn)知來理解了,抽象地講沒有感覺,我舉些例子,做為推薦產(chǎn)品經(jīng)理遇到比較多的情況應(yīng)該是:
1)老板覺得多樣性不夠
這里多吐槽一下,在互聯(lián)網(wǎng)公司推崇扁平化、去官僚化的情況下,做為一個(gè)底層人員,仍然要面對(duì)很多層級(jí)的老板,而且這些老板們的想法還都不一樣,想法不一樣也就算了,關(guān)鍵是他們還不聽一線人員的方案。一般打仗是在前線的人員,最清楚狀況,最知道怎么打,且將在外,軍令可有所不從,但你在互聯(lián)網(wǎng)公司,你要敢不從,那你就等著走人吧。
那老板們都如何理解多樣性呢,比如甲老板會(huì)說,這怎么每天都給我推差不多的內(nèi)容,我們平臺(tái)上不是有很多內(nèi)容嗎,我們那個(gè)主推的怎么沒看見;乙老板會(huì)說,一樣的內(nèi)容推得太多了;丙老板會(huì)說我在其他平臺(tái)上看到的內(nèi)容,咱們這怎么沒推呢……
2)業(yè)務(wù)覺得多樣性不夠
業(yè)務(wù)經(jīng)常是說,怎么沒有我們品類的內(nèi)容呢,怎么都是那個(gè)品類的內(nèi)容呢?
3)用戶覺得多樣性不夠
很多用戶是不愿意反饋的,一般也就反饋點(diǎn)什么推什么、看過買過還推。
2. 如何做多樣性
前面雖然提到了什么叫多樣性,但不夠具體,所以,在如何做前,還是要定義清楚什么是多樣性,做到什么樣,大家能滿意。這里先說那些不是多樣性不夠:
1)不區(qū)分場(chǎng)景的多樣性不是多樣性問題
老板們不分任何時(shí)候,都想要多樣性,這里有一個(gè)經(jīng)典的場(chǎng)景,比如某個(gè)用戶此刻想買個(gè)冰箱,或者是想了解某個(gè)事件,這時(shí)你非要為了多樣性,再給他推薦個(gè)洗衣機(jī)、電視,雖然都是家裝三件套,但這個(gè)用戶可能不是新裝修呀,有可能就是想換個(gè)冰箱,或者是給家里人買、或者是放到租房的地方,反正他不缺電視。
那你說想買上衣的時(shí)候,推薦褲子可以吧,這個(gè)場(chǎng)景看似成立,但不是適合所有用戶;那這種跨品類的,組合式的推薦什么時(shí)候成立呢,這個(gè)要根據(jù)每個(gè)用戶的意圖強(qiáng)弱,行為豐富度等來動(dòng)態(tài)判斷。比如用戶就是逛,就是什么都點(diǎn),那基本上,你的推薦就可以發(fā)散一些,否則,有明確意圖的,你就要幫他收斂,快速幫他找到他想要的,可能是他有一個(gè)價(jià)格心理,或者是一個(gè)屬性風(fēng)格的心理。
2)行為與意圖茅盾的不是多樣性問題
什么意思呢?就是經(jīng)常有些內(nèi)部的人,他不是想看真的內(nèi)容或者購買那個(gè)東西,而是沒有目的地亂點(diǎn)、亂看,點(diǎn)著點(diǎn)著,自己也忘了都點(diǎn)過什么,然后算法基本會(huì)基于你最近的點(diǎn)擊等行為進(jìn)行推薦。且由于算法貪心的Point wise模式,推薦的內(nèi)容確實(shí)會(huì)是相似的多,這樣就會(huì)造成錯(cuò)覺,怎么給我推的內(nèi)容都差不多?
這里的差不多,就是上面說的,算法會(huì)基于行為推薦類目相似、價(jià)格相似等的內(nèi)容,但老板要看到的是不同價(jià)格段的都來點(diǎn),或者其他想法,反正是有自己的想法。有時(shí)能代表用戶,但更多時(shí)候是參雜著自己的意愿,以及平臺(tái)的導(dǎo)向。
比如也會(huì)說咱們平臺(tái)不是還有很多內(nèi)容嗎,這里其實(shí)你可以建議你的老板去內(nèi)容庫或者商品庫里看全部?jī)?nèi)容,推薦算法不可能把全部分類都推出來,那和過去的貨架式、陳列式?jīng)]什么區(qū)別了。
我們繼續(xù)說多樣性如何做。做之前呢,要知道目標(biāo),做到什么標(biāo)準(zhǔn)算好,那這里基本上是需要定量和定性去衡量的,比如定量上要提升瀏覽深度、CTR、停留時(shí)長(zhǎng)、不同品類的曝光占比等,不同業(yè)務(wù)可能不太一樣,定性上是否明顯的Badcase在減少等。
有了衡量標(biāo)準(zhǔn)后,就是具體策略了,這個(gè)策略也要從多層進(jìn)行制定,基本上推薦要想優(yōu)化一個(gè)問題,都是要全方面的調(diào)整,不可能有一個(gè)大招,就解決所有問題,那一般都是從數(shù)據(jù)、召回、排序、交互上去優(yōu)化:
1)數(shù)據(jù)
數(shù)據(jù)這不多說了,核心是三點(diǎn),數(shù)據(jù)要全面、準(zhǔn)確、實(shí)時(shí);你要搞清楚人的畫像和商品內(nèi)容的畫像,要不然無法進(jìn)行準(zhǔn)確的召回和匹配。
2)召回
這里要多說一點(diǎn),召回源是推薦最重要的部分,如果你只有一路相似召回,那你就沒法做多樣性。至少要按人群、時(shí)間、空間、場(chǎng)景等維度進(jìn)行差異化的召回,比如新人召回?zé)徜N、或者基于CF的召回;非新更多是基于用戶行為的相似相關(guān)召回。
還有些人會(huì)深度將人群分得更細(xì),比如阿里的八大人群。從時(shí)間上會(huì)基于平日、季節(jié)、節(jié)日、大促、熱點(diǎn)、上新等進(jìn)行召回;從空間上會(huì)基于LBS召回;場(chǎng)景上則會(huì)比較多,比如是用戶動(dòng)線購前、中、后等,用戶需求的具體場(chǎng)景,比如辦年貨、吃火鍋等。除了這些召回外,還有一些更偏算法的,比如KNN,KG,Base Model CF。
3)排序
這里和多樣性相關(guān)的應(yīng)該是模型由Point wise調(diào)整為L(zhǎng)ist Wise,以及通過MMR等進(jìn)行打散的排序,還可能加入一些硬規(guī)則的M出N的排序,然后EE和生態(tài)排序也可以算到這里。
4)交互
這里最重要的是,要實(shí)時(shí)捕捉用戶的正負(fù)反饋,根據(jù)正反饋加強(qiáng)推薦,根據(jù)負(fù)反饋削弱推薦;同時(shí)要在產(chǎn)品交互形態(tài)上做到動(dòng)態(tài)交互,既用戶點(diǎn)擊某個(gè)Item后回到列表頁時(shí),下一個(gè)如何進(jìn)行動(dòng)態(tài)的推薦;以及用戶翻頁時(shí),要進(jìn)行重新推薦,這里有些會(huì)使用端智能,但感覺端智能還是提升有限,最好還是進(jìn)行服務(wù)端重新的推薦。
總結(jié)一下多樣性的要點(diǎn):
- 用戶意圖非常明確收斂時(shí),不要做大力度的多樣性;
- 用戶意圖發(fā)散時(shí),要加強(qiáng)多樣性;
- 要合邏輯地做多樣性,不要為了多樣性而多樣性;
04 其他
個(gè)人觀點(diǎn)的體感不做,但大多數(shù)人的用戶體驗(yàn),敏感商品屏蔽等要做;
拍腦袋的功能不做,但通過數(shù)據(jù)分析、行業(yè)調(diào)研、ROI高的要先AB實(shí)驗(yàn)做;
前端樣式變來變?nèi)サ牟呗援a(chǎn)品不做,但分人群等個(gè)性化的UE及方案等要做;
天天干預(yù)配置的運(yùn)營(yíng)、策略產(chǎn)品不做,但要提供工具給產(chǎn)品運(yùn)營(yíng)用;
天天幫研發(fā)找表、跑數(shù)的保姆不做,但跨部門協(xié)調(diào)、數(shù)據(jù)分析等要做;
左手導(dǎo)右手的不做,但如果能形成全局效率最大化的要做;
人情類的需求不做,但為了生存有選擇性地做。
以上為個(gè)人觀點(diǎn),不代表任何機(jī)構(gòu)。
本文由 @元?dú)?原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
很有啟發(fā),十分感謝
搜索推薦最終還是要根據(jù)用戶反饋來做的,同時(shí)也要根據(jù)實(shí)際需求適時(shí)調(diào)整