從0到1搭建推薦策略產(chǎn)品的思考(一):策略產(chǎn)品的必要性和應(yīng)具備的條件

11 評(píng)論 14487 瀏覽 142 收藏 13 分鐘

過(guò)去的一年,一直在做策略相關(guān)的產(chǎn)品,很有意思的是,從0到1做的東西占了絕大部分工作成果。文章預(yù)計(jì)拆分為2~3篇,今天是第1篇,聊一下搭建策略產(chǎn)品的必要性以及應(yīng)具備的條件。

一、搭建推薦策略的必要性

在做一件事情之前先要問(wèn)問(wèn)為什么要做這個(gè)事情,這樣才能在整個(gè)實(shí)施的過(guò)程中游刃有余,有的放矢。

不過(guò),回答這個(gè)問(wèn)題之前需要對(duì)推薦系統(tǒng)有個(gè)總體的認(rèn)知。

1. 關(guān)于推薦系統(tǒng)

先大概回顧一下整個(gè)互聯(lián)網(wǎng)階段對(duì)信息處理的演變過(guò)程。隨著信息技術(shù)和互聯(lián)網(wǎng)的發(fā)展,一方面用戶足不出戶就可以得到的大多數(shù)的信息,但是另一方面卻逐漸受到很多無(wú)關(guān)信息的打擾,也就是信息過(guò)載。

為了解決信息過(guò)載的問(wèn)題,整個(gè)信息處理的過(guò)程大概經(jīng)過(guò)了三次演變:

第一次即以門(mén)戶網(wǎng)站為代表的分類(lèi)處理技術(shù)。通過(guò)對(duì)互聯(lián)網(wǎng)的信息,內(nèi)容進(jìn)行分類(lèi)處理,并且在用戶端進(jìn)行不同入口的展示,極大的方便了用戶根據(jù)類(lèi)別來(lái)篩選自己感興趣的內(nèi)容,極具代表性的就是各種門(mén)戶網(wǎng)站。但是隨著內(nèi)容越來(lái)越多,分類(lèi)也越來(lái)越多,太多的分類(lèi)對(duì)用戶來(lái)說(shuō)也造成了信息過(guò)載,隨著出現(xiàn)了第二次演變。

二次演變即以PC互聯(lián)網(wǎng)時(shí)代google,百度為代表的搜索引擎。用戶可以根據(jù)自己明確的目標(biāo)需求進(jìn)行關(guān)鍵詞查找,繁重的目標(biāo)內(nèi)容檢索工作交給了機(jī)器去處理,極大的提升了用戶信息查看的效率。不難發(fā)現(xiàn),搜索其實(shí)是解決了用戶在有明確目標(biāo)的情況下信息檢索需求。但是如果用戶沒(méi)有明確的目標(biāo)呢,這時(shí)候搜索引擎也無(wú)能為力。緊接著,第三次演變到來(lái)。

第三次演變即以移動(dòng)互聯(lián)網(wǎng)時(shí)代的個(gè)性化推薦,也即千人千面,每個(gè)人看到的都是單獨(dú)為其量身打造的內(nèi)容。和搜索引擎不一樣的是,即使用戶不主動(dòng)提供明確的需求,只要它在互聯(lián)網(wǎng)上發(fā)生過(guò)相關(guān)的行為,那么推薦就可以給到用戶最為感興趣的內(nèi)容。

簡(jiǎn)單來(lái)說(shuō),根據(jù)用戶的歷史行為進(jìn)行用戶興趣建模,結(jié)合內(nèi)容的特征,給到用戶最能滿足其興趣和需求的內(nèi)容,即推薦。

而推薦策略解決的問(wèn)題就是如何能夠推薦出讓用戶滿意,讓業(yè)務(wù)受益的內(nèi)容。

當(dāng)然,這里的內(nèi)容(一般稱之為item)不限其具體的形態(tài),可以是商品,可以是文章,可以是服務(wù)等等。

2. 什么業(yè)務(wù)適合做推薦策略

了解推薦的概念之后,到底哪些業(yè)務(wù),哪些場(chǎng)景非常適合去做推薦系統(tǒng),或者說(shuō)應(yīng)該去做推薦策略呢?

這個(gè)也是我一直思考的問(wèn)題,總結(jié)了以下幾點(diǎn):

(1)有海量的內(nèi)容

推薦系統(tǒng)的初衷就是從海量的item當(dāng)中選出用戶最感興趣的,所以首先要有海量的item,數(shù)量不足,就無(wú)所謂選擇了。

另一方面,從策略的角度來(lái)講,一個(gè)策略從誕生,到上線,再到驗(yàn)證,整個(gè)過(guò)程都需要海量的數(shù)據(jù)參與,比如:item?feature提取,模型訓(xùn)練,指標(biāo)驗(yàn)證等等,海量的數(shù)據(jù)能夠確保整個(gè)過(guò)程的準(zhǔn)確性、可行性和科學(xué)性。

(2)有海量的用戶

這個(gè)其實(shí)和海量的內(nèi)容是相輔相成的。因?yàn)橥扑]策略本身就是來(lái)鏈接用戶和內(nèi)容的,所以從這個(gè)角度來(lái)講的話,有海量?jī)?nèi)容,就需要有海量的用戶與之對(duì)應(yīng),否則策略是不靠譜的。

從另一個(gè)角度來(lái)講,推薦策略本身是為了提高流量的利用效率,這種利用效率可以體現(xiàn)為轉(zhuǎn)化率,UV價(jià)值,RPM,GMV等具體指標(biāo),需要大量的數(shù)據(jù)進(jìn)行驗(yàn)證,否則就沒(méi)有意義。

因此,如果業(yè)務(wù)還在發(fā)展初期,并沒(méi)有多少用戶,那從產(chǎn)品目標(biāo)本身角度來(lái)講,這個(gè)時(shí)候應(yīng)該主要是以流量導(dǎo)向,而推薦策略并不占據(jù)很重要的優(yōu)先級(jí)。

(3)非工具類(lèi)業(yè)務(wù)

工具類(lèi)業(yè)務(wù)從其誕生一定會(huì)有一個(gè)明確的目標(biāo),對(duì)應(yīng)的用戶也有非常明確的需求,所以對(duì)于這種業(yè)務(wù)一般不會(huì)去推薦其他同類(lèi)內(nèi)容了,當(dāng)然需要區(qū)別一下資源位和推薦。

一般來(lái)說(shuō),目前應(yīng)用推薦策略比較多的領(lǐng)域包括:電商、視頻、音樂(lè)、閱讀、社區(qū)、社交、廣告、基于位置的服務(wù)等。

(4)用戶逛的場(chǎng)景居多

目前用戶碎片化的時(shí)間越來(lái)越多,用來(lái)在產(chǎn)品上“閑逛”的時(shí)間也就越多,但是,與之對(duì)應(yīng)的是同質(zhì)化的產(chǎn)品也越來(lái)越多,在爭(zhēng)取用戶注意力這條道路上,能夠基于用戶的而歷史行為,去實(shí)時(shí),精準(zhǔn)的推薦用戶感興趣的內(nèi)容可能是一種最為高效的方式。

個(gè)性化推薦目前已經(jīng)成為了一種新的趨勢(shì),每一個(gè)產(chǎn)品基本必備一個(gè)BI模塊。不過(guò),是否值得投入很大的資源去做一個(gè)看似高大上的推薦系統(tǒng),還是需要好好考慮一下的。

二、搭建策略產(chǎn)品需要哪些條件

下面有些內(nèi)容在之前的文章里面提到過(guò):這一年,我做策略產(chǎn)品遇到的坑,在一個(gè)業(yè)務(wù)線搭建推薦策略產(chǎn)品時(shí),需要先看看如下條件是否滿足:

1. 結(jié)構(gòu)化數(shù)據(jù)是否必備

現(xiàn)在產(chǎn)品人經(jīng)常講的數(shù)據(jù)驅(qū)動(dòng),我覺(jué)得更全面的說(shuō)是結(jié)構(gòu)化數(shù)據(jù)驅(qū)動(dòng)。因?yàn)樘幚韥y七八糟的數(shù)據(jù)是一種很糟(dan)糕(teng)的經(jīng)歷。

關(guān)于結(jié)構(gòu)化數(shù)據(jù)的定義可以看之前的文章。對(duì)于搭建策略產(chǎn)品而言,主要看三個(gè):

(1)產(chǎn)品埋點(diǎn)是否完備

埋點(diǎn)是唯一能夠準(zhǔn)確,實(shí)時(shí)的采集到線上用戶行為的手段,而對(duì)于鏈接用戶和物品信息的推薦產(chǎn)品來(lái)說(shuō),用戶行為的重要性就不言而喻了。

(2)埋點(diǎn)數(shù)據(jù)是否存儲(chǔ)

對(duì)于數(shù)據(jù)來(lái)說(shuō),埋點(diǎn)僅僅解決了線上是否有采集工具的問(wèn)題,至于是否能夠真正發(fā)揮其數(shù)據(jù)價(jià)值還需要看這些數(shù)據(jù)是否被存儲(chǔ)下來(lái)。

就類(lèi)似城市攝像頭,如果僅僅布置了一個(gè)可以實(shí)時(shí)顯示當(dāng)前區(qū)域內(nèi)景象的工具,其實(shí)對(duì)于城市建設(shè)沒(méi)有任何用處。

在我們之前的一次實(shí)施的過(guò)程中就遇到過(guò)類(lèi)似的問(wèn)題。uuid(用戶設(shè)備編號(hào))本身各種日志是有記錄的,但是數(shù)據(jù)表中卻沒(méi)有把這個(gè)字段存下來(lái),導(dǎo)致無(wú)法直接使用,如果進(jìn)行表結(jié)構(gòu)改動(dòng),做研發(fā)的同學(xué)應(yīng)該知道,這個(gè)工程量和復(fù)雜量絕對(duì)不小。

(3)數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)是否合理

最后一個(gè)就是關(guān)于存儲(chǔ)結(jié)構(gòu)的問(wèn)題,主要是指數(shù)據(jù)表結(jié)構(gòu)設(shè)計(jì)的是否合理。

我見(jiàn)過(guò)很多業(yè)務(wù)線的后臺(tái)數(shù)據(jù)的表結(jié)構(gòu)就是按需建表,沒(méi)有一個(gè)統(tǒng)一的規(guī)劃,就類(lèi)似一個(gè)大的房子,沒(méi)有提前做統(tǒng)一規(guī)劃,而是按照各自需要進(jìn)行分割,結(jié)果可想而知。

最主要的額影響就是在搭建系統(tǒng)過(guò)程中,表結(jié)構(gòu)需要不停的進(jìn)行整合,重建,本來(lái)三天可以進(jìn)行入方案開(kāi)發(fā),會(huì)延期一周甚至更長(zhǎng)時(shí)間用來(lái)處理這些問(wèn)題。

一個(gè)不合理的數(shù)據(jù)庫(kù)設(shè)計(jì),會(huì)導(dǎo)致工程效率低下。

這些都是我親身經(jīng)歷過(guò)的事情??梢哉f(shuō)以上三點(diǎn),直接決定了一個(gè)業(yè)務(wù)線是否能夠搭建推薦策略產(chǎn)品。

還是那句話:底層數(shù)據(jù)各種屬性不全,最好的規(guī)則也白搭。

引以為戒。

總之,結(jié)構(gòu)化的數(shù)據(jù)對(duì)于推薦策略產(chǎn)品的搭建主要有兩個(gè)作用:

  • 一是用于用戶行為feature的建立用于推薦結(jié)果的召回,比如:點(diǎn)擊行為、關(guān)注行為、加購(gòu)行為、下單行為等;
  • 另一方面是用于對(duì)推薦效果的驗(yàn)證,主要是通過(guò)線上埋點(diǎn)采集數(shù)據(jù),進(jìn)行計(jì)算相關(guān)指標(biāo)進(jìn)行推薦效果檢驗(yàn)。

另外再說(shuō)一下我關(guān)于數(shù)據(jù)驅(qū)動(dòng)的理解:目前的數(shù)據(jù)驅(qū)動(dòng)其實(shí)大多數(shù)停留在數(shù)據(jù)佐證,人驅(qū)動(dòng)上面,換句話說(shuō)大多數(shù)情況下把數(shù)據(jù)當(dāng)做一種工具,用來(lái)證實(shí)或證偽,然后人再去做相應(yīng)的決策。

我理解真正的數(shù)據(jù)驅(qū)動(dòng)應(yīng)該在用戶進(jìn)來(lái)的那一刻開(kāi)始,數(shù)據(jù)工程就開(kāi)始運(yùn)作,來(lái)決定給用戶展示什么,怎么展示,怎么引導(dǎo)。

2. 是否有較好的應(yīng)用場(chǎng)景

前面也提到了,不是所有的業(yè)務(wù)都適合做推薦策略產(chǎn)品,其實(shí)最主要是要看這個(gè)業(yè)務(wù)線當(dāng)中是否有比較好的應(yīng)用場(chǎng)景進(jìn)行支持。

通常來(lái)說(shuō),我覺(jué)得有兩種場(chǎng)景是可以用推薦系統(tǒng)進(jìn)行滿足的:

第一種:更加高效滿足用戶需求。

比如同樣對(duì)于筆記本這種產(chǎn)品,當(dāng)我們還無(wú)法感知用戶對(duì)品牌,配置需求的時(shí)候,可以按照商品本身各維度進(jìn)行推薦(物品單邊特征),爭(zhēng)取把性價(jià)比最高,品質(zhì)最好的產(chǎn)品推薦給用戶,逐步引導(dǎo)用戶產(chǎn)生消費(fèi)行為。

這種場(chǎng)景通??梢苑Q作是“千人一面”的場(chǎng)景,就是把業(yè)務(wù)內(nèi)最“好”的東西展示給用戶,這個(gè)“好”的定義隨業(yè)務(wù)線的不同而不同。

另一種:滿足用戶的個(gè)性化需求。

當(dāng)我們掌握大量了用戶行為數(shù)據(jù)的時(shí)候,就可以大概知道一個(gè)用戶是什么樣的,比如他喜歡的品類(lèi),能夠承受的價(jià)格等等,從而去建立他的標(biāo)簽?zāi)P?,依?jù)該模型即可進(jìn)行個(gè)性化推薦了。

這種場(chǎng)景通??梢猿蔀椤扒饲妗眻?chǎng)景,典型的淘寶首頁(yè)就是按照這種場(chǎng)景進(jìn)行搭建,所以,現(xiàn)在一般不叫淘寶購(gòu)物,而叫“逛”淘寶,這種“逛”的背后就是數(shù)據(jù)決策的驅(qū)動(dòng)。

其實(shí)不難發(fā)現(xiàn),對(duì)于不明確用戶目標(biāo)的情況下,推薦有助于高效,精準(zhǔn)的給到用戶最滿意的物品,是這種場(chǎng)景下的不二之選。

以上。

這篇主要講了關(guān)于搭建推薦策略的必要性以及需要具備的相關(guān)條件,下一篇會(huì)具體復(fù)盤(pán)一下整個(gè)搭建過(guò)程的步驟。

 

作者:夏唬人,公眾號(hào):夏唬人,某廠策略產(chǎn)品經(jīng)理

本文由 @夏唬人 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自?Unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 回復(fù)是不能帶圖片,可以帶表情嗎?

    回復(fù)
    1. 回復(fù)是不能帶圖片,可以帶表情嗎?

      回復(fù)
  2. 寫(xiě)的啥啊,看都看不明白想說(shuō)的是什么

    來(lái)自廣東 回復(fù)
    1. 看標(biāo)題。如果還看不明白的話,那就不用再看了

      來(lái)自北京 回復(fù)
    2. 你覺(jué)得你寫(xiě)的文章跟標(biāo)題相符么?

      來(lái)自廣東 回復(fù)
    3. 那你質(zhì)疑社區(qū)審核人水平咯?那你問(wèn)小編去,你在這刷什么存在感

      來(lái)自北京 回復(fù)
    4. 那必須要刷 你管我么?

      來(lái)自廣東 回復(fù)
    5. 有這點(diǎn)時(shí)間提高一下你的水平,別用這種無(wú)賴手段,漲粉無(wú)望也別狗急跳墻 :mrgreen:

      來(lái)自北京 回復(fù)
    6. 哈哈哈 笑死我了 你的水平居然來(lái)嘲諷我 哪來(lái)的自信 同學(xué)?我根本不需要漲粉知道么?算了 跟你BB挺浪費(fèi)時(shí)間的 回見(jiàn)

      來(lái)自廣東 回復(fù)
    7. 不就是個(gè)賣(mài)課的么,不見(jiàn)??!

      來(lái)自北京 回復(fù)
  3. 受益了。多謝題主。期待2-3篇的后序

    回復(fù)