數(shù)據(jù)運(yùn)營(yíng)實(shí)操案例:信息流feeds產(chǎn)品優(yōu)化

3 評(píng)論 7763 瀏覽 57 收藏 16 分鐘

編輯導(dǎo)讀:本文作者帶領(lǐng)大家對(duì)信息流的基礎(chǔ)推薦引擎和影響因子有了初步了解,并通過(guò)信息流feeds數(shù)據(jù)運(yùn)營(yíng)中的一個(gè)實(shí)際案例梳理總結(jié)了數(shù)據(jù)運(yùn)營(yíng)的價(jià)值,供大家一共學(xué)習(xí)和參考。

一、信息流引言

信息流(Feeds)的形態(tài)已經(jīng)近乎無(wú)所不在,貫穿在我們24小時(shí)的互聯(lián)網(wǎng)生活的當(dāng)中。當(dāng)你通勤時(shí)在地鐵刷刷今日頭條了解最新資訊,信息流已經(jīng)把一篇篇時(shí)事熱文整齊地排成隊(duì)列等待你的閱讀;當(dāng)你想要好好美餐一頓,大眾點(diǎn)評(píng)的信息流給你“種草”了不少同城餐廳;夜不能寐想剁手來(lái)犒勞下辛苦工作一天的自己,淘寶上琳瑯滿目的推薦商品流怎么那么精準(zhǔn),刷得停不下來(lái)……

盡管信息流這種形態(tài)已經(jīng)廣泛應(yīng)用,但其實(shí)最早的應(yīng)用是在資訊內(nèi)容場(chǎng)景,始于Facebook在2006年發(fā)布的資訊信息流(News Feed)功能。

平臺(tái)通過(guò)既定的算法、規(guī)則排序后聚合內(nèi)容,用戶可以在單頁(yè)面內(nèi)進(jìn)行流暢而高效的內(nèi)容消費(fèi)。用戶不再需要如移動(dòng)互動(dòng)網(wǎng)史前時(shí)代那樣,在門戶網(wǎng)站、博客站點(diǎn)之間進(jìn)行頻繁地跳轉(zhuǎn);平臺(tái)也通過(guò)提供聚合的內(nèi)容展示平臺(tái),更高效地把用戶留在了自己的轄區(qū)內(nèi)。

信息流的英文是“Feed”,實(shí)在是用得很妙的一詞了。Feed在英文里是“喂養(yǎng)”的意思,生動(dòng)地刻畫了信息流場(chǎng)景里,用戶被平臺(tái)按一定的順序“投喂”內(nèi)容的場(chǎng)景。

用戶消費(fèi)的內(nèi)容時(shí)間是有限的,平臺(tái)如何在有限的時(shí)間內(nèi),給用戶投喂TA最喜歡消費(fèi)的內(nèi)容、從而讓TA在平臺(tái)消費(fèi)更多的內(nèi)容(從而給平臺(tái)帶來(lái)更高的潛在商業(yè)價(jià)值),就是所有Feed場(chǎng)景運(yùn)營(yíng)人員經(jīng)年累月在不斷鉆研的“推薦排序”問(wèn)題了。

二、信息流的基礎(chǔ):推薦引擎

推薦引擎的核心,是“如何把合適的物品推薦給合適的用戶”,所以“物品”和“用戶”之間聯(lián)系的建立,是推薦算法里最核心的命題。整個(gè)推薦的過(guò)程基本可以總結(jié)為“召回”→“排序”→“調(diào)權(quán)”→“輸出結(jié)果”的過(guò)程,對(duì)這個(gè)過(guò)程進(jìn)行一個(gè)簡(jiǎn)單的比喻,來(lái)幫助大家理解這個(gè)過(guò)程。

大家應(yīng)該都曾經(jīng)在學(xué)生時(shí)代參加過(guò)軍訓(xùn),軍訓(xùn)最后的分列式檢閱是整個(gè)軍訓(xùn)過(guò)程的高光時(shí)刻。那該如何對(duì)隊(duì)列進(jìn)行合理的排布呢?

  • 首先,教官會(huì)需要先“召回”A班的所有學(xué)生來(lái)到操場(chǎng)上,等待進(jìn)行排列,只能是A班的學(xué)生,其他B、C班的同學(xué)先不需要參與;
  • 緊接著,教官會(huì)要求同學(xué)們按從高到矮的規(guī)則進(jìn)行“排序”,這樣隊(duì)伍看起來(lái)就不會(huì)參差不齊;這時(shí),雖然同學(xué)們已經(jīng)按從高到矮排好了,但可能有個(gè)別學(xué)生匯演時(shí)需要在軍樂(lè)團(tuán)做演奏,教官就需要對(duì)這些學(xué)生進(jìn)行“調(diào)權(quán)”,把他們排除在外;
  • 最后,按這樣的規(guī)則排列下來(lái)的隊(duì)伍,就是最后匯演時(shí)A班的隊(duì)伍排布了。

推薦算法是一門頗深的學(xué)問(wèn),技術(shù)性也很強(qiáng),但因?yàn)楸緯嫦虻淖x者主要是運(yùn)營(yíng)人員,所以筆者嘗試從更顯性的層面總結(jié)如今影響信息流排序的主要影響因子:

  • 時(shí)間因子。時(shí)間是比較基礎(chǔ)的一個(gè)排序影響因子,很多內(nèi)容產(chǎn)品最初都以時(shí)間為第一排序因子,比如公眾號(hào)最初則是完全的時(shí)間排序。但隨著內(nèi)容不斷增多,如何利用推薦算法幫助用戶找到其最關(guān)注的內(nèi)容,則是其他因子的命題。
  • 用戶畫像因子。這個(gè)因子的假設(shè)前提很直觀,“蘿卜青菜,各有所愛(ài)”。雖然我們常說(shuō)不能把人“標(biāo)簽化”,但對(duì)于算法來(lái)說(shuō)的確只有“標(biāo)簽化”才能更好地認(rèn)識(shí)一個(gè)人。打個(gè)比方,如果你有“互聯(lián)網(wǎng)從業(yè)人員”的標(biāo)簽,那給你推薦的內(nèi)容自然會(huì)更多地傾向于互聯(lián)網(wǎng)行業(yè)資訊、科技新動(dòng)向等;如果你有“孕期媽媽”的標(biāo)簽,那給你推薦的內(nèi)容也會(huì)有更多育兒類資訊。
  • 興趣因子。同樣是對(duì)人的理解,用戶畫像更多關(guān)注的是人的“屬性”,興趣則更多關(guān)注的是人的“愛(ài)好”。部分產(chǎn)品對(duì)用戶的興趣理解方式比較直接,讓用戶在新進(jìn)時(shí)勾選自己的興趣領(lǐng)域,從而推薦給用戶對(duì)應(yīng)內(nèi)容;其次還可以通過(guò)一些側(cè)面的辦法,比如“用戶在某條資訊中閱讀的時(shí)長(zhǎng)”、“用戶點(diǎn)擊某類資訊的概率”等方式側(cè)面去了解用戶的興趣。
  • 正負(fù)反饋因子。顧名思義,即是用戶對(duì)平臺(tái)推薦的內(nèi)容作出的正面或負(fù)面的反饋行為。正面反饋,如“點(diǎn)贊”、“一鍵三連”行為;負(fù)面反饋,如“舉報(bào)”、“不愿再看到”等行為。許多用戶也深諳此道,在接觸一個(gè)新的信息流產(chǎn)品時(shí)會(huì)用這個(gè)方式去“馴化”信息流,“調(diào)教”出最適合自己的內(nèi)容。
  • 互動(dòng)因子。可以認(rèn)為是正負(fù)反饋因子的進(jìn)一步細(xì)化,比如B站許多UP主常說(shuō)的“轉(zhuǎn)評(píng)贊”,則是希望通過(guò)用戶的轉(zhuǎn)發(fā)分享、評(píng)論、點(diǎn)贊等互動(dòng)指標(biāo),幫助其內(nèi)容被算法認(rèn)為是優(yōu)質(zhì)的內(nèi)容,從而獲得更高的曝光。另外,用戶的一些具體行為,比如“購(gòu)買”,對(duì)推薦算法來(lái)說(shuō)也是一個(gè)很重要的對(duì)相關(guān)物品提權(quán)的信號(hào)。
  • 社交因子。對(duì)于具有社交關(guān)系的產(chǎn)品來(lái)說(shuō),推薦算法就有更多的可發(fā)揮空間了。具有最得天獨(dú)厚優(yōu)勢(shì)的莫過(guò)于微信,沉淀了中國(guó)十多億用戶的深厚社交關(guān)系信息。比如“看一看”的內(nèi)容排序,則用到了用戶的社交關(guān)系做算法推薦,某個(gè)內(nèi)容如果有越多我們的好友“在看”,那其在我們的“看一看”中的排序則會(huì)更優(yōu)。
  • 熱度因子。時(shí)事變化瞬息萬(wàn)變,當(dāng)下的突發(fā)新聞事件往往會(huì)引起更多人的關(guān)注,導(dǎo)致熱門的時(shí)事事件得到更高的推薦排序。社會(huì)潮流不斷更迭,最近熱播的影視劇或最新潮流風(fēng)向,也會(huì)使一些商品成為最近熱門,從而獲得更高推薦排序。
  • 人工運(yùn)營(yíng)干預(yù)因子。基于推薦算法的排序基本能解決大部分的效率問(wèn)題,但對(duì)于部分劣質(zhì)內(nèi)容,如虛假消息、低俗內(nèi)容,則需要人工運(yùn)營(yíng)的干預(yù),對(duì)其進(jìn)行降權(quán)或過(guò)濾。

三、難題:資訊Feeds如何做冷啟動(dòng)?

講到這里,給大家分享筆者此前運(yùn)營(yíng)一款工具產(chǎn)品的經(jīng)歷。大多工具產(chǎn)品的困境大家可能都有所了解:用戶停留時(shí)間長(zhǎng)、粘性差,從而導(dǎo)致變現(xiàn)的效率和方式都很有限。市場(chǎng)上競(jìng)品眾多,如果不能快速?gòu)臄?shù)據(jù)指標(biāo)上證明我們產(chǎn)品的價(jià)值,那整個(gè)產(chǎn)品都面臨著被砍掉的風(fēng)險(xiǎn)。

于是,如何提高用戶提高時(shí)長(zhǎng),成了我們團(tuán)隊(duì)內(nèi)一個(gè)很重要的命題。我們這款工具產(chǎn)品具有WiFi連接的功能,此前用戶在連接WiFi成功后跳轉(zhuǎn)的落地頁(yè)就是一個(gè)“連接成功”的頁(yè)面,除此之外,沒(méi)有別的承接;

但此時(shí)用戶處在操作完成的情緒高點(diǎn)、且在流量不敏感的WiFi場(chǎng)景,我們想,是不是可以通過(guò)承接資訊Feeds的內(nèi)容,從而提供給用戶一些內(nèi)容消費(fèi)的價(jià)值,同時(shí)還創(chuàng)造了一個(gè)商業(yè)化變現(xiàn)的場(chǎng)景?

但我們是工具產(chǎn)品的團(tuán)隊(duì),此前完全沒(méi)有內(nèi)容運(yùn)營(yíng)的經(jīng)驗(yàn),要如何從0到1做一個(gè)資訊Feeds出來(lái)?分析了我們團(tuán)隊(duì)的現(xiàn)狀,我們決定從以下幾個(gè)方面快速啟動(dòng):首先,資訊內(nèi)容從哪兒來(lái)?我們的一些兄弟產(chǎn)品有現(xiàn)成的資訊內(nèi)容,但具體的推薦算法需要我們自研;我們的算法團(tuán)隊(duì)雖然沒(méi)有內(nèi)容推薦的經(jīng)驗(yàn),但在軟件分發(fā)上推薦的經(jīng)驗(yàn),也有異曲同工可借鑒復(fù)用的地方。

巧婦難為無(wú)米之炊,“米”和“巧婦”都已具備,但要做成“炒飯”還是“湯飯”我們的用戶才覺(jué)得最好吃,我們得多嘗試才能得出結(jié)論。

推薦排序的因子那么多,但對(duì)于我們來(lái)說(shuō),因?yàn)楣ぞ弋a(chǎn)品的屬性,所以能用的并不多。根據(jù)我們的情況,我們決定做如下三組的A/Btest實(shí)驗(yàn):

  • 基于用戶畫像排序。我們可以獲得的用戶屬性數(shù)據(jù)有:用戶的軟件安裝列表數(shù)據(jù),可以一定程度推測(cè)用戶的喜好;用戶的地理位置數(shù)據(jù),可以推薦一些本地新聞、附近景點(diǎn)等資訊。綜合這兩方面的用戶數(shù)據(jù),混合給用戶推薦合適的資訊內(nèi)容。
  • 基于熱度排序。因?yàn)槲覀兡玫降馁Y訊內(nèi)容并沒(méi)有附帶在其他平臺(tái)的熱度數(shù)據(jù),所以熱度排序在我們產(chǎn)品中是相對(duì)滯后的過(guò)程,需要用戶不斷通過(guò)點(diǎn)擊行為去“投喂”給算法進(jìn)行學(xué)習(xí),從而把產(chǎn)品內(nèi)更熱門的內(nèi)容推薦給更多的用戶閱讀。
  • 基于資訊發(fā)布時(shí)間排序。相當(dāng)于是一個(gè)基礎(chǔ)對(duì)照組,不對(duì)資訊做太多算法排序上的干預(yù),用于對(duì)比前兩組實(shí)驗(yàn)的效果。

基于三組實(shí)驗(yàn)的設(shè)定,我們選定了三組隨機(jī)測(cè)試的用戶群進(jìn)行策略的投放,并且設(shè)定了“平均資訊消費(fèi)時(shí)長(zhǎng)”作為關(guān)鍵評(píng)估指標(biāo)。等待實(shí)驗(yàn)效果回收的時(shí)間有三天那么漫長(zhǎng),這三天的期間我們團(tuán)隊(duì)內(nèi)也在打賭哪個(gè)策略表現(xiàn)會(huì)最優(yōu)。讀者們,你們也來(lái)猜猜哪個(gè)策略的表現(xiàn)會(huì)最好呢?

四、分析:找到問(wèn)題更深層的原因

團(tuán)隊(duì)內(nèi)的打賭,基本都集中認(rèn)為是前兩組的策略會(huì)更優(yōu)。認(rèn)為用戶畫像更好的同事的觀點(diǎn)直截了當(dāng),用戶會(huì)對(duì)與自己更相關(guān)的內(nèi)容更感興趣。認(rèn)為熱度排序效果會(huì)更好的同事也很在理,更多人點(diǎn)擊的內(nèi)容往往是獵奇新鮮的,自然也會(huì)吸引更多人閱讀。

但我們運(yùn)營(yíng)人員回收整理了實(shí)驗(yàn)數(shù)據(jù)后,卻有點(diǎn)大跌眼鏡:最不為大家青睞的基于時(shí)間排序的方案三,竟然“平均資訊消費(fèi)時(shí)長(zhǎng)”都要優(yōu)于前兩個(gè)方案。團(tuán)隊(duì)內(nèi)一時(shí)間有點(diǎn)泄氣,對(duì)算法團(tuán)隊(duì)同事的技術(shù)能力質(zhì)疑也在暗暗有聲。

作為運(yùn)營(yíng)人員,此時(shí)我們需要通過(guò)數(shù)據(jù)分析去多走一步看看:數(shù)據(jù)指標(biāo)所呈現(xiàn)的,就是全部的真相了嗎?

為了分析這個(gè)問(wèn)題,首先我們對(duì)問(wèn)題進(jìn)行了拆解。

實(shí)驗(yàn)的數(shù)據(jù)指標(biāo)上:

  1. 我們?cè)O(shè)定的數(shù)據(jù)指標(biāo)有沒(méi)有問(wèn)題?
  2. 數(shù)據(jù)指標(biāo)的計(jì)算有沒(méi)有問(wèn)題?
  3. 各實(shí)驗(yàn)方案的數(shù)據(jù)指標(biāo)計(jì)算是否都在同一個(gè)口徑上?

實(shí)驗(yàn)的方案設(shè)計(jì)上:

  1. 實(shí)驗(yàn)組用戶的選擇上是否足夠隨機(jī)?
  2. 實(shí)驗(yàn)策略所需要的數(shù)據(jù)需要齊全?
  3. 實(shí)驗(yàn)策略是否對(duì)其用戶組完全生效?

拆解分析后發(fā)現(xiàn),我們看到前兩組方案數(shù)據(jù)指標(biāo)不好的現(xiàn)狀,并不盡然是全部的真相。首先我們發(fā)現(xiàn),“平均資訊消費(fèi)時(shí)長(zhǎng)”的指標(biāo)設(shè)定存在一定問(wèn)題。因?yàn)槲覀兊漠a(chǎn)品屬性畢竟是工具產(chǎn)品,大部分用戶在連接上WiFi后是用完即走,資訊Feeds注定只是給一部分相對(duì)有閑的用戶的功能。

所以,實(shí)驗(yàn)組之間用戶的“平均資訊消費(fèi)時(shí)長(zhǎng)”十分離散,方案三中存在個(gè)別極端值用戶拉高了整體平均時(shí)長(zhǎng)數(shù)據(jù)。為了解決這個(gè)問(wèn)題,我們?cè)谟?jì)算時(shí)可以對(duì)極端值做一定處理,并增加“平均資訊點(diǎn)擊率”的數(shù)據(jù)指標(biāo),可以更客觀地評(píng)估各方案之間的效果。

其次通過(guò)分析還發(fā)現(xiàn),方案一和方案二由于數(shù)據(jù)采集上的原因,并沒(méi)有完全實(shí)現(xiàn)其策略各自的效果。比如方案一“基于用戶畫像排序”,許多實(shí)驗(yàn)組用戶由于安卓權(quán)限限制,安裝列表數(shù)據(jù)不全;對(duì)部分用戶IP的地理位置識(shí)別也不夠精準(zhǔn),測(cè)試發(fā)現(xiàn)給有的在廣州的用戶推薦了北京的本地新聞,自然也會(huì)影響策略的效果。

比如方案二,由于部分“標(biāo)題黨”內(nèi)容點(diǎn)擊率很高,所以導(dǎo)致實(shí)驗(yàn)組用戶首屏全是“標(biāo)題黨”內(nèi)容,內(nèi)容質(zhì)量很低,用戶點(diǎn)擊后也很快跳出,導(dǎo)致策略的實(shí)驗(yàn)效果很差。

五、數(shù)據(jù)運(yùn)營(yíng)思維的重要性

如果我們沒(méi)有對(duì)數(shù)據(jù)指標(biāo)呈現(xiàn)出來(lái)的情況做進(jìn)一步分析,單看實(shí)驗(yàn)的結(jié)果,我們可能直接就會(huì)認(rèn)為對(duì)于我們的用戶,“時(shí)間排序”就是最好的方案了,以后都應(yīng)該往這個(gè)方向去發(fā)展,所謂模型算法的優(yōu)化也都沒(méi)有必要了。但只有通過(guò)分析,才能更清晰地看到事實(shí)的全貌,不斷提出優(yōu)化方案進(jìn)行迭代。

這里體現(xiàn)出的,是問(wèn)題拆解思維的重要性,是有邏輯的問(wèn)題分析思維的重要性。希望通過(guò)本書,可以跟讀者你分享這些思維框架,成為一個(gè)更優(yōu)秀的運(yùn)營(yíng)。

 

作者:黃一元,公眾號(hào):黃一元(ID:yiyuan-huang)。四年互聯(lián)網(wǎng)toC toB產(chǎn)品運(yùn)營(yíng)經(jīng)歷。

本文由 @黃一元 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 其實(shí)根因就是需求理解不足,技術(shù)能力也不足,所謂的推薦算法猜都能猜出來(lái)是一種很簡(jiǎn)單的算法,根本算不上是產(chǎn)品

    來(lái)自江蘇 回復(fù)
  2. 很有啟發(fā),感謝!

    來(lái)自新加坡 回復(fù)
    1. 感謝支持!~

      來(lái)自廣東 回復(fù)