信息流產(chǎn)品是怎么做的?
編輯導(dǎo)讀:信息流產(chǎn)品這個(gè)名詞聽上去挺唬人,但其實(shí)大家日常生活中經(jīng)常遇見。今日頭條的熱點(diǎn)資訊,大眾點(diǎn)評(píng)的推薦餐廳,小紅書的種草筆記等等,都是信息流產(chǎn)品的具體形態(tài)。那么,構(gòu)建一個(gè)最基礎(chǔ)的信息流產(chǎn)品,需要哪些部分?具體是如何操作的呢?本文將從六個(gè)方面展開分析,希望對(duì)你有幫助。
如今,信息流的產(chǎn)品形態(tài)已經(jīng)貫穿到我們的生活中,與一切都息息相關(guān)。每日清晨打開今日頭條,齊刷刷的熱點(diǎn)資訊等著大家去閱讀;休息時(shí)點(diǎn)開小紅書,無(wú)數(shù)條種草點(diǎn)評(píng)映入眼簾;一到飯點(diǎn)饑腸轆轆時(shí)點(diǎn)擊大眾點(diǎn)評(píng),不計(jì)其數(shù)的同城餐廳等待我們?nèi)ヌ暨x……在現(xiàn)今的移動(dòng)互聯(lián)網(wǎng)時(shí)代,平臺(tái)通過(guò)成熟精密的召回算法和排序規(guī)則來(lái)聚合內(nèi)容,用戶在一個(gè)頁(yè)面內(nèi)就可以高效流暢地獲取自己感興趣的內(nèi)容。
在以往文章中,我們講述過(guò)關(guān)于信息流內(nèi)容產(chǎn)品的指標(biāo)搭建、常見分析思路和優(yōu)化方法。那么,構(gòu)建一個(gè)最基礎(chǔ)的信息流產(chǎn)品,需要哪些部分?每個(gè)模塊具體如何操作以及它的作用是什么呢?今天的這篇文章里,大家就能知道想要的答案啦。
一個(gè)最基礎(chǔ)的信息流產(chǎn)品,涵蓋了哪些部分?
- 內(nèi)容:內(nèi)容生產(chǎn)、內(nèi)容理解、內(nèi)容加工
- 用戶:用戶理解
- 策略:召回/推薦策略、分發(fā)策略、生態(tài)策略
圖示是構(gòu)建信息流產(chǎn)品所需的基礎(chǔ)大框架,接下來(lái)逐個(gè)分析各模塊具體操作及對(duì)應(yīng)作用。
一、內(nèi)容生產(chǎn)
內(nèi)容生產(chǎn)即內(nèi)容的供給,有需求就要有供給,只有供給充足,用戶才能消費(fèi)到足夠多樣精彩的內(nèi)容。通常有以下幾個(gè)方式生產(chǎn)內(nèi)容:
- 自然創(chuàng)作者在站內(nèi)發(fā)布內(nèi)容
- 簽約媒體及MCN等機(jī)構(gòu)購(gòu)買一些創(chuàng)作者/內(nèi)容資源
- 抓取其他平臺(tái)符合調(diào)性的內(nèi)容。
在不同的產(chǎn)品目標(biāo)階段,不同來(lái)源類型的內(nèi)容配比會(huì)不同。一些成熟的平臺(tái)已經(jīng)有非常完善的創(chuàng)作者生命周期管理和創(chuàng)作者激勵(lì)/分成體系,由此可激勵(lì)創(chuàng)作者發(fā)布更多更優(yōu)質(zhì)的內(nèi)容。可見,內(nèi)容供給就是內(nèi)容型產(chǎn)品的根本。
二、內(nèi)容理解
內(nèi)容理解即給內(nèi)容打標(biāo)簽。標(biāo)簽——描述內(nèi)容本身的特征,可以更好地理解內(nèi)容,將合適的內(nèi)容推薦給合適的用戶?;趦?nèi)容理解的標(biāo)簽有非常多的用途,除了作新用戶的內(nèi)容推薦外,可以作基于相似標(biāo)簽的相關(guān)內(nèi)容推薦,也可以作個(gè)性化的內(nèi)容推薦。內(nèi)容通過(guò)海量標(biāo)簽生產(chǎn)內(nèi)容特征,和用戶的偏好進(jìn)行匹配,形成千人千面的內(nèi)容分發(fā)方式。
內(nèi)容理解需要大量NLP方法,以及大量人工標(biāo)注,用以確保標(biāo)簽的準(zhǔn)確性。通常可以從內(nèi)容本身和發(fā)布內(nèi)容作者屬性/行為來(lái)理解內(nèi)容。例如一個(gè)短視頻作品,它的標(biāo)簽就可以涵蓋:
- 基礎(chǔ)屬性:時(shí)長(zhǎng)、封圖、標(biāo)題、關(guān)鍵詞、城市、來(lái)源等
- 類別屬性:城市新聞、娛樂(lè)、貓狗等
- 預(yù)測(cè)類屬性:原創(chuàng)度、風(fēng)險(xiǎn)分、內(nèi)容評(píng)級(jí)、內(nèi)容時(shí)效性、女生偏好、年輕人偏好等
三、內(nèi)容加工
不論任何渠道抓取、站點(diǎn)抽取或者平臺(tái)作者自主發(fā)文的內(nèi)容,通常都需要經(jīng)過(guò)層層加工過(guò)濾。首先進(jìn)行通用消重,然后通過(guò)機(jī)器審核的一些模型及人工審核過(guò)濾掉黑名單、低質(zhì)內(nèi)容、抄襲內(nèi)容、不完整內(nèi)容、涉黃涉暴等不適合在平臺(tái)內(nèi)展現(xiàn)的內(nèi)容。
然后在內(nèi)容分發(fā)過(guò)濾時(shí)根據(jù)對(duì)應(yīng)規(guī)則,設(shè)定對(duì)應(yīng)特征的內(nèi)容可以分發(fā)給對(duì)應(yīng)特征的用戶等規(guī)則,例如用戶評(píng)級(jí)評(píng)分、垂類等進(jìn)行分發(fā)過(guò)濾。到了前端展示側(cè),根據(jù)頻道主Feed頁(yè)的推薦位進(jìn)行個(gè)性化推薦分配,展示給用戶。最后內(nèi)容展示一定時(shí)間后會(huì)喪失其時(shí)效性,便不再展示。
四、用戶理解
用戶理解即精準(zhǔn)地去刻畫用戶,涵蓋用戶的基礎(chǔ)信息,職業(yè)、年齡、性別等,以及基于用戶過(guò)往行為數(shù)據(jù)興趣偏好標(biāo)簽,從這些數(shù)據(jù)中,我們可以獲取大量的用戶特征,對(duì)用戶有更深層次的認(rèn)知,例如這個(gè)用戶喜歡什么類型的內(nèi)容?更偏好什么類型的賬號(hào)發(fā)文?活躍時(shí)間在每天的幾點(diǎn)?
基于此可以從不同的維度去刻畫一個(gè)用戶,我們刻畫得越精準(zhǔn)越詳細(xì),就越能精準(zhǔn)地發(fā)現(xiàn)并挖掘用戶的需求,把用戶所需內(nèi)容推薦給目標(biāo)用戶,內(nèi)容轉(zhuǎn)化效率將會(huì)變得更高。
五、推薦與分發(fā)策略
推薦策略是基于海量數(shù)據(jù)分析基礎(chǔ)上,通過(guò)內(nèi)容及用戶的多維度特征組合分?jǐn)?shù),進(jìn)行計(jì)算,將個(gè)性化內(nèi)容推薦給對(duì)應(yīng)用戶,解決信息過(guò)載的問(wèn)題。推薦通常分為兩個(gè)階段,即召回和排序。
召回是根據(jù)用戶的一些特征偏好或者一些特殊規(guī)則,在偌大的內(nèi)容池中挑選出一個(gè)內(nèi)容集合,圈定推送內(nèi)容。常用的召回方法有:基于FM模型組合特征召回、基于行為的item協(xié)同過(guò)濾、基于行為的user協(xié)同過(guò)濾等手段等。召回池中都是用戶感興趣的內(nèi)容,而排序階段會(huì)在此基礎(chǔ)上進(jìn)行更精確計(jì)算,對(duì)每個(gè)內(nèi)容進(jìn)行打分,從召回池的內(nèi)容中挑選出用戶最感興趣的少量?jī)?nèi)容。
內(nèi)容的分發(fā)方式除了推薦算法外,還應(yīng)該考慮內(nèi)容多樣性等因素,我們可以基于內(nèi)容生態(tài)的考量,對(duì)內(nèi)容創(chuàng)作者從不同的維度進(jìn)行打壓與推優(yōu),把更多的流量分配給優(yōu)質(zhì)內(nèi)容的創(chuàng)作者,提高流量的利用效率和被消費(fèi)內(nèi)容的質(zhì)量。例如我們會(huì)對(duì)原創(chuàng)評(píng)級(jí)更高、質(zhì)量評(píng)級(jí)更高的作者給予更多的流量。此外,還可以基于社交進(jìn)行分發(fā)(抖音的關(guān)注頁(yè)頻道),與地理位置的分發(fā)(抖音的同城頻道、以及熱榜內(nèi)容分發(fā))。
六、生態(tài)策略
早期產(chǎn)品做冷啟動(dòng)時(shí),內(nèi)容和創(chuàng)作者數(shù)量都遠(yuǎn)遠(yuǎn)不足,需要通過(guò)外部手段來(lái)激活站內(nèi)生態(tài),由此不得不抓取大量的站外內(nèi)容到站內(nèi),相應(yīng)就無(wú)法保證內(nèi)容質(zhì)量。但隨著產(chǎn)品的發(fā)展,亟需一批優(yōu)質(zhì)+原創(chuàng)的內(nèi)容來(lái)替換原始抓取的內(nèi)容,借此讓站內(nèi)擁有更多的真人優(yōu)質(zhì)創(chuàng)作者,來(lái)構(gòu)建更加健康可持續(xù)發(fā)展的作者及內(nèi)容生態(tài)。
促進(jìn)UGC的生產(chǎn)可以通過(guò)一些運(yùn)營(yíng)活動(dòng)、簽約MCN/官方招募、社區(qū)內(nèi)容引導(dǎo)等方式。同時(shí)設(shè)計(jì)相應(yīng)策略保證頭部生產(chǎn)者的內(nèi)容權(quán)益,對(duì)底層劣質(zhì)創(chuàng)作者的內(nèi)容進(jìn)行打壓,通過(guò)針對(duì)不同程度的劣質(zhì)/違規(guī)進(jìn)行不同的手段打擊,最終讓站內(nèi)保持一個(gè)良性的循環(huán)生態(tài)。
我們不僅要處理站內(nèi)的違規(guī)用戶和違規(guī)內(nèi)容,還要針對(duì)一些擦邊的生態(tài)問(wèn)題制訂對(duì)應(yīng)的干預(yù)策略。如果站內(nèi)若存在大量的低俗內(nèi)容、負(fù)能量?jī)?nèi)容、炒作搏眼球內(nèi)容等,雖然這些內(nèi)容并不違規(guī),若其量級(jí)夠大則嚴(yán)重影響用戶的瀏覽體驗(yàn)。根據(jù)我們目前的產(chǎn)品階段及調(diào)性,通過(guò)模型及人工方式對(duì)不同的生態(tài)類問(wèn)題內(nèi)容進(jìn)行識(shí)別,實(shí)施相應(yīng)的處置及規(guī)則設(shè)定,以維護(hù)站內(nèi)健康正向的內(nèi)容生態(tài)。
以上,就是我理解一個(gè)信息流內(nèi)容產(chǎn)品的主要框架,還有非常多的細(xì)節(jié)點(diǎn),如果有感興趣的朋友,歡迎討論。
作者:趙小洛,公眾號(hào):趙小洛洛洛
本文由 @趙小洛 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
接收人接收不到你的專有名詞內(nèi)容……
花里胡哨,信息流廣告說(shuō)白了就是強(qiáng)制性廣告,關(guān)鍵詞為主動(dòng)廣告,尋找用戶標(biāo)簽就是找愿意看廣告的人強(qiáng)制給這些人看
沒(méi)聽懂…… 只能怪我經(jīng)驗(yàn)太少