短視頻是如何讓你上癮的
編輯導(dǎo)語(yǔ):推薦算法基于用戶喜好,為用戶推送其可能感興趣的事物。這一模式有利有弊,一方面,推薦算法的存在可以幫助用戶在海量信息中進(jìn)行篩選,但另一方面,個(gè)性化推薦讓用戶喜好無(wú)所遁形。本篇文章里,作者從短視頻讓人上癮這一現(xiàn)象入手,對(duì)推薦算法進(jìn)行了拆解,一起來(lái)看一下。
“這篇文章主要是想通過(guò)短視頻產(chǎn)品,和大家探討一個(gè)對(duì)于數(shù)據(jù)分析師相對(duì)比較陌生的領(lǐng)域:推薦算法?!?/p>
一、比你自己更懂你
不知小伙伴們是否和我一樣,每天都會(huì)面對(duì)一個(gè)來(lái)自靈魂深處的拷問(wèn):今天吃什么?
于是,當(dāng)我打開(kāi)美團(tuán)外賣(mài)、餓了么外賣(mài),首頁(yè)一大波我愛(ài)吃的推薦好菜便撲面而來(lái),媽媽再也不用擔(dān)心我今天吃什么啦!當(dāng)我們?cè)谔詫?、京東等購(gòu)物網(wǎng)站完成一次購(gòu)物之后,平臺(tái)馬上就會(huì)為我們推薦另外一些相似的商品,一不留神又開(kāi)啟了買(mǎi)買(mǎi)買(mǎi)的模式。
當(dāng)我們?cè)陂e暇打開(kāi)抖音摸魚(yú)的時(shí)候,為什么會(huì)源源不斷刷出自己感興趣的視頻,不知不覺(jué)大半天已經(jīng)過(guò)去了,讓人不得不感嘆:這推薦,根本停不下來(lái)?。?/p>
從衣食住行到文教娛樂(lè),這些滲透到我們?nèi)粘I罘椒矫婷娴囊粋€(gè)個(gè)互聯(lián)網(wǎng)產(chǎn)品,不斷讓我們驚呼:哇哦,amazing,它們簡(jiǎn)直比我自己還要了解我!小朋友,此時(shí)你腦海里是否有很多問(wèn)號(hào),它們到底是怎么做到的呢?
其實(shí),在它們的背后都有一個(gè)強(qiáng)大的大腦——推薦系統(tǒng)。接下來(lái)我們就一起走進(jìn)推薦系統(tǒng)的奇妙世界!
二、打開(kāi)推薦系統(tǒng)的“黑匣子”
1. 推薦系統(tǒng)的目的
隨著互聯(lián)網(wǎng)信息技術(shù)的發(fā)展,我們已經(jīng)身處在大數(shù)據(jù)的時(shí)代。
在浩如煙海的信息中,如何找到自己感興趣的內(nèi)容,或者說(shuō)信息生產(chǎn)者如何讓自己所要傳達(dá)的信息被人們所看到,都會(huì)是一個(gè)非常困難的過(guò)程。推薦系統(tǒng)就像一個(gè)漏斗一樣,通過(guò)對(duì)信息進(jìn)行融合、摘要和篩選,最終呈現(xiàn)給用戶自己認(rèn)為或者商家覺(jué)得“有用的信息”。
2. 推薦系統(tǒng)分類
3. 推薦系統(tǒng)核心流程
推薦系統(tǒng)本質(zhì)是一個(gè)信息過(guò)濾系統(tǒng),它基于用戶數(shù)據(jù)、用戶行為數(shù)據(jù)和商品內(nèi)容信息并通過(guò)一定的算法來(lái)預(yù)測(cè)用戶的偏好,根據(jù)用戶的偏好特點(diǎn)過(guò)濾掉用戶不感興趣的商品或者內(nèi)容,從而通過(guò)“千人千面”的手段不斷的吸引用戶留在產(chǎn)品上。
按照流程通常分為:召回、排序、重排序這3個(gè)核心環(huán)節(jié),每個(gè)環(huán)節(jié)逐層過(guò)濾,最終從海量的物料庫(kù)中篩選出幾十個(gè)用戶可能感興趣的內(nèi)容或商品推薦給用戶。
三、短視頻個(gè)性化推薦大揭秘
1. 基于用戶的協(xié)同過(guò)濾
核心思想:A和C兩個(gè)用戶相似,給A推薦C喜歡且A沒(méi)有看過(guò)的東西。
2. 基于物品的協(xié)同過(guò)濾
核心思想:兩個(gè)視頻1和3相似,給C推薦與視頻1(A和C都喜歡)相似的內(nèi)容。接下來(lái),我們以基于用戶的協(xié)同過(guò)濾為例,通過(guò)短視頻推薦的案例給大家進(jìn)行略作詳細(xì)講解。
假設(shè)在某短視頻平臺(tái)有ID為DY001至DY006的六位用戶,他們可能對(duì)不同短視頻進(jìn)行瀏覽、收藏、點(diǎn)贊、評(píng)論、分享等行為操作。為了衡量不同用戶對(duì)不同短視頻的興趣度,我們可以設(shè)計(jì)一個(gè)簡(jiǎn)單的模型,對(duì)不同行為賦予相應(yīng)的分值,如下表:
根據(jù)用戶的行為計(jì)算視頻得分,滿分10分,加到10后則不再累加。比如某一用戶對(duì)搞笑類視頻打分是8分(可能是瀏覽1分,點(diǎn)贊3分,分享4分),然后,我們就能得到DY0001至DY0006這六位用戶對(duì)各種類型短視頻的偏好程度得分表(0為完全沒(méi)興趣,10為非常有興趣,空白為暫缺):
很顯然,通過(guò)根據(jù)用戶在不同視頻上的得分情況,可以得到用戶對(duì)不同視頻的喜愛(ài)情況,在此基礎(chǔ)上構(gòu)建出用戶特征向量,然后根據(jù)余弦相似度可以判斷用戶之間的相似性。
根據(jù)相似性可以建立用戶相似矩陣(得分越接近1代表兩個(gè)用戶越相似),可以一定程度上判斷兩個(gè)用戶在視頻偏好上的相似程度。
進(jìn)而我們可以認(rèn)為,如果用戶A和用戶B比較相似,可以認(rèn)為A喜歡的書(shū)B(niǎo)應(yīng)該也喜歡。因此我們?cè)诮o用戶A進(jìn)行視頻推薦時(shí),找到與其相似度較高的其他用戶,然后過(guò)濾掉用戶A已看過(guò)的視頻,結(jié)合相似用戶對(duì)某個(gè)視頻的喜愛(ài)程度以及該用戶與A用戶的相似度進(jìn)行加權(quán),得到的推薦指數(shù)越高的視頻越優(yōu)先進(jìn)行推薦。
當(dāng)然,對(duì)于不同的短視頻平臺(tái),其對(duì)用戶的不同行為所賦予的權(quán)重是不一樣的,以下是抖音和快手的部分策略對(duì)比,僅供參考:
四、結(jié)束語(yǔ)
本篇文章,我們從生活中的“個(gè)性化推薦”現(xiàn)象入手,一起探討了系統(tǒng)過(guò)濾推薦算法的原理以及簡(jiǎn)單的應(yīng)用。
當(dāng)然,協(xié)同過(guò)濾推薦算法并不是萬(wàn)能的,它過(guò)度依賴用戶的歷史數(shù)據(jù),面對(duì)新的用戶或者新的物品,在開(kāi)始的時(shí)候沒(méi)有數(shù)據(jù)或數(shù)據(jù)較少時(shí),協(xié)同過(guò)濾算法無(wú)法做出較為準(zhǔn)確的推薦。需要等數(shù)據(jù)積累,或者其他方案進(jìn)行彌補(bǔ)缺陷,也就是常說(shuō)的冷啟動(dòng)的問(wèn)題。
本文由 @知了數(shù)據(jù)分析 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議。
關(guān)注【知了數(shù)據(jù)分析】,獲取更多數(shù)據(jù)分析干貨!
以后要多刷一點(diǎn)類似的文章,我太孤陋寡聞了
作者寫(xiě)得挺好的,我才知道原來(lái)一個(gè)視頻的背后還有包含了這么多東西,真是太復(fù)雜了
謝謝你喜歡我的文章,歡迎關(guān)注我的公眾號(hào)【知了數(shù)據(jù)分析】,還有更多你感興趣的文章
這個(gè)算法推薦還更好底減少了用戶的無(wú)用操作,使用APP的用戶只要一個(gè)上滑就可以獲得一個(gè)新的內(nèi)容了。
對(duì)比B站的平鋪式,短視頻減少了用戶選擇的時(shí)間和所花費(fèi)的e精力,不用在意標(biāo)題黨或者封面黨,獲取到一個(gè)新的視頻時(shí)只關(guān)注視頻所呈現(xiàn)的內(nèi)容就好了,看到不喜歡就直接劃走,不用退出再找喜歡的內(nèi)容。
如果一個(gè)用戶不點(diǎn)贊、不收藏也不評(píng)論,他只想看視頻的話,那么他只要一直往上滑就行了。
這種屬于單列沉浸的交互方式
為用戶推送其可能感興趣的事物,真的太叫人上癮了
不過(guò)算法這個(gè)東西是把雙刃劍,國(guó)家現(xiàn)在也正在規(guī)范算法向善