產(chǎn)品經(jīng)理需要懂的技術(shù)丨3分鐘了解個(gè)性化推薦算法
如果去商場(chǎng)里買(mǎi)東西,我并不愿意聽(tīng)導(dǎo)購(gòu)小姐講的話,但是電商網(wǎng)站上的推薦,我還真的愿意看一看?!静履阆矚g】,好,那你就猜猜吧。
推薦這種體驗(yàn)除了電商網(wǎng)站,還有新聞推薦、電臺(tái)音樂(lè)推薦、搜索相關(guān)內(nèi)容及廣告推薦,基于數(shù)據(jù)的個(gè)性化推薦也越來(lái)越普遍了。今天就針對(duì)場(chǎng)景來(lái)說(shuō)說(shuō)這些不同的個(gè)性化推薦算法吧。
說(shuō)個(gè)性化之前,先提一下非個(gè)性化。 非個(gè)性化的推薦也是很常見(jiàn)的,畢竟人嘛都有從眾心理,總想知道大家都在看什么。非個(gè)性化推薦的方式主要就是以比較單一的維度加上半衰期去看全局排名,比如,30天內(nèi)點(diǎn)擊排名,一周熱門(mén)排名。
但是只靠非個(gè)性化推薦有個(gè)弊端,就是馬太效應(yīng),點(diǎn)的人越多的,經(jīng)過(guò)推薦點(diǎn)得人有更多。。。強(qiáng)者越強(qiáng),弱者機(jī)會(huì)越少就越弱,可能導(dǎo)致兩級(jí)分化嚴(yán)重,一些比較優(yōu)質(zhì)素材就被埋沒(méi)了。
所以,為了解決一部分馬太效應(yīng)的問(wèn)題,也主要是順應(yīng)數(shù)據(jù)化和自動(dòng)化的模式,就需要增加個(gè)性化的推薦(可算說(shuō)到正題了。。。)個(gè)性化的優(yōu)點(diǎn)是不僅體驗(yàn)好,而且也大大增加了效率,讓你更快找到你感興趣的東西。YouTube也曾做過(guò)實(shí)驗(yàn)測(cè)試個(gè)性化和非個(gè)性化的效果,最終結(jié)果顯示個(gè)性化推薦的點(diǎn)擊率是同期熱門(mén)視頻的兩倍。
1.新聞、視頻、資訊和電臺(tái)(基于內(nèi)容推薦)
一般來(lái)說(shuō),如果是推薦資訊類(lèi)的都會(huì)采用基于內(nèi)容的推薦,甚至早期的郵件過(guò)濾也采用這種方式。
基于內(nèi)容的推薦方法就是根據(jù)用戶過(guò)去的行為記錄來(lái)向用戶推薦相似額推薦品。簡(jiǎn)單來(lái)說(shuō)就是你常常瀏覽科技新聞,那就更多的給你推薦科技類(lèi)的新聞。
復(fù)雜來(lái)說(shuō),根據(jù)行為設(shè)計(jì)權(quán)重,根據(jù)不同維度屬性區(qū)分推薦品都是麻煩的事,常用的判斷用戶可能會(huì)喜歡推薦品程度的余弦向量公式長(zhǎng)這樣,我就不解釋了(已經(jīng)勾起了我關(guān)于高數(shù)不好的回憶)。。。
但是,這種算法缺點(diǎn)是由于內(nèi)容高度匹配,導(dǎo)致推薦結(jié)果的驚喜度較差,而且有冷啟動(dòng)的問(wèn)題,對(duì)新用戶不能提供可靠的推薦結(jié)果。并且,只有維度增加才能增加推薦的精度,但是維度一旦增加計(jì)算量也成指數(shù)型增長(zhǎng)。如果是非實(shí)體的推薦品,定義風(fēng)格也不是一件容易的事,同一個(gè)作者的文風(fēng)和曲風(fēng)也會(huì)發(fā)生改變。
2.電商零售類(lèi)(協(xié)同過(guò)濾推薦和關(guān)聯(lián)規(guī)則推薦)
說(shuō)電商推薦那不可能不講到亞馬遜,傳言亞馬遜有三成的銷(xiāo)售額都來(lái)自個(gè)性化的商品推薦系統(tǒng)。實(shí)際上,我自己也常常在這里找到喜歡的書(shū),也愿意主動(dòng)的去看他到底給我推薦了什么。
一般,電商主流推薦算法是基于一個(gè)這樣的假設(shè),“跟你喜好相似的人喜歡的東西你也很有可能喜歡?!奔磪f(xié)同過(guò)濾過(guò)濾算法。主要的任務(wù)就是找出和你品味最相近的用戶,從而根據(jù)最近他的喜好預(yù)測(cè)你也可能喜歡什么。
這種方法可以推薦一些內(nèi)容上差異較大但是又是用戶感興趣的物品,很好的支持用戶發(fā)現(xiàn)潛在的興趣偏好。也不需要領(lǐng)域知識(shí),并且隨著時(shí)間推移性能提高。但是也存在無(wú)法向新用戶推薦的問(wèn)題,系統(tǒng)剛剛開(kāi)始時(shí)推薦質(zhì)可能較量差。
電商行業(yè)也常常會(huì)使用到基于關(guān)聯(lián)規(guī)則的推薦。即以關(guān)聯(lián)規(guī)則為基礎(chǔ),把已購(gòu)商品作為規(guī)則頭,規(guī)則體為推薦對(duì)象。比如,你購(gòu)買(mǎi)了羽毛球拍,那我相應(yīng)的會(huì)向你推薦羽毛球周邊用品。關(guān)聯(lián)規(guī)則挖掘可以發(fā)現(xiàn)不同商品在銷(xiāo)售過(guò)程中的相關(guān)性,在零售業(yè)中已經(jīng)得到了成功的應(yīng)用。
3.廣告行業(yè)(基于知識(shí)推薦)
自從可以瀏覽器讀取cookies,甚至獲得年齡屬性等信息,廣告的個(gè)性化投放就也可以根據(jù)不同場(chǎng)景使用了。
當(dāng)用戶的行為數(shù)據(jù)較少時(shí),基于知識(shí)的推薦可以幫助我們解決這類(lèi)問(wèn)題。用戶必須指定需求,然后系統(tǒng)設(shè)法給出解決方式。假設(shè),你的廣告需要指定某地區(qū)某年齡段的投放,系統(tǒng)就根據(jù)這條規(guī)則進(jìn)行計(jì)算?;谥R(shí)的推薦在某種程度是可以看成是一種推理技術(shù)。這種方法不需要用戶行為數(shù)據(jù)就能推薦,所以不存在冷啟動(dòng)問(wèn)題。推薦結(jié)果主要依賴兩種形式,基于約束推薦和基于實(shí)例推薦。
4.組合推薦
由于各種推薦方法都有優(yōu)缺點(diǎn),所以在實(shí)際中,并不像上文講的那樣采用單一的方法進(jìn)行建模和推薦(我真的只是為了解釋清楚算法)。。。
在組合方式上,也有多種思路:加權(quán)、變換、混合、特征組合、層疊、特征擴(kuò)充、元級(jí)別。
并且,為了解決冷啟動(dòng)的問(wèn)題,還會(huì)相應(yīng)的增加補(bǔ)足策略,比如根據(jù)用戶模型的數(shù)據(jù),結(jié)合挖掘的各種榜單進(jìn)行補(bǔ)足,如全局熱門(mén)、分類(lèi)熱門(mén)等。
還有一些開(kāi)放性的問(wèn)題,比如,需不需要幫助用戶有品味的提升,引導(dǎo)人去更好的生活。
最后,我總想,最好的推薦效果是像一個(gè)了解你的朋友一樣跟你推薦,因?yàn)樗滥阆矚g什么,最近對(duì)什么感興趣,也總能發(fā)現(xiàn)一些有趣的新東西。這讓我想到有一些朋友總會(huì)興致勃勃的過(guò)來(lái)說(shuō),嘿,給你推薦個(gè)東西,你肯定喜歡,光是聽(tīng)到這句話我好像就開(kāi)心起來(lái),也許這就是我喜歡這個(gè)功能的原因。
本文由作者:lottelyn江琳??公眾號(hào)(這個(gè)產(chǎn)品超難用) 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理?,未經(jīng)許可,禁止轉(zhuǎn)載。
作為一個(gè)讓新人簡(jiǎn)單了解個(gè)性化功能來(lái)說(shuō)。我認(rèn)為已經(jīng)可以了
太淺了,最起碼要知道協(xié)同過(guò)濾算法啊
謝謝分享 ??
余弦公式還真沒(méi)看懂 ?? ??
不錯(cuò)的share
挺好的
喜歡這一句話:幫助用戶有品味的提升,引導(dǎo)人去更好的生活,也許這就是設(shè)計(jì)一款產(chǎn)品的最終意義
那個(gè)余弦公式寫(xiě)在人教版的高中課本里 ??