推薦系統(tǒng)隨想,冷啟動和評論推薦
最近,我司的O2O營銷系統(tǒng)考慮做推薦系統(tǒng),雖然不是我的功能,但是趁著放假,也了解了一下。通過文章一起來學(xué)習(xí)下。
什么是推薦系統(tǒng)?
隨著信息技術(shù)和互聯(lián)網(wǎng)的發(fā)展,人們逐漸從信息匱乏的時代走入了信息過載的時代。在這個時代,無論是信息消費者還是信息生產(chǎn)者都遇到很大的挑戰(zhàn);對于消費者,從大量信息中找到自己感興趣的信息是一件非常困難的事情;對于信息生產(chǎn)者,讓自己的信息脫穎而出,受到廣大用戶的關(guān)注,也是一件非常困難的事情。推薦系統(tǒng)就是解決這一矛盾的重要工具。推薦系統(tǒng)的任務(wù)就是聯(lián)系用戶和信息,一方面幫助用戶發(fā)現(xiàn)對自己有價值的信息,另一方面讓信息能夠展現(xiàn)在對它感興趣的用戶面前,從而實現(xiàn)信息消費在和信息生產(chǎn)者的雙贏。
這是我摘抄過來的一段話,對于推薦系統(tǒng)給出了比較簡單易懂的解釋。推薦的精髓在于,我想要的你都有,你給我的都是我想要的,其中,我就是用戶,你就是信息提供方。這樣完美的推薦的實現(xiàn),還需要一些時日,但是終歸要到來,現(xiàn)在想來還是挺可怕的,因為可能機(jī)器比我更了解我自己。
推薦系統(tǒng)的冷啟動
本篇文章是寫給產(chǎn)品經(jīng)理看的,所以說,我們不討論算法,只說方法。
冷啟動在整個推薦系統(tǒng)中,是一個非常重要而又非常難的一件事情,推薦系統(tǒng)一般都需要在大量的數(shù)據(jù)基礎(chǔ)過后才能比較準(zhǔn)確的進(jìn)行推薦,而一個新用戶剛使用APP的冷啟動可能直接決定著這個用戶還會不會使用下去,所以冷啟動是一件至關(guān)重要的事情。
冷啟動在互聯(lián)網(wǎng)行業(yè)有著很多的通用的方法和經(jīng)驗,可以讓用戶更快更優(yōu)質(zhì)的去冷啟動。那么冷啟動主要關(guān)注的兩個方面是,推薦的內(nèi)容是否全面和內(nèi)容是否可靠有用。
總結(jié)一下方法如下:
第一、盡可能用用戶給你的信息,比如app music會選擇讓用戶主動選擇一些流派或歌手,根據(jù)選擇結(jié)果進(jìn)行冷啟動,這樣會比較準(zhǔn)確。這種方法在很多APP第一次打開時都會用到。推薦關(guān)注人或者主題,都是這種原因。
第二、用戶的社交信息比較重要,比如今日頭條13-14年的時候做過引導(dǎo)用戶微博登陸,登陸后會去爬取用戶在微博上的一些信息,比如發(fā)的動態(tài)、圖片、文章,贊過、轉(zhuǎn)發(fā)過的的內(nèi)容等數(shù)據(jù),通過這些數(shù)據(jù)進(jìn)行分析,比如在微博上轉(zhuǎn)發(fā)了某個女歌手的新聞,就會知道用戶喜歡這個女歌手,這種數(shù)據(jù)比較真實也有延續(xù)性,也符合用戶最近的思維,這種數(shù)據(jù)質(zhì)量比較好。
第三、有可能會涉及一些用戶隱私。某些應(yīng)用會上報其他app的信息,可以了解用戶安裝了哪些app、app中傳遞了哪些信息,可以了解到用戶喜歡哪些東西,是喜歡游戲、美食甚至是喜歡的內(nèi)容風(fēng)格,可以了解到用戶的喜好,用這些數(shù)據(jù)去服務(wù)冷啟動會更好。所以說手機(jī)信息這塊還是很有用的,手機(jī)廠商其實已經(jīng)掌握了用戶的各種行為,但是有個缺點就是很多手機(jī)系統(tǒng)不會提供讀取用戶app安裝信息的服務(wù)。
最后,可以提供有獎?wù)骷姆椒ǎナ占脩舻哪挲g和性別,或者其他的社會信息,這是一種短平快的方法,但是這種方法需要提供什么樣的誘惑,需要嘗試中去摸索可行性。
評論推薦
除了產(chǎn)品的推薦,在O2O中,用戶評論也是比較重要的,用戶去下線消費與否很可能會因為一條好的評論或者壞的評論而改變想法。對于評論,我們有兩點需要關(guān)注。
1、怎么樣去識別一個優(yōu)質(zhì)的評論
怎樣從海量的評論中找到好的、優(yōu)質(zhì)的評論,我們可以從以下兩個方面來嘗試。
- 通過評論內(nèi)容去直接分析。字?jǐn)?shù)較多的、使用高級冷僻詞匯的一些評論質(zhì)量相對較好,這部分可以通過算法去識別出來。其中,需要去過濾掉有過多重復(fù)詞、違禁詞的評論。那通過這種方法可以去簡單去提取出一些相對有用的評論。
- 從一個評論的用戶屬性去出發(fā)。一般來說,哪些用戶會發(fā)表的評論比較高質(zhì)量呢?
- 一種可能是學(xué)歷,我覺得學(xué)歷是一個相當(dāng)重要一個點。因為學(xué)歷高的話你所使用的詞匯可能也會比較好,包括你的思考相對說完整性較好,而不會出現(xiàn)像小學(xué)生那種好好好、贊贊贊等這種相對來說比較水的一些評論互動。再來經(jīng)過編輯篩選就更加方便了。
- 第二種就是我們可以通過一些歷史統(tǒng)計,比如說我發(fā)現(xiàn)他之前發(fā)表過一個評論可能得到點贊數(shù)都特別多,也可以幫助我們識別出來他現(xiàn)在發(fā)的一些最新評論是不是也是優(yōu)質(zhì)做一個參考。
- 第三種可以通過一個用戶他平時在我們平臺上面的一些行為來確定。比如說一個用戶,如果真的很懂美食,那可能在我們這邊是相對活躍的。我們可以通過一些統(tǒng)計歷史性過于發(fā)現(xiàn)他活躍的一些特征。提高一定的權(quán)重。
- 第四種,這種用戶本身等級都較高,在我們的平臺,等級較高的用戶不管是文化程度還是收入都比較高,這類用戶的評論應(yīng)該更加受到重視。
2、假如識別出來之后要怎么給他們設(shè)置前置規(guī)則
確實很多評論系統(tǒng)會有這個問題,假如一個優(yōu)質(zhì)評論比較早發(fā)布的話,那他一直被置頂?shù)膸茁试絹碓礁摺?/p>
1)其實如果我們在算法上面做一個衰減因子。當(dāng)隨著時間衰退,這個因子變得越越大的時候。在打分上面,我們把熱度再乘以這個因子,那就會把這個分?jǐn)?shù)拉低。這樣子一些剛剛上線了一些質(zhì)量比較好的評論,在短時間獲得大量贊的評論,可能會超過之前的評論,從而排序會出現(xiàn)在更靠前。
2)另外,可以嘗試在評論區(qū)里面開辟一個熱門評論區(qū)。由編輯精選的一些優(yōu)質(zhì)的評論,去不停地滾動,去嘗試推薦這些評論。比如說達(dá)到曝光量一萬的時候,或者達(dá)到一定的數(shù)值,這個數(shù)值可以是點贊數(shù),也可以是其他的關(guān)鍵行為。
如果他達(dá)到了我們的一個預(yù)期值。那他可以繼續(xù)留在這里,再把一些不滿足的評論給踢掉,換其他一些優(yōu)質(zhì)評論上來。這樣子就可以保證有比較多的新增評論可以在評論區(qū)里面不斷被曝光。而且如果他真的寫得好的話,其實可以他曝光之后可以
作者:郭小刀刀
鏈接:http://www.jianshu.com/p/3feb0794e8ac
本文由 @郭小刀刀 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自PEXELS,基于CC0協(xié)議
寫的很全面,力透紙背,引人深思。
如果評論數(shù)量級在平臺搭建初期,很少的情況下,是否提供給商家(店鋪)把自己店鋪下面的某些評論置頂?shù)墓δ苣?。原?/p>
作為一只老是寫好好好、贊贊贊的煙酒僧,我表示很羞愧 ?
評論從用戶屬性出發(fā),這個出發(fā)點是好,但點贊評論很高并不一定就是優(yōu)質(zhì)評論,可能是段子或引起共鳴的批判性語言等,情況比較復(fù)雜,也是一種思路
這也是為什么網(wǎng)易云音樂的評論里一堆“這二胡拉得太6了”、“我的腿抖得停不下來”、“媽媽問我為什么跪了”了。
太有用了,最近在做評論這塊,感謝分享
為啥,因子越大,相乘之后,分?jǐn)?shù)會越低?
這個因子可以是正數(shù),也可以是負(fù)數(shù)吧。
上面作者寫到了,這個是一個衰減因子
好好好,贊贊贊(笑)