只是一種猜想:云音樂的推薦算法

4 評(píng)論 20267 瀏覽 40 收藏 7 分鐘

根據(jù)查找的一些資料和自己的一些猜想,本文作者對(duì)推薦算法進(jìn)行簡單說明和對(duì)云音樂的推薦算法進(jìn)行猜想。

每日歌曲推薦banner左下角有一行字:“根據(jù)你的音樂口味生成,每天6:00更新”??梢姡埔魳防孟嚓P(guān)推薦算法每天運(yùn)行,對(duì)每個(gè)用戶進(jìn)行個(gè)性化推薦。不得不說,自己從每日歌曲推薦里找到好多喜歡的音樂和小眾歌手。同時(shí),隨意在微博里搜了一下相關(guān)評(píng)論,看來個(gè)性化推薦真的做到好評(píng)如潮。

所以,接下來根據(jù)查找的一些資料和自己的一些猜想,對(duì)推薦算法進(jìn)行簡單說明和對(duì)云音樂的推薦算法進(jìn)行猜想。

什么是推薦算法?

簡單的說是一些函數(shù)。根據(jù)用戶的個(gè)人標(biāo)簽和近期做了一些動(dòng)作(如聽了某首歌、喜歡了某首歌、收藏了某個(gè)歌單…),然后后臺(tái)根據(jù)推薦算法給每個(gè)用戶推薦可能符合口味的商品。

構(gòu)建推薦算法的目的是什么?

1、幫助用戶找到想要的商品,發(fā)掘長尾

想要幫用戶找到想要的東西,卻沒那么容易。在經(jīng)濟(jì)學(xué)中,有一個(gè)著名理論叫長尾理論(The Long Tail)。

套用在互聯(lián)網(wǎng)領(lǐng)域中,指的就是最熱的那一小部分資源將得到絕大部分的關(guān)注,而剩下的很大一部分資源卻鮮少有人問津。這不僅造成了資源利用上的浪費(fèi),也讓很多口味偏小眾的用戶無法找到自己感興趣的內(nèi)容。

2、降低信息過載

互聯(lián)網(wǎng)時(shí)代信息量已然處于爆炸狀態(tài),若是將所有內(nèi)容都放在網(wǎng)站首頁上用戶是無從閱讀的,信息的利用率將會(huì)十分低下。因此我們需要推薦系統(tǒng)來幫助用戶過濾掉低價(jià)值的信息。

3、提高站點(diǎn)的點(diǎn)擊率/轉(zhuǎn)化率?

好的推薦系統(tǒng)能讓用戶更頻繁地訪問一個(gè)站點(diǎn),并且總是能為用戶找到他想要購買的商品或者閱讀的內(nèi)容。

4、加深對(duì)用戶的了解,為用戶提供定制化服務(wù)?

可以想見,每當(dāng)系統(tǒng)成功推薦了一個(gè)用戶感興趣的內(nèi)容后,我們對(duì)該用戶的興趣愛好等維度上的形象是越來越清晰的。當(dāng)我們能夠精確描繪出每個(gè)用戶的形象之后,就可以為他們定制一系列服務(wù),讓擁有各種需求的用戶都能在我們的平臺(tái)上得到滿足。

推薦算法主要有哪些?

  1. 基于流量熱度推薦
  2. 基于內(nèi)容推薦
  3. 協(xié)同過濾推薦
  4. 基于關(guān)聯(lián)規(guī)則推薦
  5. 基于知識(shí)推薦
  6. 組合算法推薦

云音樂推薦算法猜想

核心:協(xié)同過濾算法(CF)。

協(xié)同過濾算法有兩種,基于人(user)、基于歌曲(song):

  1. 基于人:eg、分析用戶user1、user2、user3的偏好;找到聽歌風(fēng)格相近的用戶user1、user3;推薦user1聽user3聽過而user1沒有聽過的歌song5
  2. 基于歌曲:eg、分析user1喜歡聽的song1分別與song2、song3的相似性(每首歌有很多tag);推薦user1聽與song1相似風(fēng)格的song3。

協(xié)同過濾算法利用余弦相似度計(jì)算向量間的相似性,結(jié)果范圍[-1,1]。

具體想發(fā)法如下:

(1)若是基于人的算法,可能會(huì)存在一些問題:要計(jì)算每個(gè)用戶間的相似度,計(jì)算量大;如果是一個(gè)新用戶,很難向他推薦音樂。

(2)所以云音樂在推薦上,極大可能是基于歌曲。即對(duì)每首歌進(jìn)行標(biāo)簽化,然后對(duì)歌曲之間進(jìn)行計(jì)算。但是,不難發(fā)現(xiàn),每首歌曲只有作者、專輯、包含歌單。所以,如果僅僅是根據(jù)每首歌曲的標(biāo)簽也很難進(jìn)行相似度計(jì)算。

(3)這時(shí)候,引入歌單,即云音樂后臺(tái)有大量用戶們自己創(chuàng)建的相似歌曲的歌單。每個(gè)收聽次數(shù)較多的歌單都有相應(yīng)的標(biāo)簽,即音樂的語種、風(fēng)格等。將音樂表與歌單表相關(guān)聯(lián),而后計(jì)算每個(gè)歌單里每首歌的相似度,進(jìn)行推薦。

(4)個(gè)人覺得這也是最重要的一步:音樂評(píng)分體系。

每日歌曲推薦的大部分是評(píng)論+999的歌,所以在找到相似歌單同時(shí),進(jìn)一步篩選有質(zhì)量的歌曲推薦給用戶。(這也只是自己的一個(gè)猜測(cè)而已)

這是自己最近看了一些參考文章和對(duì)云音樂推薦的大致猜想。總覺得自己還有很多地方?jīng)]考慮周全,所以歡迎留言多多交流。

相關(guān)參考

【1】推薦系統(tǒng)算法初探 ?http://dwz.cn/4HyI1v

【2】推薦算法 ?http://dwz.cn/4HLdi0

【3】推薦算法 https://www.zhihu.com/topic/19580544/hot

 

作者:MOMO

來源:微信公眾號(hào):數(shù)據(jù)分析實(shí)習(xí)生(DA_Intern)

本文由 @MOMO 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 余弦算法范圍【0,1】,百科是這樣寫的

    來自北京 回復(fù)
  2. 一直覺得云音樂的推算方法很準(zhǔn),每天加班都會(huì)聽從而導(dǎo)致經(jīng)常加班。。。 ??

    來自河北 回復(fù)
    1. 哈哈

      來自北京 回復(fù)
    2. 牛逼

      來自廣東 回復(fù)