豆瓣圖書(shū)推薦策略調(diào)研與問(wèn)題歸納

0 評(píng)論 6850 瀏覽 49 收藏 10 分鐘

筆者列出相關(guān)指標(biāo),對(duì)豆瓣圖書(shū)的推薦策略進(jìn)行了調(diào)研,歸納總結(jié)了幾個(gè)問(wèn)題,針對(duì)問(wèn)題給出了相應(yīng)的改進(jìn)方案。你的豆瓣給你推薦了什么書(shū)?

一、定義理想態(tài)

1.1 理想態(tài)定義

豆瓣推薦的書(shū)籍與用戶(hù)興趣相關(guān)(書(shū)籍查看率大于等于80%),令用戶(hù)滿(mǎn)意(書(shū)籍想讀率大于等于80%)并且能夠拓寬用戶(hù)興趣邊界(多樣性、時(shí)效性、新穎性)。

1.2 理想態(tài)指標(biāo)

用戶(hù)滿(mǎn)意度,涉及指標(biāo)定義如下:

  • 書(shū)籍查看率:用戶(hù)點(diǎn)擊推薦書(shū)籍?dāng)?shù)/推薦書(shū)籍?dāng)?shù);
  • 書(shū)籍想讀率:用戶(hù)標(biāo)記推薦書(shū)籍想讀數(shù)/推薦書(shū)籍?dāng)?shù);
  • 書(shū)籍評(píng)價(jià)率:用戶(hù)評(píng)價(jià)(包括標(biāo)記讀過(guò)、在讀、評(píng)分)推薦書(shū)籍?dāng)?shù)/推薦書(shū)籍?dāng)?shù)。

預(yù)測(cè)準(zhǔn)確度,涉及指標(biāo)定義如下:

  • 預(yù)測(cè)準(zhǔn)確度:點(diǎn)擊查看書(shū)籍?dāng)?shù)/推薦書(shū)籍?dāng)?shù);
  • 覆蓋率;
  • 多樣性;
  • 時(shí)效性;
  • 新穎性。

二、抽樣分析

2.1 Case選擇

5~10本書(shū)籍的case選擇覆蓋面太窄,因此目前將書(shū)籍從內(nèi)容類(lèi)型角度分為9種類(lèi)型,每種類(lèi)型選擇一本書(shū),具體選擇如下圖所示。

2.2 Case匯總

9種case匯總?cè)缦聢D所示(由于表格較長(zhǎng),一張表格拆成兩張圖展示)。

2.3 問(wèn)題分析

案例1

【推薦書(shū)籍5、6、7、9、10】

問(wèn)題說(shuō)明:多樣性不足-同一個(gè)作者推薦太多。

從文學(xué)小說(shuō)這個(gè)類(lèi)型的書(shū)籍出發(fā),雖然大家對(duì)同一個(gè)作者的書(shū)籍更有可能感興趣,但是查看書(shū)籍為同一作者的推薦項(xiàng)占比超過(guò)50%還是過(guò)高了。因此這5本書(shū)籍的主要問(wèn)題都是同一個(gè)作者推薦太多。

原因:不管從作者角度,還是內(nèi)容類(lèi)型角度出發(fā),該書(shū)籍都不可能屬于冷門(mén)書(shū)籍。因此推薦多樣性不足的原因就不可能是收錄的書(shū)籍?dāng)?shù)目太少,而應(yīng)當(dāng)是權(quán)重有問(wèn)題,導(dǎo)致同一個(gè)作者的書(shū)籍占據(jù)了推薦書(shū)籍的90%。

可能的原因有三種:

  1. 有可能是作者標(biāo)簽過(guò)重;
  2. 用戶(hù)協(xié)同過(guò)濾算法權(quán)重過(guò)大;
  3. 用戶(hù)畫(huà)像中用戶(hù)對(duì)該作者的喜好程度極高,且權(quán)重大,導(dǎo)致推薦90%為同一作者書(shū)籍。

改進(jìn)方案:

  1. 推薦邏輯中,降低作者標(biāo)簽權(quán)重;
  2. 推薦邏輯中,降低用戶(hù)協(xié)同過(guò)濾算法權(quán)重;
  3. 推薦邏輯中,當(dāng)用戶(hù)畫(huà)像中,用戶(hù)對(duì)某一標(biāo)簽(作者)的喜好程度極高,導(dǎo)致推薦過(guò)于單一(造成40%以上的推薦都是同一標(biāo)簽)時(shí),推薦中需要相應(yīng)降低用戶(hù)畫(huà)像的權(quán)重。

案例3

【推薦書(shū)籍2、3】

問(wèn)題說(shuō)明:推薦準(zhǔn)確度太低-幾乎無(wú)相關(guān)性。

這兩本書(shū)相關(guān)性過(guò)于弱了,對(duì)于查看5+3的用戶(hù)來(lái)說(shuō),很有可能是學(xué)生家長(zhǎng),也很難會(huì)對(duì)這兩本書(shū)感到滿(mǎn)意。

原因:從該case其他推薦書(shū)籍來(lái)看,豆瓣雖然可能對(duì)教輔書(shū)的收錄和標(biāo)簽管理不足,但也有其他通識(shí)教育類(lèi)的書(shū)籍可以推薦,因此出現(xiàn)該問(wèn)題的原因應(yīng)當(dāng)是標(biāo)簽不準(zhǔn)確。

改進(jìn)方案:

  1. 增加收錄該類(lèi)目書(shū)籍;
  2. 調(diào)整優(yōu)化書(shū)籍標(biāo)簽。

【推薦書(shū)籍4、5、8、10】

問(wèn)題說(shuō)明:推薦準(zhǔn)確度太低-屬于同一大類(lèi)型,但細(xì)分類(lèi)差別太大。

這4本書(shū)從內(nèi)容角度來(lái)看具有一定相關(guān)性,可以屬于一個(gè)內(nèi)容類(lèi)型大類(lèi)。但是,從細(xì)分領(lǐng)域來(lái)看,兩類(lèi)書(shū)的差別還是較為明顯,可能能夠探索用戶(hù)的興趣邊界,但是用40%的推薦項(xiàng)來(lái)探索用戶(hù)興趣邊界過(guò)多了。

原因:同類(lèi)型書(shū)籍收錄過(guò)少,標(biāo)簽不準(zhǔn)確,推薦目的錯(cuò)誤。

改進(jìn)方案:

  1. 增加收錄該類(lèi)目書(shū)籍;
  2. 調(diào)整優(yōu)化書(shū)籍標(biāo)簽。

【推薦書(shū)籍6、7】

問(wèn)題說(shuō)明:推薦準(zhǔn)確度太低-幾乎無(wú)相關(guān)性。

相關(guān)性過(guò)弱,而作為探索用戶(hù)的興趣邊界的推薦項(xiàng),與上一個(gè)問(wèn)題加起來(lái)占比超過(guò)60%,顯然不是正確的策略。

原因:同類(lèi)型書(shū)籍收錄過(guò)少,標(biāo)簽不準(zhǔn)確,推薦目的錯(cuò)誤。

改進(jìn)方案:

  1. 增加收錄該類(lèi)目書(shū)籍;
  2. 調(diào)整優(yōu)化書(shū)籍標(biāo)簽。

案例4

【整體問(wèn)題】

問(wèn)題:推薦準(zhǔn)確度太低-沒(méi)有推薦該作者的其他書(shū)籍。

沒(méi)有推薦該作者的其他書(shū)籍。單個(gè)推薦書(shū)籍沒(méi)有問(wèn)題,但是整體來(lái)看該作者推薦書(shū)籍太少?!度蛲ㄊ贰纷鳛闊衢T(mén)書(shū)籍,作者也并不是只有這一本代表作的情況,存在一定明星效應(yīng),因此可以多推薦1、2本該作者的其他書(shū)籍。

原因:標(biāo)簽權(quán)重有問(wèn)題。

改進(jìn)方案:推薦邏輯中,提高作者標(biāo)簽權(quán)重。

案例6

【推薦書(shū)籍1】

問(wèn)題說(shuō)明:時(shí)效性考慮不足。

時(shí)效性不足,書(shū)籍作者有更新的攝影書(shū)籍《長(zhǎng)皺了的小孩》,該書(shū)豆瓣已有收錄,但是豆瓣并沒(méi)有推薦。

原因:標(biāo)簽權(quán)重有問(wèn)題。

改進(jìn)方案:推薦邏輯中,提高時(shí)效性標(biāo)簽權(quán)重。

【推薦書(shū)籍4、10】

問(wèn)題說(shuō)明:多樣性不足-同一個(gè)作者推薦太多。

算上書(shū)籍2、3,推薦阮義忠的書(shū)籍共有4本。阮義忠不是該書(shū)籍的作者,但他的書(shū)籍占推薦項(xiàng)的40%,顯然過(guò)多了。

原因:

  • 標(biāo)簽權(quán)重有問(wèn)題;
  • 用戶(hù)畫(huà)像中用戶(hù)對(duì)該作者的喜好程度極高,且權(quán)重大,導(dǎo)致推薦40%為同一作者書(shū)籍。

改進(jìn)方案:

  1. 優(yōu)化推薦規(guī)則,減少同一作者的推薦書(shū)籍;
  2. 推薦邏輯中,當(dāng)用戶(hù)畫(huà)像中,用戶(hù)對(duì)某一標(biāo)簽(作者)的喜好程度極高,導(dǎo)致推薦過(guò)于單一(造成40%以上的推薦都是同一標(biāo)簽)時(shí),推薦中需要相應(yīng)降低用戶(hù)畫(huà)像的權(quán)重。

案例7

【推薦書(shū)籍10】

問(wèn)題說(shuō)明:展現(xiàn)順序不合理。

該書(shū)籍與查看的書(shū)籍相關(guān)性很高,但是卻排在推薦書(shū)籍末尾,排序有問(wèn)題。

原因:標(biāo)簽權(quán)重有問(wèn)題。

改進(jìn)方案:排序邏輯中,提高內(nèi)容相關(guān)性標(biāo)簽權(quán)重。

案例8

【整體問(wèn)題】

問(wèn)題說(shuō)明:多樣性不足-同一套書(shū)籍推薦太多。

所有推薦書(shū)籍均為火影忍者,沒(méi)有多樣性可言,很難讓用戶(hù)滿(mǎn)意。

原因:

  • 標(biāo)簽權(quán)重有問(wèn)題;
  • 用戶(hù)畫(huà)像中用戶(hù)對(duì)該套書(shū)籍的喜好程度極高,且權(quán)重大,導(dǎo)致推薦40%為同一作者書(shū)籍。

改進(jìn)方案:

  1. 推薦邏輯中,降低成套書(shū)籍相關(guān)性標(biāo)簽權(quán)重;
  2. 推薦邏輯中,當(dāng)用戶(hù)畫(huà)像中,用戶(hù)對(duì)某一標(biāo)簽(成套書(shū)籍)的喜好程度極高,導(dǎo)致推薦過(guò)于單一(造成40%以上的推薦都是同一標(biāo)簽)時(shí),推薦中需要相應(yīng)降低用戶(hù)畫(huà)像的權(quán)重。

案例9

【推薦書(shū)籍2】

問(wèn)題說(shuō)明:展現(xiàn)順序不合理。

該書(shū)籍與查看的書(shū)籍相關(guān)性并沒(méi)有其他推薦書(shū)籍高,但是排在推薦書(shū)籍第二位,排序有問(wèn)題。

原因:標(biāo)簽權(quán)重有問(wèn)題。

改進(jìn)方案:排序邏輯中,提高內(nèi)容相關(guān)性標(biāo)簽權(quán)重。

【推薦書(shū)籍8】

問(wèn)題說(shuō)明:重復(fù)推薦。

該書(shū)籍與推薦書(shū)籍7重復(fù),這本應(yīng)該是一個(gè)非常容易避免的錯(cuò)誤。

原因:排序規(guī)則有問(wèn)題。

改進(jìn)方案:優(yōu)化推薦規(guī)則,過(guò)濾重復(fù)書(shū)籍。

三、改進(jìn)方案

3.1 改進(jìn)方案匯總

影響面計(jì)算說(shuō)明:?jiǎn)栴}涉及案例推薦書(shū)籍?dāng)?shù)/總案例推薦書(shū)籍?dāng)?shù)=x/90。

 

本文由 @misbone 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自 Unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!