B站的推薦算法機(jī)制大揭秘!

1 評(píng)論 8018 瀏覽 56 收藏 7 分鐘

本篇文章以2023年5月最新公開(kāi)的兩份b站推薦算法為例,具體分析其中的兩大算法:安全算法和推薦算法。作者對(duì)這兩種算法進(jìn)行簡(jiǎn)單舉例,方便讀者理解。希望能對(duì)你有一定的參考幫助。

最近,有塘友讓挖塘人分享一下B站的推薦算法,今天就來(lái)詳細(xì)說(shuō)一說(shuō)。

B站的推薦算法機(jī)制大揭秘!

如今,b站已經(jīng)是不再是之前的那個(gè)二次元內(nèi)容網(wǎng)站了,它現(xiàn)在被稱(chēng)為「中國(guó)版的YouTube」,流量和用戶(hù)近幾年上漲很快,內(nèi)容也在不斷地向多元化發(fā)展。

從創(chuàng)作者或者商家的角度來(lái)看,它是一塊香甜的流量蛋糕,但要想吃到這塊蛋糕,還是需要方法和技巧的。下面挖塘人就給大家捋捋B站的內(nèi)容推薦算法機(jī)制。

在正文開(kāi)始之前,我們說(shuō)兩個(gè)事實(shí):

1)算法不斷更新

其實(shí),b站的運(yùn)營(yíng)方法和機(jī)制在幾年前挖塘人就分享過(guò),但現(xiàn)在回過(guò)頭看,變化太多了。

所以我們需要明白一個(gè)事實(shí):那就是各個(gè)平臺(tái)的智能算法都會(huì)不斷更新,不斷地完善。大家不要想著「一成不變」,更不能使用遠(yuǎn)古的運(yùn)營(yíng)方法來(lái)運(yùn)營(yíng)現(xiàn)在的平臺(tái),必須與時(shí)俱進(jìn)。

當(dāng)然,挖塘人也會(huì)及時(shí)給大家分享各平臺(tái)的動(dòng)態(tài)。

2)算法不是玄學(xué)

很多人看平臺(tái)推薦算法的文章都是別人加工后的或者說(shuō)根據(jù)自己的經(jīng)驗(yàn)猜的,但看的人傳來(lái)傳去就變成了玄學(xué)。

其實(shí),算法不是玄學(xué)。它是有依據(jù),有數(shù)據(jù)指標(biāo)的,以2023年5月最新公開(kāi)的兩份b站推薦算法為例,它里面就明確說(shuō)了很多具體的數(shù)據(jù)指標(biāo)。

B站的推薦算法機(jī)制大揭秘!

下面,我們來(lái)說(shuō)說(shuō),這兩份b站算法報(bào)告具體包含了哪些數(shù)據(jù)指標(biāo)和運(yùn)行原理:

一、安全算法

很多人以為作品發(fā)布后就會(huì)進(jìn)入系統(tǒng)的推薦池。其實(shí)不然,作品發(fā)布后首先是被安全算法過(guò)一遍,安全算法或者叫過(guò)濾算法是各大ugc平臺(tái)都有的一種算法,它的目的就是識(shí)別不符合要求的內(nèi)容。

根據(jù)嗶哩嗶哩內(nèi)容安全算法公開(kāi)的內(nèi)容介紹,安全算法主要包含三個(gè)部分:

  1. 內(nèi)容理解模塊,它是負(fù)責(zé)內(nèi)容識(shí)別的模型。
  2. 運(yùn)營(yíng)工具,這個(gè)主要是方便平臺(tái)的維護(hù),可以通過(guò)某個(gè)特性批量識(shí)別某些內(nèi)容,比如要屏蔽某個(gè)劣跡藝人,運(yùn)營(yíng)人員可以在數(shù)據(jù)庫(kù)里操作就可以了。
  3. 訓(xùn)練模塊,這個(gè)屬于給算法喂數(shù)據(jù)的環(huán)節(jié),它會(huì)讓安全算法越來(lái)越完善,這也是我們上面說(shuō)的算法會(huì)不斷更新。

B站的推薦算法機(jī)制大揭秘!

那么具體有哪些內(nèi)容不能通過(guò)安全算法呢?

這個(gè)在b站的社區(qū)中心里都說(shuō)的很明白,對(duì)于一些比較突發(fā)的或者平臺(tái)臨時(shí)在數(shù)據(jù)庫(kù)加的規(guī)則,平臺(tái)也會(huì)作出對(duì)應(yīng)的說(shuō)明。

二、推薦算法

通過(guò)安全算法,只要不違規(guī)都可以,但要玩轉(zhuǎn)推薦算法就沒(méi)有那么容易了,因?yàn)樗挠绊懸蛩靥嗔?,而且邏輯也多?/p>

首先,公示的算法機(jī)制機(jī)理內(nèi)容明確提到影響一個(gè)作品的數(shù)據(jù)指標(biāo)有作品的播放量、點(diǎn)贊、投幣、收藏、關(guān)注以及分享等正向因素,還有點(diǎn)踩、不感興趣等負(fù)向因素。

其次,把這些作品通過(guò)上述數(shù)據(jù)指標(biāo)會(huì)對(duì)一批內(nèi)容進(jìn)行綜合排序,但并不是排完序就直接展示給用戶(hù)。它還需經(jīng)過(guò)去重、打散等處理環(huán)節(jié),最后再輸出最終的排序并展示給用戶(hù)。

B站的推薦算法機(jī)制大揭秘!

按照上面的解釋?zhuān)蠹铱赡芸床欢@里挖塘人畫(huà)了一張圖來(lái)幫助大家理解:

B站的推薦算法機(jī)制大揭秘!

其中有兩個(gè)主要的信息需要我們重視,一個(gè)是作品的互動(dòng)數(shù)據(jù),另一個(gè)是作品的權(quán)重。

1. 互動(dòng)數(shù)據(jù)

算法說(shuō)明里面提到兩個(gè)方向的因素,即正反向因素。如果正向因素好,作品的推薦流量就好越多;反之就會(huì)減少推薦。

2. 作品權(quán)重

算法里的去重和打散等處理其實(shí)是在給入圍的作品進(jìn)行加權(quán)排序,它是通過(guò)各種系數(shù)計(jì)算得出的結(jié)果。

比如有ABCD四個(gè)賬號(hào)分別發(fā)布了作品abcd,這四個(gè)賬號(hào)的權(quán)重分別為1、2、2、1,作品的綜合排序權(quán)重為2、3、2、1。

而根據(jù)加權(quán)公式:

最終排序權(quán)重=作品權(quán)重*0.8+賬號(hào)權(quán)重*0.2

我們可以得出以下結(jié)果:

B站的推薦算法機(jī)制大揭秘!

所以展示給用戶(hù)的順序?yàn)閎cad。

當(dāng)然,這里只是為了方便大家理解舉的一個(gè)例子。b站的實(shí)際加權(quán)公式要更復(fù)雜,而我們可以操作的是加強(qiáng)作品的互動(dòng)數(shù)據(jù)和賬號(hào)權(quán)重,這樣不管平臺(tái)的加權(quán)公式是怎樣的,我們的數(shù)據(jù)都可以盡量得到最大值。

以上就是今天的內(nèi)容,希望對(duì)你有幫助。

作者:挖塘人,微信公眾號(hào):挖塘人

本文由 @挖塘人 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. B站排序中,考慮不同維度因子的正負(fù)向傾向是什么意思呢

    來(lái)自北京 回復(fù)