所謂推薦算法“有罪論”,是真相還是背鍋?

0 評(píng)論 809 瀏覽 1 收藏 15 分鐘

推薦算法究竟是“技術(shù)陰謀”還是推動(dòng)社會(huì)進(jìn)步的利器?本文深入剖析推薦算法的原理與作用,探討其在信息分發(fā)、內(nèi)容多樣性以及社會(huì)價(jià)值創(chuàng)造中的真實(shí)面貌,揭示算法如何在平臺(tái)的精準(zhǔn)把控下持續(xù)向上向善,為數(shù)字生活增添絢麗色彩。

小到拍張照片,大到智能機(jī)器人,算法早已悄悄全面“融入”我們的生活。

從簡(jiǎn)單的規(guī)則到復(fù)雜的自我學(xué)習(xí),算法不斷賦予機(jī)器更接近人類的智能。在算法的推動(dòng)下,以DeepSeek為代表的生成式AI迅速發(fā)展。

不僅如此,無論是社交平臺(tái)的短視頻,還是新聞、電子書,甚至購物軟件,手機(jī)里的每一個(gè)APP能夠精準(zhǔn)判斷用戶喜好,完成“猜你喜歡”,都是靠著算法的推動(dòng)。

一方面,算法不斷推動(dòng)著技術(shù)的進(jìn)步,與此同時(shí),關(guān)于算法“技術(shù)陰謀論”的想象也從未缺席,互聯(lián)網(wǎng)上從不缺對(duì)“信息繭房”和“算法造神”的批評(píng),并把很多關(guān)于“算法陰謀”的想象最終指向平臺(tái)們的商業(yè)行為。

最近,抖音安全與信任中心網(wǎng)站上線,并首次公開抖音推薦算法原理,介紹其推薦算法如何預(yù)估用戶行為概率。那么,“信息繭房”到底存不存在?所謂推薦算法“有罪論”,究竟是真相還是背鍋?

01 爆款視頻真存在所謂的“流量密碼”?

多年前,抖音憑借音樂卡點(diǎn)短視頻火爆全網(wǎng),讓不少人對(duì)抖音內(nèi)容的認(rèn)知一直是“短平快”。然而,除了頭部網(wǎng)紅,去年在抖音上最火的作家,竟然是史鐵生。

根據(jù)抖音發(fā)布《2024抖音讀書生態(tài)數(shù)據(jù)報(bào)告》,抖音上時(shí)長(zhǎng)大于等于5分鐘的讀書類視頻總數(shù)量達(dá)1143.43萬個(gè),收藏量達(dá)3.91億次;讀書類直播累計(jì)730萬場(chǎng),場(chǎng)均觀看人數(shù)3076人;讀書書評(píng)相關(guān)內(nèi)容共有541萬個(gè),總評(píng)論量為2306萬次,《我與地壇》成抖音最受歡迎的名著經(jīng)典,報(bào)告顯示抖音上史鐵生相關(guān)視頻累計(jì)18.6萬個(gè),增長(zhǎng)192%,總時(shí)長(zhǎng)增長(zhǎng)415%,總分享量增加51%。

這似乎與民間總結(jié)的所謂的“流量密碼”背道而馳。

舉個(gè)例子,不少“教人做內(nèi)容”的博主,科普的內(nèi)容基本都是要先了解“內(nèi)容平臺(tái)的算法邏輯”,才能把握住“流量密碼”,做出爆款。

而民間總結(jié)的很多算法邏輯,就是給內(nèi)容和用戶貼標(biāo)簽,然后算法就能向具有特定品位的觀眾推送相匹配的視頻。再就是說算法是通過完播率、點(diǎn)贊率、分享率、粉絲轉(zhuǎn)化率和評(píng)論率等各種指標(biāo)來評(píng)估內(nèi)容的質(zhì)量水平,再推進(jìn)內(nèi)容流量池。

如果根據(jù)以上的邏輯來判斷一個(gè)視頻是否能成為爆款,那關(guān)于“史鐵生”的內(nèi)容顯然不符合大眾認(rèn)知里的“熱點(diǎn)”和“流量”。但實(shí)際上,民間總結(jié)的所謂的“流量密碼”,大部分總結(jié)都過于簡(jiǎn)單、不夠客觀,甚至出現(xiàn)事實(shí)錯(cuò)誤。

在抖音安全與信任中心中,其實(shí)詳細(xì)解釋了算法到底是怎么推薦的。

首先,算法是通過數(shù)據(jù)收集、特征工程、模型訓(xùn)練等復(fù)雜流程預(yù)測(cè)用戶的行為,其本質(zhì)是數(shù)學(xué)模型的運(yùn)算過程。推薦算法的本質(zhì)是個(gè)極其高效的信息過濾系統(tǒng)。個(gè)性化推薦算法,好比給每個(gè)人量身定制了一個(gè)信息“快遞員”,能更高效、準(zhǔn)確地把合適的信息推送到用戶面前,滿足每個(gè)用戶各不相同的需求。

而觀眾從打開抖音、觀看視頻、劃過視頻,以及點(diǎn)贊收藏視頻,都是一次反饋動(dòng)作。抖音公開的推薦算法核心邏輯可以簡(jiǎn)化為“推薦優(yōu)先級(jí)公式”:綜合預(yù)測(cè)用戶行為概率 × 行為價(jià)值權(quán)重 = 視頻推薦優(yōu)先級(jí)。

也就是說在打開抖音的內(nèi)容推薦上,是多目標(biāo)推薦系統(tǒng),通過非常復(fù)雜的體系,優(yōu)化對(duì)內(nèi)容價(jià)值的評(píng)估,不僅僅是點(diǎn)贊收藏,不同用戶、作者的行為價(jià)值權(quán)重等等,共同構(gòu)成了視頻推薦優(yōu)先級(jí)。

同時(shí)抖音還有自己的價(jià)值模型評(píng)估,簡(jiǎn)單來說,通過價(jià)值模型,對(duì)用戶的互動(dòng)行為進(jìn)行價(jià)值計(jì)算,并通過不斷調(diào)整參數(shù),對(duì)各類價(jià)值進(jìn)行加權(quán)。不僅會(huì)關(guān)注內(nèi)容本身以及用戶反饋,還會(huì)考慮到作者收益以及平臺(tái)生態(tài)。

這也就解釋了,為什么史鐵生可以成為抖音上最火的作家:是創(chuàng)作者的精彩輸出、用戶的積極反饋、平臺(tái)對(duì)優(yōu)質(zhì)內(nèi)容推動(dòng)等因素的共同作用。

02 打破信息繭房,才是算法的目標(biāo)

每當(dāng)提到算法,必然會(huì)有人提及現(xiàn)代網(wǎng)絡(luò)世界里的“信息繭房”。

“信息繭房”一詞,最為人熟知的來源是美國(guó)法學(xué)教授凱斯·桑斯坦的《信息烏托邦》,是指當(dāng)個(gè)體只關(guān)注自我選擇的或能夠愉悅自身的內(nèi)容,而減少對(duì)其他信息的接觸,久而久之,便會(huì)像蠶一樣逐漸桎梏于自我編織的“繭房”之中。這一沒有實(shí)證的假說,在當(dāng)下互聯(lián)網(wǎng)環(huán)境中,逐漸被概念泛化和被營(yíng)銷炒作。

一方面,這個(gè)“繭”有可能被技術(shù)強(qiáng)化,但不得不承認(rèn)的是,這種現(xiàn)象更大程度上是由個(gè)人偏好引發(fā)。簡(jiǎn)單來說,人類天生就傾向于接觸符合自己喜好的信息,這才是最終造成所謂“信息繭房”的最主要原因。

但是算法存在的意義,其實(shí)是在當(dāng)下信息過載時(shí)代,讓用戶更為高效地獲取信息。

讓我們來看一組數(shù)據(jù)對(duì)比。

在信息時(shí)代之間,大部分人獲取信息的方式是通過親朋好友,再多一點(diǎn)是報(bào)刊、書籍,而現(xiàn)在,據(jù)IDC(國(guó)際數(shù)據(jù)公司)發(fā)布的《數(shù)據(jù)時(shí)代2025》報(bào)告顯示,全球每年產(chǎn)生的數(shù)據(jù)將從2018年的33 ZB(1 ZB等于10萬億億個(gè)字節(jié))增長(zhǎng)到175 ZB,以25Mb/秒的下載速度計(jì)算,一個(gè)人下載全人類2025年產(chǎn)生的數(shù)據(jù)需要18億年。具體到每個(gè)人,我們每天面對(duì)的各個(gè)平臺(tái)的信息增量,遠(yuǎn)超個(gè)人所能處理的極限。

所以算法從海量數(shù)據(jù)中精挑細(xì)選,通過計(jì)算得出更為優(yōu)質(zhì)的內(nèi)容進(jìn)行推送,某種程度上來說也可以成為打破信息繭房的存在。從商業(yè)理性出發(fā),讓用戶看到更多元的內(nèi)容,有利于平臺(tái)的長(zhǎng)期價(jià)值,因此和用戶的利益是一致的,各個(gè)平臺(tái)早就做了不少打破信息繭房的實(shí)踐。

比如現(xiàn)在大部分平臺(tái)都有“關(guān)閉個(gè)性化推薦”的選項(xiàng)。更進(jìn)一步的是各個(gè)平臺(tái)都在持續(xù)不斷優(yōu)化算法邏輯,比如從最初的單一點(diǎn)贊,增加到對(duì)“負(fù)反饋機(jī)制”的完善,將“不感興趣”等數(shù)據(jù)納入模型訓(xùn)練。

像小紅書之前就強(qiáng)調(diào)用戶可以通過“內(nèi)容偏好調(diào)節(jié)”來掌握對(duì)內(nèi)容的自主選擇和管理權(quán)。這樣就更方便用戶主動(dòng)打破“看過什么就一直推送什么”的循環(huán),讓算法更加高效。

抖音算法在多目標(biāo)建模體系下,設(shè)置了專門的探索維度,通過多樣性探索、興趣探索等目標(biāo),引導(dǎo)算法打破“繭房”。

實(shí)際上,在各個(gè)平臺(tái)對(duì)算法的不斷完善和實(shí)踐中,我們基本已經(jīng)可以認(rèn)識(shí)到算法雖然復(fù)雜,但是同樣可以被“調(diào)教”。抖音總裁韓尚佑曾表示:“真正實(shí)現(xiàn)算法的‘向上’和‘向善’,需要回到算法的原理和生效機(jī)制層面去持續(xù)改進(jìn)?!?/p>

比如曾經(jīng)抖音也嘗試過直接給知識(shí)、歷史、科技等內(nèi)容做簡(jiǎn)單的加熱,但這種做法改變了模型正常的計(jì)算邏輯,反而讓內(nèi)容的后續(xù)推薦受到了干擾。

為了解決這個(gè)問題,抖音轉(zhuǎn)換思路,專門訓(xùn)練了預(yù)估收藏和重復(fù)觀看概率的模型,并且將收藏按鈕,放在了首頁最容易點(diǎn)的地方。通過反復(fù)的實(shí)踐和不斷試錯(cuò),2024年,一條《450分鐘解讀紅樓夢(mèng)》的超長(zhǎng)視頻,在抖音獲得了超過3億的播放,700萬的收藏。

同樣,這也意味著,算法在各個(gè)平臺(tái)的不斷努力下,更加適配當(dāng)下的網(wǎng)絡(luò)環(huán)境和用戶心態(tài)了。

03 當(dāng)算法走進(jìn)生活

實(shí)際上,前文也提到算法在發(fā)展的過程中不斷完善,平臺(tái)也是階段性針對(duì)市場(chǎng)反饋,主動(dòng)做出舉措調(diào)整。而更重要的意義是,在算法不斷完善的過程中,它帶來的社會(huì)價(jià)值也正在一點(diǎn)點(diǎn)顯現(xiàn)出來。

首先,推薦算法基本原理是高效分發(fā),將信息、人原本孤立的點(diǎn)連接起來,當(dāng)不同的信息遇到不同的群體,就會(huì)帶來不同的效應(yīng),進(jìn)而帶來更大的社會(huì)價(jià)值。

2015年,當(dāng)大部分實(shí)體書店都在走下坡路的時(shí)候,電商巨頭亞馬遜開出一家實(shí)體書店,一年半就實(shí)現(xiàn)了盈虧平衡。當(dāng)所有傳統(tǒng)書店都在震驚的時(shí)候,大家發(fā)現(xiàn)這家書店最出色的設(shè)計(jì)就是能夠根據(jù)線上的讀者評(píng)分、預(yù)售情況、銷量排行等通過算法得出“推薦書單”,而很多讀者就是通過這樣高效的推薦方式在貨架上買到了自己想要的書。

而現(xiàn)在,抖音算法更進(jìn)一步通過精準(zhǔn)分法、興趣連接和生態(tài)共建,推動(dòng)實(shí)現(xiàn)了知識(shí)普惠。

抖音上有個(gè)非常有趣的例子,去年一顆長(zhǎng)蘑菇的蘋果在抖音上成為了網(wǎng)紅。故事起因于一位浙江網(wǎng)友分享黃梅天里自己家里的蘋果長(zhǎng)出了蘑菇,于是被中國(guó)科學(xué)院昆明植物研究所許博士注意到,并買下來這個(gè)蘑菇樣本做研究,并且在抖音上向網(wǎng)友實(shí)時(shí)匯報(bào)進(jìn)度,還有不少網(wǎng)友在評(píng)論區(qū)發(fā)出自己見到的菌落請(qǐng)教博士,6000多萬網(wǎng)友共同圍觀了這場(chǎng)全民知識(shí)接力。

現(xiàn)在,抖音的算法在協(xié)同過濾算法和知識(shí)圖譜推理的共同作用下,能夠基于用戶行為,推薦相關(guān)科普內(nèi)容,拓展到相關(guān)領(lǐng)域形成“知識(shí)鏈?zhǔn)椒磻?yīng)”,甚至一些甲骨文、弦理論的小眾知識(shí),都能通過算法找到受眾。

再比如,算法正在推動(dòng)更為實(shí)際的惠民。從淄博燒烤、到哈爾濱、天水等小眾城市的走紅,到農(nóng)產(chǎn)品走出大山,都離不開背后算法的積極作用。

抖音算法通過召回、過濾、排序等環(huán)節(jié),重點(diǎn)學(xué)習(xí)用戶的興趣愛好、瀏覽歷史、購買行為等,通過分析數(shù)據(jù),將大山里的農(nóng)產(chǎn)品精準(zhǔn)推送給對(duì)農(nóng)產(chǎn)品感興趣、有需求的用戶,并且通過算法助力打造“新農(nóng)人IP”,讓大眾通過對(duì)農(nóng)人故事的關(guān)注關(guān)聯(lián)到土特產(chǎn)上。

根據(jù)抖音電商發(fā)布的《2024豐收節(jié)抖音電商助農(nóng)數(shù)據(jù)報(bào)告》2023年9月至2024年9月,抖音電商累計(jì)銷售農(nóng)特產(chǎn)品71億單,平均每天有1740萬單農(nóng)特產(chǎn)包裹銷往全國(guó)各地,持續(xù)帶動(dòng)優(yōu)質(zhì)農(nóng)特產(chǎn)品“出村進(jìn)城”。平臺(tái)全年農(nóng)貨商家數(shù)量同比增長(zhǎng)63%,三農(nóng)創(chuàng)作者數(shù)量同比增長(zhǎng)52%。

總而言之,算法作為工具,使用不好是脫韁的野馬,但如果平臺(tái)精準(zhǔn)把控、不斷迭代升級(jí),則會(huì)成為技術(shù)的良駒。值得肯定的是,抖音公開算法,是個(gè)積極的實(shí)踐,至少讓公眾知道,有人工運(yùn)營(yíng)和平臺(tái)治理做導(dǎo)航,算法會(huì)持續(xù)向上向善,為人們的數(shù)字生活增添絢麗的色彩。

本文由人人都是產(chǎn)品經(jīng)理作者【陸玖財(cái)經(jīng)】,微信公眾號(hào):【陸玖商業(yè)評(píng)論】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 這種問題都是有兩面性的,就要看你是怎么看待的,在幫助我們?nèi)粘_x擇的時(shí)候推薦算法就是有用的 在某些領(lǐng)域用戶信息隱私等等,推薦算法就是有害的

    來自廣東 回復(fù)