重新理解抖音算法

0 評論 1017 瀏覽 2 收藏 16 分鐘

在信息爆炸的時代,推薦算法已成為各大平臺的核心競爭力之一。抖音作為全球領先的短視頻平臺,其算法的運作機制和優(yōu)化策略備受關注。本文將深入剖析抖音算法的邏輯與原理,探討其如何通過協(xié)同過濾、Wide&Deep模型等技術手段實現(xiàn)千人千面的內(nèi)容推送。

技術革新是當今社會廣泛關注的重要命題。

如近日舉行的2025年世界互聯(lián)網(wǎng)大會亞太峰會,便著重探討了AI帶來的前景與挑戰(zhàn)。峰會發(fā)布了《以普惠包容的人工智能治理賦能全球可持續(xù)發(fā)展》報告,旨在深化AI治理與國際合作,通過普惠包容的AI發(fā)展,促進彌合數(shù)字鴻溝。

科技發(fā)展不止于技術進步本身,普惠是其重要一環(huán),而技術透明化則是通向普惠的關鍵路徑。

抖音日前舉辦的“安全與信任中心開放日”活動即是推動技術透明化的典型一例。在活動中,抖音算法工程師等相關工作人員拆解了抖音算法的邏輯與平臺審核流程。推薦算法是AI技術中機器學習的具體應用領域。抖音推薦算法包含“協(xié)同過濾”算法、Wide&Deep模型、雙塔召回模型等多種技術手段,能夠通過分析和學習用戶行為來構建千人千面的內(nèi)容推送。即便算法不懂內(nèi)容,也可以精準捕捉用戶興趣,并以多元化方式增加平臺內(nèi)容豐富度和用戶留存率。

這是抖音持續(xù)努力的方向。2025年3月,抖音上線了“抖音安全與信任中心”網(wǎng)站,面向社會公開算法原理、社區(qū)規(guī)范、治理體系和用戶服務機制。

這些動作進一步幫助公眾理解技術決策的邏輯,有助于建立用戶與用戶、用戶與平臺間的信任,以平臺倡導的優(yōu)質多元內(nèi)容來助推互聯(lián)網(wǎng)內(nèi)容更好地發(fā)展。

01 繭房起于偏見

推薦算法的本質是信息過濾系統(tǒng)。

當下的人身處數(shù)據(jù)和信息爆炸的時代。據(jù)調研機構IDC數(shù)據(jù),全球產(chǎn)生的數(shù)據(jù)量2024年達159ZB,到2028年將達384ZB。需要說明的是,1ZB等于10萬億億個Byte,如果以一部約兩小時的4K電影約20G的大小來衡量,159ZB相當于7.95萬億部電影,連續(xù)播放這些電影需要約18億年。

互聯(lián)網(wǎng)時代的信息遠超個人所能處理的極限,必然需要平臺來分類、篩選和推薦。個性化推薦算法相當于私人管家,已經(jīng)廣泛應用在電商、視頻、社交等不同平臺,能高效、準確地滿足各個用戶的不同需求。

以抖音協(xié)同過濾算法與Wide&Deep模型的結合為例,協(xié)同過濾可以經(jīng)由不同用戶的行為推薦相似內(nèi)容,Wide&Deep模型則能發(fā)覺內(nèi)容的稀有特征并標記相關性,兩者能夠互補,使內(nèi)容推薦更為廣博多樣。

基于內(nèi)容的協(xié)同過濾算法會分析和比較用戶行為。假設用戶甲觀看了A、C、D內(nèi)容,用戶乙觀看了B、C、D內(nèi)容,用戶丙觀看了C、D、E內(nèi)容,算法就會判定C、D內(nèi)容有較高相似度,如果用戶喜歡C,大概率也會喜歡D。這更容易推出受更多人喜愛的頭部內(nèi)容。

Wide&Deep模型則由Wide部分和Deep部分組成,Wide部分讓模型具有較強的記憶能力,可以直接學習并利用歷史數(shù)據(jù)中物品或特征同時出現(xiàn)的頻率;Deep部分則讓模型具有泛化能力,也就是能夠推測未見過的數(shù)據(jù)。比如推測一個喜歡美食的用戶可能對廚具測評感興趣。當Wide&Deep模型與協(xié)同過濾算法共同發(fā)揮作用,平臺既可以快速推薦熱門內(nèi)容,又能挖掘用戶潛在的多樣化興趣,讓小眾內(nèi)容能被更多用戶關注。

不少人將算法視作“信息繭房”推手,但事實與之相去甚遠。

信息繭房一詞來源于美國法學教授凱斯·R·桑斯坦2006年出版的《信息烏托邦》,指如果人只關注和選擇自我愉悅的內(nèi)容,信息接觸面便會越來越窄,困于自我編織的繭房中。事實上,這一概念提出時并非針對算法,也沒有實證研究和量化數(shù)據(jù)支撐。它在當下的廣泛應用更像是互聯(lián)網(wǎng)用戶信息焦慮的集中體現(xiàn)。

推薦算法的基礎是機器學習,即通過對已有數(shù)據(jù)進行數(shù)學建模,尋找規(guī)律,會將用戶對內(nèi)容的具體偏好抽象成數(shù)學關系。即使是最優(yōu)秀的算法工程師,也無法脫離算法技術的種種理論和架構,簡單解釋為什么把某個視頻推薦給了這些用戶而非那些用戶。當每個用戶都變成數(shù)據(jù)里的“點”時,用戶無法縱覽全貌,必然極易感覺身處黑盒當中。抖音推送的算法透明化,正是希望打開黑盒,讓更多人真正理解算法的內(nèi)核。

澳大利亞學者阿克塞爾·布魯恩斯2019年發(fā)表的文章《問題不在技術,笨蛋》就援引了多位學者的實驗,表示社交媒體、搜索引擎等不同網(wǎng)絡平臺實際上擴充了用戶的信息源,使用戶接觸到的信息多樣性高于不使用這些平臺的用戶,如對370萬澳大利亞推特用戶的調研顯示,不同觀點的網(wǎng)絡用戶集群之間不會完全隔離,仍然保有良好互動。

02 優(yōu)質深度并舉

為促進內(nèi)容豐富度提升,抖音推薦算法設置了興趣探索機制。

假如用戶特別喜歡觀看音樂類視頻,那么算法還會嘗試為用戶推送與音樂相關的其他藝術領域,比如美術賞析或舞蹈表演。用戶的興趣點還可能有大小之別,比如大部分人的觀看集中在美食領域,小部分人的觀看在攝影領域,算法推薦時也會給予像攝影這樣的小興趣點更多權重,避免大興趣點領域內(nèi)容的過多重復。

算法還會刻意進行多樣化推薦,以免同質化內(nèi)容讓用戶審美疲勞。一個喜愛搞笑情景劇的用戶,在算法不考慮多樣性的情況下可能會被連續(xù)推薦3個搞笑情景劇和2個其他內(nèi)容,但在算法設定多樣性時只會被推薦1個搞笑情景劇,其余均為多樣化的其他內(nèi)容。

如此一來,算法既能貼合用戶需求,又能助力用戶探索更多可能。而且,這還有助于讓小眾、深度內(nèi)容找到真正喜愛它們的用戶。

據(jù)??素斀?jīng)了解,抖音曾嘗試直接給知識、歷史、科技等深度內(nèi)容做加熱,但實際效果不佳——此舉改變了算法的正常邏輯,會影響數(shù)據(jù)循環(huán),導致這些內(nèi)容的后續(xù)推薦受到干擾;此后,抖音轉換思路,針對深度內(nèi)容訓練,預估收藏和重復觀看概率的模型,使平臺中的深度內(nèi)容分發(fā)效率更高。

博主“米三漢”2024年6月發(fā)布的“450分鐘解讀紅樓夢”的長視頻頗為典型。截至目前,這條視頻播放量超過3億,點贊量達1291萬,收藏量達773萬。抖音總裁韓尚佑表示,2025年抖音優(yōu)質內(nèi)容曝光量將增加300%。

淄博、哈爾濱、天水等城市的走紅也能印證算法對小而美內(nèi)容的力量。本地人習以為常的部分被算法挖掘出來,分發(fā)給那些對旅游與地方特色感興趣的用戶,再經(jīng)由他們層層傳播,最終形成“破圈”的回響。

其中天水麻辣燙的走紅頗值一提。

2024年2月,博主“一杯梁白開”在抖音發(fā)布了“建議全國普及甘肅麻辣燙”的視頻,視頻中的麻辣燙湯汁濃稠、色澤誘人,很快吸引了大量用戶。截至目前,該視頻點贊量達141萬。后續(xù)“三個叁”“橘子公主”等博主前往天水,抖音熱榜出現(xiàn)了“到甘肅吃麻辣燙是什么體驗”“甘肅天水打響2024旅游第一槍”等話題,越來越多用戶參與互動。

得益于算法的精準匹配和信息傳播的裂變高效,天水麻辣燙從“存在感”不強的本地小吃一躍成為當?shù)卮鬅嵛穆肐P,且得到了網(wǎng)友的持續(xù)關注。官方數(shù)據(jù)顯示,2025年清明假期即4月4日至4月6日,天水憑借在線旅游訂單量入圍清明節(jié)全國“黑馬”旅游目的地,全市大部分酒店入住率近100%。

還有小眾的成都“三花”民間川劇團、陜西考古研究員講解的考古知識、被網(wǎng)友稱作“人間清醒直擊靈魂”的作家史鐵生的作品等,都因推薦算法在抖音上煥發(fā)了新生命力。以史鐵生為例,據(jù)《2024抖音讀書生態(tài)報告》,抖音上相關視頻數(shù)量累計增長192%,視頻總時長增長415%。

03 力促技術普惠

平臺提升內(nèi)容豐富度更能增強用戶粘性。

中國人民大學高瓴人工智能學院發(fā)布的《算法向善與個性化推薦發(fā)展研究報告》提及,內(nèi)容類型數(shù)量是否足夠多、內(nèi)容類型的分散程度是否足夠高,與用戶是否能長期留存呈正相關態(tài)勢。清華大學社科院發(fā)布的《用戶使用、算法推薦與信息繭房研究報告》數(shù)據(jù)顯示,70%的用戶對個性化推薦算法持肯定態(tài)度,認可算法能夠幫助用戶解決信息過載問題。

在推薦算法的基礎上,抖音還進一步擴充了平臺機制和功能。

比如社交推薦機制,用戶可以長按視頻,點擊“推薦”,相關視頻就會被分發(fā)給抖音內(nèi)的好友,并顯示是由哪位用戶推薦的。這種社交推薦即是對興趣推薦的補充。還有熱點熱榜,會展示當天重要新聞事件,在話題內(nèi)容中匯集事件的最新進展,平衡不同觀點以幫助用戶了解事件全貌,最大限度避免信息繭房產(chǎn)生。

抖音搜索也在持續(xù)保持增長。據(jù)??素斀?jīng)了解,部分知識類、攻略類內(nèi)容發(fā)布3個月以后,搜索的平均流量占比可達50%以上。平臺將搜索與推薦相結合,使優(yōu)質內(nèi)容產(chǎn)生長尾效應。當然,用戶也可以通過對內(nèi)容或者賬號點擊“不感興趣”,以及在內(nèi)容管理工具里面設置自己的內(nèi)容偏好來優(yōu)化個性化推薦內(nèi)容。

綜合而多元的機制為用戶提供了更多可能。

圖書即是如此。抖音上有大量經(jīng)典圖書、冷門佳作的相關視頻,用戶能夠在瀏覽過程培養(yǎng)興趣,并與出版社、讀書達人鏈接。這使圖書宣傳無需完全按照傳統(tǒng)的媒體宣傳、線下簽售、讀者見面會等路徑,原本獨立的讀者與作者、讀者與讀者被算法“打通”,甚至可以跨越時空界限。這也為圖書出版行業(yè)提供了新的渠道。

推薦算法使農(nóng)業(yè)技術推廣高效便捷。要知道,國內(nèi)中小農(nóng)戶分布廣,種植養(yǎng)殖種類眾多,需要的技術門類繁雜,原本科研機構、農(nóng)業(yè)企業(yè)技術推廣的成本較高,正是短視頻、直播等形式使農(nóng)業(yè)技術推廣的覆蓋面更廣。

擁有22萬粉絲的博主“梁老師講農(nóng)業(yè)”即是農(nóng)業(yè)技術推廣大軍的一員。該博主本名梁振清,已經(jīng)八十多歲,是從業(yè)40年的高級農(nóng)藝師,通過抖音來傳授自己畢生所學的農(nóng)技知識。在推薦系統(tǒng)的幫助下,他的視頻能被準確推薦給對三農(nóng)、鄉(xiāng)村、農(nóng)技感興趣的用戶,用戶也能順勢在搜索框中搜索、了解農(nóng)技相關內(nèi)容,擴展相關知識。

需要說明的是,算法本身只是工具,內(nèi)容平臺不可能全由算法把控內(nèi)容。抖音通過人工參與的平臺治理為算法設置“護欄”,定義和識別各類風險內(nèi)容,結合內(nèi)外部反饋持續(xù)迭代算法,以確保推送的內(nèi)容合法合規(guī)。

隨著推薦算法在日常生活中的滲透率提升,公眾對算法的好奇與疑慮也在增長。如今抖音通過算法透明化實踐,揭開技術決策的數(shù)字面紗,或可由此消除誤解,累積信任,推動內(nèi)容生態(tài)深層次變革。算法給出的不僅是瀏覽和互動的數(shù)據(jù),更是對商業(yè)價值、文化生態(tài)、社會責任的多維支撐。追求正向內(nèi)容多元化的算法,正在成為技術向上向善的重要注腳。

文丨??素斀?jīng)? 許俊浩

來源公眾號:??素斀?jīng)(haikecaijing),打量商業(yè)表里,記錄時代精神。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @??素斀?jīng) 授權發(fā)布,未經(jīng)許可,禁止轉載。

題圖來自 Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!