不要迷信算法,會變得無趣

5 評論 7504 瀏覽 3 收藏 16 分鐘

編輯導語:算法推薦在各個平臺應用廣泛,在抖音上刷到了一個視頻,你點贊了,這一段時間就會不時地給你推薦相關(guān)類型的視頻,讓你感覺它占據(jù)了你的全部信息場所,但是事實上不是這樣的,算法推薦只是基于一定基礎上進行推薦,你仍可以根據(jù)自己的喜好搜索自己想要的信息。這篇文章介紹了APP工廠真正的優(yōu)勢和算法推薦并不是唯一的信息推薦方式,推薦想要了解算法推薦的童鞋進行閱讀。

在互聯(lián)網(wǎng)世界,近年來彌漫著一股“算法迷信”的風氣,并且有愈演愈烈之勢。

以字節(jié)跳動的快速崛起為起點,尤其是大家提到抖音時,會理所當然地認為他們的秘密武器是存儲在服務器里那一行行神秘的代碼。

這種迷信在去年TikTok的強制賣身風波中體現(xiàn)得淋漓盡致。當談判陷入僵局,有相當一部分競購方認為如果出售業(yè)務不帶有算法,那么毫無意義。

《華爾街日報》援引自消息人員的說法是,沒有算法的TikTok就如同用著廉價引擎的豪車。

但事實上,字節(jié)內(nèi)部關(guān)于機器學習推薦算法并未取得多少外界未知的突破性進展。

雖然抖音并未在國內(nèi)公布他們的算法是如何工作的,但為了自證清白,TikTok不僅向當?shù)氐谋O(jiān)管機構(gòu)和外部隱私專家開放了查看代碼的權(quán)利,還在洛杉磯建立了一個存放著所有數(shù)據(jù)流和代碼的透明度及問責中心。

可我們至今都沒有找到任何關(guān)于個性化推薦算法函數(shù)本身的顛覆性創(chuàng)意,美國市場上也沒有出現(xiàn)新的相關(guān)產(chǎn)品。那么,APP工廠的真正優(yōu)勢,到底在哪里?

一、字節(jié)系爆款真正的閃光點,在算法友好型的UI設計上

過去二十年,科技產(chǎn)品的UI設計始終圍繞著如何消除用戶與他們的需求之間的摩擦。

在這個網(wǎng)絡效應爆發(fā)式增長的時代,誰能設計出比競爭對手更好地滿足用戶需求的產(chǎn)品和服務,誰就能成為利用聚合理論獲得大量用戶群的科技巨頭。

這是一種寫在字里行間的以用戶為中心。

拔地而起的科技公司,迅速過載的膨脹信息,讓我們?yōu)橛脩籼峁┳詈梅盏年P(guān)鍵,從洞察人們某種未被發(fā)掘的需求變成了利用機器學習算法實現(xiàn)對海量數(shù)據(jù)的篩選與過濾。

首先明確一個前提:ML算法的訓練需要大量的數(shù)據(jù)集,任何一個Google或Facebook的算法專家都沒辦法獨自訓練出一個高質(zhì)量的推薦算法。

這是否意味著所有全新垂類的APP都會被打上大廠的標簽?

大概率是這樣,但不全是。

自1998年亞馬遜推出基于項目的協(xié)同過濾算法以來,它被改編和應用到了大部分網(wǎng)頁上,比如向人們推薦視頻或新聞的算法,以及各式各樣的互聯(lián)網(wǎng)廣告。

但作為個性化推薦的商業(yè)鼻祖,亞馬遜只有30%的網(wǎng)頁瀏覽量來自推薦系統(tǒng),搜索結(jié)果頁面目前仍是用戶下單的最主要路徑。

在這個推薦引擎中,系統(tǒng)正常運轉(zhuǎn)的前提是用戶過往的購買記錄、在商店瀏覽過的商品、已經(jīng)添加到購物車里的商品,以及一些以后可能會訂購的商品。

所有的一切都是基于用戶的搜索行為。所以時至今日,我們依然會面臨在淘寶上搜索一次“花架”就一直被推薦花架的囚徒困境,而不是轉(zhuǎn)而詢問你需不需要一盆花。

可以明顯地感覺到,這類算法永遠都處于“猜你喜歡”的狀態(tài)。因為當屏幕上同時展示多個項目時,它無法分辨出你的眼睛所注視的到底是哪個區(qū)域。就算能看到,因為沒有upvote/downvote的反饋設置,它也不可能知道這種關(guān)注是正面的還是負面的。

一言以蔽之,算法對用戶情緒的判斷并不清晰。

然后我們再來看抖音的界面。

從視頻開始播放的那一刻起,APP的UI設計會促使用戶立即開始思考一個問題:你怎么看待眼前的這個視頻?

  1. 你會在視頻還沒播放完的時候就下滑進入下一個視頻嗎?是的話就隱含表示你對它不感興趣。
  2. 你看完了它,還給視頻漫不經(jīng)心地點了個贊?
  3. 你在這個視頻中停留了一陣子,甚至讓它循環(huán)播放了好幾次?
  4. 你通過內(nèi)置的分享面板把這段視頻分享給別人了嗎?
  5. 你是否點擊了右下角旋轉(zhuǎn)的LP圖標,看了更多使用同款背景音樂的視頻?
  6. 你打開視頻制作者的個人界面頁面了嗎? 是否觀看了他其他的視頻?之后你關(guān)注這個人了嗎? 是的話,說明你除了喜歡這個視頻之外,也許還特別喜歡這類人。

但這些都不屬于硬核的技術(shù)突破,而是來自UI方面的巧妙構(gòu)思。

這種設計最大的特點,就是幫助用戶像算法一樣看東西。

所以抖音的算法比其他短視頻APP學得更快。這一點非常重要,要知道,即使算法本身同幾年前并沒有有太大差別,僅僅是在更大的數(shù)據(jù)集上進行訓練,就足以讓OpenAI開發(fā)出GPT-3這樣的模型。

在抖音之前,絕大部分短視頻App都采用了微博式的界面,照搬圖文信息流的展示方式,以縮略圖的形式顯示視頻,再加上幾個關(guān)鍵詞標簽或一段描述。

這種信息展示的方式歷史悠久,適用面很廣,但是對算法來說并不友好。

至于抖音設計巧思的來源,如果你恰巧使用過他們早期的版本,就會發(fā)現(xiàn)其界面、內(nèi)容、調(diào)性與Musical.ly如出一轍。

據(jù)說張一鳴很早就洽談過收購musical.ly,后來未果才回國做了抖音。完成反向收購之后,字節(jié)的后端算法插入Musical.ly(現(xiàn)在的TikTok)的效果是顯著的,用戶時長很快就增長了一倍以上。

二、算法推薦是重要的,但它并非全部

信息展現(xiàn)方式一直是互聯(lián)網(wǎng)產(chǎn)品里最基礎的部分,也是爭議最大的部分。

只是在技術(shù)至上的論調(diào)下被忽略了。

最常見的信息展現(xiàn)方式有瀑布流,以及全屏。它們之間的區(qū)別在于一屏里放多少內(nèi)容合適。

按照張小龍在微信公開課上的說法,一屏里的內(nèi)容條數(shù),跟命中率成反比。所以視頻號上線后的前半年,采用半屏式的信息流展現(xiàn)方式。后來在灰度半屏和全屏的用戶時,關(guān)注tab的用戶因為內(nèi)容命中率不夠高,全屏后反而帶來了后臺清晰可見的選擇困難。

這是內(nèi)容池深度的問題,與推薦算法的調(diào)教無關(guān)。

這里普及一個技術(shù)方面的常識:當?shù)讓诱倩貎?nèi)容數(shù)據(jù)不足時,算法會從候選隊列中進行降級召回。

即本來算法覺得用戶可能會喜歡內(nèi)容A,但整個內(nèi)容候選集中都沒有A的存在,只能遞補與A相近的B。

如果連B都沒有時,算法會進一步做降級召回處理,或是直接按照熱度排序補充全局熱門的內(nèi)容給用戶。

從而帶來持續(xù)的惡性循環(huán)——被污染了的算法模型,會始終局限在某個范圍內(nèi)尋求帕累托次優(yōu)解。

出于這樣的理由,我更愿意相信視頻號的全屏是出于內(nèi)容積累到達某個臨界點后開始進入調(diào)教算法的階段,而非所謂的對抖音的妥協(xié)。包括快手的精選tab,也是同樣的道理。

人們永遠可以爭論社交網(wǎng)絡是由什么組成的,但需要明確的一個前提是,大多數(shù)社交網(wǎng)絡都采用一種漸進的方式來擴大規(guī)模。

鼓勵用戶與其他人互關(guān),一次建立一個聯(lián)系。為工具而來,為關(guān)系而留,這樣做唯一的問題就是速度太慢,而互聯(lián)網(wǎng)恰好是一個崇拜速度的地方。

只需要搜幾個關(guān)鍵詞,無需關(guān)注或與任何人成為好友,抖音就可以快速了解一個人的喜好。

我們姑且把它命名為一個圍繞興趣建立的娛樂網(wǎng)絡?,F(xiàn)階段,它是一個快速、高效的傳播媒介,因為這個網(wǎng)絡不由關(guān)系連接,所以抖音博主的流量永遠不可能屬于個體。

很多人認為抖音商業(yè)化走在前面是因為廣告算法好,但實際上抖音對游戲廣告主的包容程度才是隱藏不言的奧秘,他們允許以單個付費用戶為單位結(jié)算,甚至可以約定“若用戶流失則退款”。

然而想靠這個設計留住用戶和增長并不現(xiàn)實(字節(jié)國內(nèi)的廣告收入趨于停滯已經(jīng)證明了這件事)。中文互聯(lián)網(wǎng)的殘酷之處在于,任何UI設計都可以在一夜之間被同類產(chǎn)品模仿和復制,只要它被證明是有用的。

在這個機器學習占據(jù)主流的時代,全屏的設計就是為了幫助算法更快地去“看”這個世界。

但這并不意味著算法是萬能的。因為直到今天,字節(jié)都沒有辦法大規(guī)模地侵入長視頻領(lǐng)域,即使張一鳴的戰(zhàn)略PPT上明明白白地寫著“只要在信息分發(fā)領(lǐng)域,字節(jié)都要用算法來重新做一遍。”

即使抖音的UI設計讓他們的算法迭代更快,也不可能做到篩選出人們行為信息中的所有“噪聲”。有時,人們希望算法再“聰明”一些,更理解自己;有時,人們并不愿意重復看那些自己感興趣的內(nèi)容,也想了解一點公共熱點;還有的時候,人們會想培養(yǎng)一些新的潛在興趣。

事實上,那些乏味重復、引起用戶輕微不快的內(nèi)容才是產(chǎn)品的慢性殺手。如今,這些負面情緒正在抖音的APP里緩慢發(fā)酵。

算法今天不是,未來也不可能是萬能的。

舉一個最直觀的例子,不管是我們自己的優(yōu)愛騰,還是海外那個算法驅(qū)動的Netflix,內(nèi)容消費都是以運營陣地和導航搜索為第一生產(chǎn)力的。

因為決疑成本的巨大差異,長視頻至今還保持著傳統(tǒng)貨架式的消費方式:

最新最熱的內(nèi)容放在首頁曝光度最高的輪播欄;用戶依賴類目導航去查找想要的內(nèi)容,比如按照類型、地區(qū)、上映時間和評分來選擇電影;還有很大一部分消費來自于搜索對應的站外決策。

比如在微博種草了某部電視劇,根據(jù)豆瓣評分來選擇觀看的電影,以及最近身邊的朋友們常常聊起的綜藝。

毫無疑問,算法在長視頻領(lǐng)域依然沒有占據(jù)主導地位。

三、結(jié)語

當個性化推薦在某些領(lǐng)域大殺四方之時,我們總會不由自主地假設它占據(jù)我們?nèi)啃畔鼍暗漠嬅?;然而,現(xiàn)實卻是一個人在日常生活中接觸信息的渠道,遠比他自己想象得要更加豐富。

假設一個初級電影愛好者想在周末看一部電影,會有幾種可能?

他可能直接打開搜索框,搜索自己喜歡的演員或?qū)а?,看看他們還有哪些自己沒看過的作品;也可能打開豆瓣,刷一刷有沒有自己感興趣的電影;當然,如果他有一個朋友恰好是發(fā)燒級的影迷,他可以直接請對方推薦幾部。

事實上,推薦、搜索和社交是滿足人們不同需求的互補類工具,它們之間并沒有明確的替代關(guān)系。

算法與編輯、社交并不對立,也不存在唯一的最優(yōu)選。就像微信的算法,一定有克服「社交情景崩潰」的成分,而今日頭條的內(nèi)容審核,也聘請了大量的人工編輯。

當我們站在科技與人文的交匯點去看這個世界,會發(fā)現(xiàn)每一種新技術(shù)都既是包袱又是恩賜,它永遠不會是非此即彼的結(jié)果,反倒比我們預想中的要更加復雜與深刻。

《楚門的世界》里,創(chuàng)造者對楚門說:“外面的世界跟我給你的世界一樣的虛假,有一樣的謊言,一樣的欺詐。但在我的世界你什么也不用怕,我比你更清楚你自己?!?/p>

楚門卻說:“You never had a camera in my head!”(你無法在我腦子里裝一個攝像機)

盡管楚門的世界是假的,但楚門是真實的。所有計算好的下一刻,是行云流水般的此世光陰。

【參考資料】

  1. 取消算法推薦,是技術(shù)上的倒退嗎?騰訊研究院,2021年
  2. Seeing Like an Algorithm,Eugene Wei,2020年
  3. 算法知識匯總:構(gòu)成/學派/算法,潘一鳴,2019年
  4. 推薦算法的“前世今生”,紙皮小火車,2019年

 

作者 : 牧遙,公眾號:科技復聯(lián)汪

本文由 @科技復聯(lián)汪 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Pexels,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 推薦、搜索和社交是社交互補性工具,不能相互替代,也不能一家獨大。

    來自陜西 回復
  2. 有一段時間很相信算法,感覺算法入侵了我所有娛樂APP,但是后來就發(fā)現(xiàn)不是這樣的,我仍可以根據(jù)喜好去搜索,讓算法猝不及防。

    來自陜西 回復
  3. 大數(shù)據(jù)時代,總是感覺被數(shù)據(jù)所監(jiān)控,在抖音上看了一件商品,有時候刷別的軟件的時候就會到相似的內(nèi)容。

    來自陜西 回復
  4. 不要迷信算法,會變得無趣。你題目把我都給搞混了,哈哈哈,看完之后才知道,原來是明白算法機制之后就可以行云流水了,但是前提是內(nèi)容得還可以。

    來自河南 回復
    1. 是醬紫滴~

      來自四川 回復