為什么你的 App 知道你想買什么?
你有沒有感到疑惑過,當(dāng)你想買某件東西的時候,它會出現(xiàn)在你的推薦頁首頁。
數(shù)字生活讓人疑神疑鬼。
你剛在微信上和朋友說要去日本玩,就在朋友圈看到了機(jī)票廣告,你老婆剛給你打電話讓你買奶粉,你就在淘寶看到了奶粉推薦。
這些廣告都是怎么來的?為什么這些 APP 都知道你想買什么?
淘寶當(dāng)然不會竊聽你的電話,是你的行為數(shù)據(jù)讓淘寶意識到了你需要嬰兒奶粉。
注冊一個賬號,你需要輸入自己的名字,手機(jī)號,有時候還會補(bǔ)充性別,所在地。但這只是微不足道基礎(chǔ)數(shù)據(jù)。
更重要的,是你的消費(fèi)記錄,打車頻率,關(guān)注的公眾號,玩過的游戲,理財習(xí)慣,有沒有車貸房貸買過保險,發(fā)過的紅包,這些行為最后會變成幾千個事實標(biāo)簽,成為你行為數(shù)據(jù)的一部分。
采集事實標(biāo)簽并不難,難的是建立模型,從雜亂的標(biāo)簽中找到你真正的興趣,進(jìn)而構(gòu)建用戶畫像。
舉個例子,你打開一篇內(nèi)容標(biāo)簽為美女的文章,并不意味著你真的愛看美女,可能只是不小心點到。這時,就需要通過你更多的行為來判斷這篇文章對你的吸引力。
這是一個非常初級的內(nèi)容標(biāo)簽權(quán)重算法:
興趣標(biāo)簽(美女)權(quán)重 = 行為權(quán)重 x 訪問時長 x 衰減因子
- 行為權(quán)重:什么都不干1分,評論+0.5,點贊+0.5,轉(zhuǎn)發(fā)+2,收藏+1
- 時長權(quán)重:10S以內(nèi)權(quán)重為0.5,10S-60S為1,60S以上為2
- 衰減因子:0-3天內(nèi)權(quán)重為1,3-7天權(quán)重為0.85,7-15天權(quán)重為0.7,15-30天權(quán)重為0.5,30天以上權(quán)重為0.1
行為權(quán)重對應(yīng)你是否有評論、點贊、轉(zhuǎn)發(fā)、收藏等操作,不同操作有不同的數(shù)值,累加成行為權(quán)重。
停留時間越長,時間權(quán)重也越高。最后,短期行為也無法代表長期興趣,單次閱讀行為的權(quán)重會隨著時間流逝不斷衰減。
于是,你每次打開美女類內(nèi)容都會生成一個興趣權(quán)重,把一段時間內(nèi)你所有的美女類興趣權(quán)重進(jìn)行累加,再用 S 形函數(shù)標(biāo)準(zhǔn)化,就能得到一個「0—10」區(qū)間的興趣標(biāo)簽值。
數(shù)值越高,你對美女就越感興趣。
除了內(nèi)容興趣,這種算法思路可以在消費(fèi)能力,消費(fèi)興趣,社交習(xí)慣等多個維度建立模型,計算你的偏好。
之后,這些偏好會被轉(zhuǎn)換為特征向量。假設(shè)你的美女興趣標(biāo)簽值是8,消費(fèi)能力是5,社交偏好是2,就可以用向量表示為 r (8,5,2)。
我們可以把特征向量理解成多維空間上的一個坐標(biāo),通過把每一個用戶的向量坐標(biāo)帶入余弦公式或距離公式中,就能計算出和你相似的人,進(jìn)而把用戶分類。
但行為數(shù)據(jù)只能計算偏好,無法判斷你的性別、學(xué)歷等個人屬性。
這就需要把已知性別和學(xué)歷的用戶作為樣本,一部分用來訓(xùn)練模型,一部分測試準(zhǔn)確度。今天各大平臺對于用戶性別的預(yù)測準(zhǔn)確度已經(jīng)可以達(dá)到90%以上。
最后,微信淘寶們就能得到一個這樣的用戶畫像:
這樣,廣告主就可以找到他們想要的消費(fèi)者了。
這是騰訊廣告投放平臺的后臺。廣告主可以自由組合包含消費(fèi)水平、婚戀情況、內(nèi)容興趣,消費(fèi)行為在內(nèi)的上千個定向標(biāo)簽供,最后選定廣告位和投放時間,根據(jù)系統(tǒng)計算的 1.5 元每千次曝光的建議出價,就完成了一次精準(zhǔn)投放。
之后,一個住在北京朝陽有過奶粉消費(fèi)記錄的已婚男青年在即將刷到廣告位的那一瞬間,廣告平臺會發(fā)起競價請求,最后,價高的廣告將出現(xiàn)在你的眼前。
如果你對這個話題感興趣,可以在騰訊廣告平臺的開發(fā)者文檔,進(jìn)一步了解你的行為數(shù)據(jù)被處理到了什么樣的程度,比如篩選出“ 2017.7.1 至 2017.7.15 去過上海機(jī)場 3 次以上的人”。
另外,通過行為推薦商品的效果往往不如通過同類推薦商品。找到和你一樣的人,把他們的的瀏覽和消費(fèi)記錄推薦給你,往往比直接猜你喜歡什么效果更好。
需要說明的是,微信淘寶們采集的行為數(shù)據(jù)不僅只對應(yīng)你的賬號,更與你的手機(jī)唯一識別碼綁定在一起。
*安卓手機(jī)上可以采集到的的唯一設(shè)備編碼叫 IMEI,在 iPhone 上叫 IDFA
這意味著, 你就算不注冊不登錄,你的行為數(shù)據(jù)一樣會被采集。
同時,廣告平臺也可以根據(jù)你的手機(jī)識別碼在其他 App 上為你投放廣告,這樣,你刷抖音的時候也能看到淘寶的奶粉廣告了。
別太緊張,根據(jù)《個人信息安全規(guī)范》,商業(yè)廣告平臺的所有標(biāo)簽都應(yīng)該避免精確定位到個人,以保護(hù)你的隱私安全 。
如果你是 iPhone 用戶,還可以通過在設(shè)置中關(guān)閉 IDFA 碼限制 App 們對你的數(shù)據(jù)采集。
作者: 吳松磊,公眾號:回形針PaperClip(ID:papercliptv)
來源:https://mp.weixin.qq.com/s/0Mn2DBGq6JLvMjPQdDIAvQ
本文由 @回形針PaperClip 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
《個人信息安全規(guī)范》是個好東西 感謝作者
非常棒 自己的產(chǎn)品正需要往這方面走 期待更多內(nèi)容 辛苦
你在做什么產(chǎn)品呢?
淘寶只推薦我曾經(jīng)買過的東西。異常雞肋。
本文章圖片來自于回形針。
我是錘子手機(jī)怎么辦
太嚇人了
天天推同樣的東西,推送越來越窄
我也感覺這種推薦有兩面性啊,難道客戶不常買的東西就沒需求了?
為什么淘寶總會推薦我已經(jīng)買過的商品?
因為覺得你會繼續(xù)買??
寫的好,動圖也好,贊!
棒
一個字一個字仔仔細(xì)細(xì)反復(fù)的讀完,漲姿勢了,解鎖了新大陸
漲知識了,漲知識了
然而并不知道,淘寶都是我買完了還一個勁推,要告訴我買貴了嗎?幫客戶做設(shè)計,搜了一些狗糧給我推了好久狗糧。
很棒~~
終于了解 我刷一個淘寶的商品 頭條就推薦了這個產(chǎn)品的廣告鏈接了
寫的挺好的,不知道什么時候可以再出高級的權(quán)重算法? ??
大佬,安卓機(jī)怎么關(guān)閉?