利用AI構(gòu)建動態(tài)用戶畫像的七步法
本篇文章分步為大家詳細地介紹了用AI構(gòu)建動態(tài)用戶畫像的方法,供大家參考學習~
背景:雖然聽過很多用戶畫像的神奇功能和成功案例,但對用戶畫像的構(gòu)建實際是需要從技術(shù)和業(yè)務(wù)高度融合的角度來設(shè)計,否則建立的用戶畫像流于表面的形式而不能發(fā)揮作用。
用戶畫像構(gòu)建的流程和思路
1. 構(gòu)建用戶畫像的戰(zhàn)略目標
構(gòu)建用戶畫像之前,需要先明確用戶畫像構(gòu)建的戰(zhàn)略意義,設(shè)定用戶畫像使用的基本目標。
對于某寶而言,用戶畫像能夠比較準確地反映用戶在一段時間內(nèi)對商品和服務(wù)相對穩(wěn)定的興趣需求,結(jié)合用戶動機、場景、能力和環(huán)境要素的數(shù)據(jù)分析。
一方面能夠支持智能化、個性化的產(chǎn)品推薦和優(yōu)質(zhì)服務(wù);另一方面能夠全面支持企業(yè)精細化運營,提高ROI,合理布局商品和服務(wù)。
下圖為某寶的用戶畫像產(chǎn)品的運用:
圖1
2. 構(gòu)建用戶畫像的方法和流程
“標簽體系”方法是構(gòu)建用戶畫像的核心方法論。標簽強調(diào)的是跟業(yè)務(wù)的緊密聯(lián)系。標簽是某一種用戶特征的符號表示,標簽體系兩個視角:
- “化整為零”,每個標簽都規(guī)定了我們觀察、認識和描述用戶的一個角度;
- “化零為整”,用戶畫像是一個整體,各個維度不孤立,標簽之間有聯(lián)系。
標簽知識圖譜化圖如下圖:
圖2
“標簽體系”方法的基礎(chǔ)是數(shù)據(jù)標簽化。
構(gòu)建用戶畫像的核心流程如下圖:
圖3
3. 用戶畫像基礎(chǔ)數(shù)據(jù)采集
基礎(chǔ)數(shù)據(jù)采集需要全面收集用戶在站內(nèi)和站外所有相關(guān)的靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)。
梳理基礎(chǔ)數(shù)據(jù),需要明確目前都有哪些數(shù)據(jù)源,比如核心的系統(tǒng)線下場景門店、機器、小程序、電子數(shù)據(jù)渠道、營銷渠道和第三方數(shù)據(jù)。
梳理基礎(chǔ)數(shù)據(jù),需要結(jié)合實際需求,梳理相關(guān)的數(shù)據(jù)實體和關(guān)聯(lián)關(guān)系;并且根據(jù)相關(guān)性原則,對某寶的用戶、商品和機器渠道三類數(shù)據(jù)實體進行數(shù)據(jù)分析維度的列舉。
針對每一類數(shù)據(jù)實體,進一步分解可落地的數(shù)據(jù)維度,形成字段集如下舉例。
用戶數(shù)據(jù):
- 用戶自然特征:性別,年齡,地域,教育水平,出生日期,職業(yè),星座;
- 用戶興趣特征:興趣愛好,使用某寶APP/網(wǎng)站【可爬】,瀏覽/收藏內(nèi)容,互動內(nèi)容,品牌偏好,產(chǎn)品偏好;
- 用戶社會特征:婚姻狀況,家庭情況,社交/信息渠道偏好;
- 用戶消費特征:收入狀況,購買力水平,已購商品,購買渠道偏好,最后購買時間,購買頻次。
商品數(shù)據(jù)(以消費電子類為例):
- 手機:品牌,顏色,尺寸,電池容量,內(nèi)存,攝像頭,CPU,材質(zhì),散熱,價格區(qū)間;
- 筆記本:品牌,屏幕尺寸,配置,顏色,風格,薄厚,價格區(qū)間;
- 智能手表:品牌,功能,材質(zhì),電池容量,顏色,風格,價格區(qū)間。
渠道數(shù)據(jù)(以消費電子類為例):
- 信息渠道:微信,微博,論壇,SNS,貼吧,新聞網(wǎng)站,咨詢App;
- 購買渠道:電商平臺,微店,官網(wǎng),實體店,賣場。
圖4
4. 用戶畫像行為建模
完成基礎(chǔ)數(shù)據(jù)采集后,需要對這些數(shù)據(jù)進行清洗、拉通、整合以及分析建模,之后才能構(gòu)建用戶畫像。
首先用戶多渠道信息打通,多數(shù)據(jù)源的情況下,我們要將不同數(shù)據(jù)源的同一個用戶的信息打通。我們可以把用戶手機號、身份證等信息視為用戶的ID,如果用戶的信息在不同數(shù)據(jù)源,那么我們需要進行連接,從而構(gòu)建一張關(guān)聯(lián)圖:
?圖5
圖6
圖中連通的ID可以視為同一個用戶,從而實現(xiàn)用戶拉通,拉通可以基于圖的方法進行強拉通,也可以采用機器學習的方法進行模糊拉通,預(yù)測出拉通的概率。
另外,拉通的可信程度由業(yè)務(wù)的密度決定,密度越高,對可信度的要求越高,譬如推薦是低密度業(yè)務(wù),即使識別錯誤,影響比較小,但對于 電商的 短信通知服務(wù),如果識別錯誤,體驗就會非常差。
圖7
用戶畫像的底層是機器學習,那么無論是要做客戶分群還是精準營銷,都先要將用戶數(shù)據(jù)進行規(guī)整處理,轉(zhuǎn)化為相同維度的特征向量,諸多華麗的算法才可以有用武之地,像是聚類,回歸,關(guān)聯(lián),各種分類器等等。
對于結(jié)構(gòu)化數(shù)據(jù)而言,特征提取工作往往都是從給數(shù)據(jù)打標簽開始的,比如購買渠道,消費頻率,年齡性別,家庭狀況等等。
好的特征標簽的選擇可以使對用戶刻畫變得更豐富,也能提升機器學習算法的效果(準確度,收斂速度等)。
?圖8
5. 用戶畫像可視化
(1)用戶個體畫像;
(2)用戶群體畫像。
圖9
6. 用戶畫像在業(yè)務(wù)上的應(yīng)用
圖10
7. 智能推薦
協(xié)同過濾和貝葉斯智能評分混合推薦。
小結(jié)
AI產(chǎn)品經(jīng)理以大數(shù)據(jù)為基礎(chǔ)通過:
第一步,設(shè)定用戶畫像的目標;
第二步,構(gòu)建以標簽知識圖譜化為系統(tǒng)的標簽體系;
第三步,采集數(shù)據(jù);
第四步,通過對采集的用戶行為數(shù)據(jù)建模;
第五步,實現(xiàn)用戶畫像可視化;
第六步,講按照時間序列更新迭代并應(yīng)用;
第七步,在應(yīng)用用戶畫像知識圖譜過程中結(jié)合算法實現(xiàn)智能推薦。
如果你想系統(tǒng)化入門AI產(chǎn)品經(jīng)理,掌握AI產(chǎn)品經(jīng)理的落地工作方法,戳這里>http://996.pm/7bjab
#專欄作家#
連詩路,公眾號:LineLian。人人都是產(chǎn)品經(jīng)理專欄作家,《產(chǎn)品進化論:AI+時代產(chǎn)品經(jīng)理的思維方法》一書作者,前阿里產(chǎn)品專家,希望與創(chuàng)業(yè)者多多交流。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議
不錯,有結(jié)構(gòu)化
謝謝!后續(xù)還要不斷精進
路過