利用AI構(gòu)建動態(tài)用戶畫像的七步法

3 評論 29242 瀏覽 200 收藏 9 分鐘

本篇文章分步為大家詳細地介紹了用AI構(gòu)建動態(tài)用戶畫像的方法,供大家參考學習~

背景:雖然聽過很多用戶畫像的神奇功能和成功案例,但對用戶畫像的構(gòu)建實際是需要從技術(shù)和業(yè)務(wù)高度融合的角度來設(shè)計,否則建立的用戶畫像流于表面的形式而不能發(fā)揮作用。

用戶畫像構(gòu)建的流程和思路

1. 構(gòu)建用戶畫像的戰(zhàn)略目標

構(gòu)建用戶畫像之前,需要先明確用戶畫像構(gòu)建的戰(zhàn)略意義,設(shè)定用戶畫像使用的基本目標。

對于某寶而言,用戶畫像能夠比較準確地反映用戶在一段時間內(nèi)對商品和服務(wù)相對穩(wěn)定的興趣需求,結(jié)合用戶動機、場景、能力和環(huán)境要素的數(shù)據(jù)分析。

一方面能夠支持智能化、個性化的產(chǎn)品推薦和優(yōu)質(zhì)服務(wù);另一方面能夠全面支持企業(yè)精細化運營,提高ROI,合理布局商品和服務(wù)。

下圖為某寶的用戶畫像產(chǎn)品的運用:

圖1

2. 構(gòu)建用戶畫像的方法和流程

“標簽體系”方法是構(gòu)建用戶畫像的核心方法論。標簽強調(diào)的是跟業(yè)務(wù)的緊密聯(lián)系。標簽是某一種用戶特征的符號表示,標簽體系兩個視角:

  1. “化整為零”,每個標簽都規(guī)定了我們觀察、認識和描述用戶的一個角度;
  2. “化零為整”,用戶畫像是一個整體,各個維度不孤立,標簽之間有聯(lián)系。

標簽知識圖譜化圖如下圖:

圖2

“標簽體系”方法的基礎(chǔ)是數(shù)據(jù)標簽化。

構(gòu)建用戶畫像的核心流程如下圖:

圖3

3. 用戶畫像基礎(chǔ)數(shù)據(jù)采集

基礎(chǔ)數(shù)據(jù)采集需要全面收集用戶在站內(nèi)和站外所有相關(guān)的靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)。

梳理基礎(chǔ)數(shù)據(jù),需要明確目前都有哪些數(shù)據(jù)源,比如核心的系統(tǒng)線下場景門店、機器、小程序、電子數(shù)據(jù)渠道、營銷渠道和第三方數(shù)據(jù)。

梳理基礎(chǔ)數(shù)據(jù),需要結(jié)合實際需求,梳理相關(guān)的數(shù)據(jù)實體和關(guān)聯(lián)關(guān)系;并且根據(jù)相關(guān)性原則,對某寶的用戶、商品和機器渠道三類數(shù)據(jù)實體進行數(shù)據(jù)分析維度的列舉。

針對每一類數(shù)據(jù)實體,進一步分解可落地的數(shù)據(jù)維度,形成字段集如下舉例。

用戶數(shù)據(jù):

  • 用戶自然特征:性別,年齡,地域,教育水平,出生日期,職業(yè),星座;
  • 用戶興趣特征:興趣愛好,使用某寶APP/網(wǎng)站【可爬】,瀏覽/收藏內(nèi)容,互動內(nèi)容,品牌偏好,產(chǎn)品偏好;
  • 用戶社會特征:婚姻狀況,家庭情況,社交/信息渠道偏好;
  • 用戶消費特征:收入狀況,購買力水平,已購商品,購買渠道偏好,最后購買時間,購買頻次。

商品數(shù)據(jù)(以消費電子類為例):

  • 手機:品牌,顏色,尺寸,電池容量,內(nèi)存,攝像頭,CPU,材質(zhì),散熱,價格區(qū)間;
  • 筆記本:品牌,屏幕尺寸,配置,顏色,風格,薄厚,價格區(qū)間;
  • 智能手表:品牌,功能,材質(zhì),電池容量,顏色,風格,價格區(qū)間。

渠道數(shù)據(jù)(以消費電子類為例):

  • 信息渠道:微信,微博,論壇,SNS,貼吧,新聞網(wǎng)站,咨詢App;
  • 購買渠道:電商平臺,微店,官網(wǎng),實體店,賣場。

圖4

4. 用戶畫像行為建模

完成基礎(chǔ)數(shù)據(jù)采集后,需要對這些數(shù)據(jù)進行清洗、拉通、整合以及分析建模,之后才能構(gòu)建用戶畫像。

首先用戶多渠道信息打通,多數(shù)據(jù)源的情況下,我們要將不同數(shù)據(jù)源的同一個用戶的信息打通。我們可以把用戶手機號、身份證等信息視為用戶的ID,如果用戶的信息在不同數(shù)據(jù)源,那么我們需要進行連接,從而構(gòu)建一張關(guān)聯(lián)圖:

?圖5

圖6

圖中連通的ID可以視為同一個用戶,從而實現(xiàn)用戶拉通,拉通可以基于圖的方法進行強拉通,也可以采用機器學習的方法進行模糊拉通,預(yù)測出拉通的概率。

另外,拉通的可信程度由業(yè)務(wù)的密度決定,密度越高,對可信度的要求越高,譬如推薦是低密度業(yè)務(wù),即使識別錯誤,影響比較小,但對于 電商的 短信通知服務(wù),如果識別錯誤,體驗就會非常差。

圖7

用戶畫像的底層是機器學習,那么無論是要做客戶分群還是精準營銷,都先要將用戶數(shù)據(jù)進行規(guī)整處理,轉(zhuǎn)化為相同維度的特征向量,諸多華麗的算法才可以有用武之地,像是聚類,回歸,關(guān)聯(lián),各種分類器等等。

對于結(jié)構(gòu)化數(shù)據(jù)而言,特征提取工作往往都是從給數(shù)據(jù)打標簽開始的,比如購買渠道,消費頻率,年齡性別,家庭狀況等等。

好的特征標簽的選擇可以使對用戶刻畫變得更豐富,也能提升機器學習算法的效果(準確度,收斂速度等)。

?圖8

5. 用戶畫像可視化

(1)用戶個體畫像;

(2)用戶群體畫像。

圖9

6. 用戶畫像在業(yè)務(wù)上的應(yīng)用

圖10

7. 智能推薦

協(xié)同過濾和貝葉斯智能評分混合推薦。

小結(jié)

AI產(chǎn)品經(jīng)理以大數(shù)據(jù)為基礎(chǔ)通過:

第一步,設(shè)定用戶畫像的目標;

第二步,構(gòu)建以標簽知識圖譜化為系統(tǒng)的標簽體系;

第三步,采集數(shù)據(jù);

第四步,通過對采集的用戶行為數(shù)據(jù)建模;

第五步,實現(xiàn)用戶畫像可視化;

第六步,講按照時間序列更新迭代并應(yīng)用;

第七步,在應(yīng)用用戶畫像知識圖譜過程中結(jié)合算法實現(xiàn)智能推薦。

如果你想系統(tǒng)化入門AI產(chǎn)品經(jīng)理,掌握AI產(chǎn)品經(jīng)理的落地工作方法,戳這里>http://996.pm/7bjab

#專欄作家#

連詩路,公眾號:LineLian。人人都是產(chǎn)品經(jīng)理專欄作家,《產(chǎn)品進化論:AI+時代產(chǎn)品經(jīng)理的思維方法》一書作者,前阿里產(chǎn)品專家,希望與創(chuàng)業(yè)者多多交流。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 不錯,有結(jié)構(gòu)化

    回復(fù)
    1. 謝謝!后續(xù)還要不斷精進

      回復(fù)
  2. 路過

    回復(fù)