用戶畫像規(guī)劃流程和方法

4 評論 33223 瀏覽 193 收藏 9 分鐘

編輯導語:如今在這個大數(shù)據(jù)時代,“用戶畫像”這個詞經(jīng)常出現(xiàn),它跟精準營銷掛鉤,可以根據(jù)一個人的興趣、地理位置等進行精確的推送,達到良好的營銷效果;本文作者分享了關于用戶畫像規(guī)劃的流程和方法,我們一起來看一下。

互聯(lián)網(wǎng)行業(yè)飛速的發(fā)展,帶動行業(yè)業(yè)務量激增,同時伴隨數(shù)據(jù)量的增加,互聯(lián)網(wǎng)各行各業(yè)慢慢形成頭部企業(yè),2/8原則下長尾企業(yè)也越來越多;因此,在大數(shù)據(jù)量和激烈競爭下,如何更好的對產(chǎn)品進行營銷,如何制定價格策略,越來越重要。

那么,如何制定準確的營銷和價格,就需要我們針對不同人群,不同個體的特點進行精細化推薦,所要本章介紹了如何進行用戶畫像。

文章結構:

一、什么是用戶畫像

用戶畫像就是對用戶按照一定的規(guī)則進行統(tǒng)計,劃分,從而能夠指導用戶推薦,客戶分層運營,達到營銷效果。

昨天:手機APP大爆發(fā)是隨著手機硬件的發(fā)展而發(fā)展起來的,發(fā)展前期大量APP為搶占市場紛紛上線;用戶畫像只是為了指導產(chǎn)品設計,主要用于產(chǎn)品設計前夕的用戶訪談、用戶調(diào)研的前期工作,而且一般覆蓋的人群比較狹隘,精準度差,產(chǎn)品經(jīng)理設計產(chǎn)品全靠感覺。

今天:行業(yè)競爭越來越大,行業(yè)產(chǎn)生的數(shù)據(jù)量也越來越大,各大公司開始建造自己的數(shù)據(jù)倉庫;那么如何應用數(shù)據(jù)倉庫中的數(shù)據(jù),如何進行精細化運營,用戶畫像越來越受到重視。

明天:隨著大數(shù)據(jù)技術的成熟應用,用戶畫像標簽將越來越多,目前互聯(lián)網(wǎng)行業(yè)中比較成功的標簽系統(tǒng)是淘寶的千人千面,技術創(chuàng)新必將推動用戶畫像的精準度。

二、用戶畫像常用場景

用戶畫像概況可應用于一下三個場景:

  • 產(chǎn)品設計:開發(fā)前期的產(chǎn)品定位設計;
  • 產(chǎn)品營銷:指導運營對特定用戶進行推送活動信息,推廣信息,個性化推薦等。
  • 產(chǎn)品決策:分析用戶畫像統(tǒng)計對產(chǎn)品的發(fā)展現(xiàn)狀和發(fā)展趨勢進行預測,及時調(diào)整產(chǎn)品發(fā)展路線。

按照用戶標簽的生產(chǎn)方式可分為:

統(tǒng)計標簽:現(xiàn)有的可以直接從數(shù)據(jù)中提取出來的標簽;包括用戶自然屬性,用戶行為統(tǒng)計等信息。

規(guī)則標簽:自定義規(guī)則進行標簽建模;根據(jù)業(yè)務流程提取需要統(tǒng)計的標簽。

算法模型標簽:根據(jù)機器學習等算法進行用戶行為預測分類;具有不確定性、開發(fā)周期長、成本高,因此系統(tǒng)中此類標簽數(shù)量較少。

三、用戶畫像系統(tǒng)搭建流程

1. 數(shù)據(jù)采集

對用戶數(shù)據(jù)進行采集,數(shù)據(jù)預處理,數(shù)據(jù)挖掘和過濾等手段得出期望的數(shù)據(jù)集。

用戶數(shù)據(jù)一般分為埋點數(shù)據(jù)和業(yè)務數(shù)據(jù):

  • 埋點數(shù)據(jù):根據(jù)用戶的行為特征進行埋點,將得到的數(shù)據(jù)進行處理存儲;
  • 業(yè)務數(shù)據(jù):用戶的姓名、年齡、地理位置等自然屬性,同時包括用戶購買、用戶評價、用戶評論等隱形數(shù)據(jù)。

具體采集方法可以使用如下算法模型:

文本挖掘模型(TF-IDF):處理文本類型,提取數(shù)據(jù)信息。

TF是詞頻,IDF是逆向文件頻率,TF-IDF是詞頻和逆向文件頻率的乘積。

Nij就是詞i在j文章中出現(xiàn)的次數(shù),分母就是文章的總詞數(shù)。

D就是語料庫中文件總數(shù),下面分母就是詞i出現(xiàn)的文檔數(shù),然后取對數(shù)。

該算法可以直接調(diào)用python庫Sklearn進行實現(xiàn),但是該算法比較單一,不考慮詞條在文章中的位置,不能準確描述詞的重要程度,一般需要結合其他其他算法或者增加權重改進。

聚類算法:聚類算法較多,如ANN神經(jīng)網(wǎng)絡和貝葉斯等,聚類主要是針對冷啟動用戶、用戶分群營銷等目的;具體算法相對復雜,目前算法應用多使用python的各種庫如Sklearn,包括一些框架tensorflow、caffe等。

相似度模型:一般使用相似度模型進行輔助用戶分群,常用的有邏輯回歸、線性回歸、余弦相似度、皮爾森相似度等。

具體說下余弦相似度:

實例:

用戶1和用戶2通過公式計算相似度為0.945406,是不是可以解釋為兩個用戶可以劃分為同一類人,進行用戶分群(計算過程只是用于解釋算法,無其他意義)。

若已有數(shù)據(jù)倉庫,數(shù)據(jù)采集相對比較輕松,可參考文章“每日優(yōu)鮮如何搭建數(shù)據(jù)倉庫?”。

2. 用戶維度分析

用戶分析具有多維度,隨時間更新的特點,包括用戶年紀、學歷、興趣、消費水平等都容易變化。

因此維度信息應該隨著用戶偏好發(fā)生變化,因此,在標簽系統(tǒng)中需要有新增標簽功能。

3. 維度標簽化

用戶畫像最終的實現(xiàn)應該是對維度進行標簽化,常用MECE法則進行標簽化,防止標簽界限不清晰。

標簽需要根據(jù)需要進行逐級拆分,例如:

4. 標簽映射,接口封裝

用戶畫像數(shù)據(jù)導入服務器中,為后續(xù)推薦系統(tǒng),營銷活動服務;封裝成API可以作為數(shù)據(jù)服務的內(nèi)容,對其他系統(tǒng)提供數(shù)據(jù)支持。

5. 用戶畫像評估

對畫像進行評估:

用戶覆蓋率:用戶畫像具體能夠覆蓋到多少用戶,有些用戶畫像可能覆蓋總用戶的50%或者80%;所以覆蓋率是用戶畫像應用的一個評價,覆蓋率越高,對后續(xù)精準營銷的策略選擇越準確。

準確率:模型的準確性,如上所述,使用算法模型導致的用戶分群錯誤或者對用戶的購買意向預測錯誤,將直接影響購買率,影響GMV。

可拓展:用戶畫像在維度刻畫應該是可擴展的。

及時性:如果用戶畫像服務到實時推薦系統(tǒng)中還需要用戶畫像的及時。

四、總結

用戶畫像結合大數(shù)據(jù)技術使用戶刻畫更加細致、及時,對日趨競爭激烈的互聯(lián)網(wǎng)浪潮起到越來越重要應用。

 

本文由@汪仔2296 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉載。

題圖來自Unsplash, 基于CC0協(xié)議

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 好像什么都說了,又好像什么都沒說。

    來自北京 回復
    1. 說的太多太技術,說的太少內(nèi)容不深刻。用戶畫像需要了解兩件事情:從技術層面講需要了解數(shù)倉的搭建,相對應技術架構;從產(chǎn)品層面講需要明確業(yè)務需求,構建標簽體系(增量過程)。

      來自上海 回復
    2. 這兩句話總結的到位,大佬實錘。

      來自北京 回復
  2. 各位大佬,若有工作機會請幫忙推薦下

    來自上海 回復