教你如何做好用戶畫像

6 評論 92929 瀏覽 211 收藏 8 分鐘

經(jīng)歷了2012和2013兩年熱炒之后,人們逐漸冷靜下來,更加聚焦于如何利用大數(shù)據(jù)挖掘潛在的商業(yè)價值,如何在企業(yè)中實實在在地應(yīng)用大數(shù)據(jù)技術(shù)。

伴隨著對大數(shù)據(jù)應(yīng)用的討論、創(chuàng)新,個性化技術(shù)成為了一個重要落地點。相比傳統(tǒng)的線下會員管理、問卷調(diào)查、購物籃分析,大數(shù)據(jù)第一次使得企業(yè)能夠通過互聯(lián)網(wǎng)便利地獲取更為廣泛的用戶反饋信息,為進一步精準、快速地分析用戶行為習(xí)慣、消費習(xí)慣等重要商業(yè)信息,提供了足夠的數(shù)據(jù)基礎(chǔ)。伴隨著對人的了解逐步深入,一個概念悄然而生:用戶畫像(UserProfile)。它完美地抽象出一個用戶的信息全貌,可以看作企業(yè)應(yīng)用大數(shù)據(jù)的根基。

告訴你,什么是用戶畫像?

男,在線時長30秒,系統(tǒng)設(shè)備:??Lenovo A390t?Android 4.0.3,和賬號綁定。愛理財,自拍達人,喜歡淘寶上購物。

這樣一串描述即為用戶畫像的典型案例。如果用一句話來描述,即:用戶信息標(biāo)簽化。

如果用一幅圖來展現(xiàn),即:

SY8JP`1J_QY[V6O2@X}$MJ7

為什么需要用戶畫像?

用戶畫像的核心工作是為用戶打標(biāo)簽,打標(biāo)簽的重要目的之一是為了讓人能夠理解并且方便計算機處理。比如可以做分類統(tǒng)計:喜歡購物的用戶有多少?喜歡理財?shù)娜巳褐?,男、女比例是多少?/p>

也可以做數(shù)據(jù)挖掘工作:利用關(guān)聯(lián)規(guī)則計算,喜歡理財?shù)娜送ǔO矚g什么運動品牌?利用聚類算法分析,喜歡購物的人地區(qū)分布情況是怎么樣的?

大數(shù)據(jù)處理,離不開計算機的運算,標(biāo)簽提供了一種便捷的方式,使得計算機能夠程序化處理與人相關(guān)的信息,甚至通過算法、模型能夠“理解”人。當(dāng)計算機具備這樣的能力后,無論是搜索引擎、推薦引擎、廣告投放等各種應(yīng)用領(lǐng)域,都將能進一步提升精準度,提高信息獲取的效率。

如何構(gòu)建用戶畫像?

一個標(biāo)簽通常是人為規(guī)定的高度精煉的特征標(biāo)識,如:性別標(biāo)簽”男、女”、地域標(biāo)簽“北京”,等等。標(biāo)簽呈現(xiàn)出兩個重要特征:一是語義化,即人能很方便地理解每個標(biāo)簽的含義。這也使得用戶畫像模型具備實際意義,能夠較好地滿足業(yè)務(wù)需求。如:判斷用戶偏好。二是短文本,每個標(biāo)簽通常只表示一種含義,標(biāo)簽本身無需再做過多的文本分析等預(yù)處理工作,這為利用機器提取標(biāo)準化信息提供了便利。

我們制定的標(biāo)簽規(guī)則,必須要確保所做的標(biāo)簽具備兩個基本特性:人能夠通過標(biāo)簽快速讀出其中的信息,機器方便做標(biāo)簽提取、聚合分析。所以,用戶畫像,即用戶標(biāo)簽,向我們展示了一種用于描述用戶信息的樸素而簡潔的方法。

數(shù)據(jù)源分析

構(gòu)建用戶畫像是為了還原用戶信息,因此數(shù)據(jù)來源于:所有用戶相關(guān)的數(shù)據(jù)。

關(guān)于用戶相關(guān)數(shù)據(jù)的分類,這里介紹一種重要的分類思想:封閉性的分類方式。

這樣的分類方式,有助于后續(xù)不斷枚舉并迭代補充遺漏的信息維度。不必擔(dān)心架構(gòu)上對每一層分類沒有考慮完整,造成維度遺漏留下擴展性隱患。另外,不同的分類方式根據(jù)應(yīng)用場景,業(yè)務(wù)需求的不同,也許各有道理,按需劃分即可。

1X]9ZQ2J9}W5NQA@M9~K5HT

本文將用戶數(shù)據(jù)劃分為靜態(tài)信息數(shù)據(jù)、動態(tài)信息數(shù)據(jù)兩大類。

靜態(tài)信息數(shù)據(jù)——

用戶相對穩(wěn)定的信息,如圖所示,主要包括人口屬性、商業(yè)屬性等方面的數(shù)據(jù)。這類信息,自成標(biāo)簽,如果企業(yè)有真實信息則無需過多建模預(yù)測,更多的是數(shù)據(jù)運營清洗工作,因此這方面信息的數(shù)據(jù)建模不是本篇文章重點。

動態(tài)信息數(shù)據(jù)——

用戶不斷變化的行為信息,如果存在上帝,每一個人的行為都在時刻被上帝那雙無形的眼睛監(jiān)控著。從廣義上講,一個用戶打開網(wǎng)頁,買了一個杯子,與該用戶傍晚溜了趟狗,白天取了一次錢,打了一個哈欠等一樣,都是上帝眼中的用戶行為。當(dāng)行為集中到互聯(lián)網(wǎng),乃至電商,用戶行為就會聚焦很多。

本篇文章以互聯(lián)網(wǎng)電商用戶為主要分析對象,暫不考慮線下用戶行為數(shù)據(jù)(分析方法類同,只是數(shù)據(jù)獲取途徑、用戶識別方式有些差異)。

在互聯(lián)網(wǎng)上,用戶行為可以看作用戶動態(tài)信息的唯一數(shù)據(jù)來源。如何對用戶行為數(shù)據(jù)構(gòu)建數(shù)據(jù)模型,分析出用戶標(biāo)簽,將是本文著重介紹的內(nèi)容。

目標(biāo)分析

用戶畫像的目標(biāo)是通過分析用戶行為,最終為每個用戶打上標(biāo)簽,以及該標(biāo)簽的權(quán)重。如:男、網(wǎng)購、自拍。

標(biāo)簽,表征了內(nèi)容,用戶對該內(nèi)容有興趣、偏好、需求,等等。

權(quán)重,表征了指數(shù),用戶的興趣、偏好指數(shù),也可能表征用戶的需求度,可以簡單地理解為可信度、概率。

數(shù)據(jù)建模方法

下面內(nèi)容將詳細介紹如何根據(jù)用戶行為,構(gòu)建模型產(chǎn)出標(biāo)簽、權(quán)重。一個事件模型包括時間、地點、人物三個要素。每一次用戶行為本質(zhì)上是一次隨機事件,可以詳細描述為:什么用戶,在什么時間、什么地點,做了什么事。

四、總結(jié):

本文并未涉及具體算法,更多的是闡述了一種分析思想。

 

來源:http://zhugeio.com/news/?p=99

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 這么坑

    來自河北 回復(fù)
  2. 這種文章也發(fā)上來

    來自湖南 回復(fù)
  3. 圖片看不清啊

    來自北京 回復(fù)
  4. 畫出像以后怎么搞

    來自北京 回復(fù)
  5. 戛然而止,意猶未盡

    另外,你的圖是地球人看滴么

    來自北京 回復(fù)
  6. 什么是封閉性的分類方式? 那張圖看不清?

    來自湖南 回復(fù)