用戶畫像很重要,那你知道是怎么畫出來的嗎?

22 評論 83235 瀏覽 362 收藏 9 分鐘

我們看過應(yīng)該不下10篇關(guān)于用戶畫像的干貨。但是依舊不知道應(yīng)該怎么做一份用戶畫像出來。干貨里告訴我們用戶畫像的價值、用戶畫像應(yīng)該有的數(shù)據(jù),用戶畫像應(yīng)該包含的內(nèi)容。好的,我都按大神們的教導(dǎo)收集好數(shù)據(jù)了。麻煩誰能告訴我到!底!這!些!數(shù)!據(jù)!怎!么!處!理!?。∥?!

今天我就拋磚引玉的說一下我曾經(jīng)經(jīng)手的一份用戶畫像及其每一步的建立步驟吧!當然我覺得那次的結(jié)果很粗糙,原因在于還是沒人告訴我每一步要怎么做,但是起碼應(yīng)該是一個粗線條的步驟原型了。希望今天之后大家能在收集齊全大神的數(shù)據(jù)建議之后,終于知道每步要怎么做了!不要像我一樣,太慘了。

step1 ? 我們還是要說一下數(shù)據(jù)源的事情

雖然我從來都秉承著能百度到的東西基本不廢話,但是這張圖我覺得還是有必要貼出來的。這個圖不是我的,原文作者:郭志金。知識產(chǎn)權(quán)還是要保護的,大家可以百度一下郭老師關(guān)于如何構(gòu)建用戶畫像的文章找到更加詳細的論述。不多說了。上圖。

123

這里能就是郭老師說的需要準備好的所有的相關(guān)用戶數(shù)據(jù)。好的,我覺得這些數(shù)據(jù)對于大家來說并不那么困難吧。所以收集到了之后呢,就開始真正的處理數(shù)據(jù)了。

step2 數(shù)據(jù)收集后的處理步驟

第一步:清洗數(shù)據(jù)

本來我不打算說這個,但是覺得還是有必要提一句,收集到的數(shù)據(jù)很多都不能直接使用。需要對數(shù)據(jù)進行編碼和分類,還要去掉異常值和補全缺失值這些。我這里將會用到的分析軟件是跟隨我五六年的SPSS(用了這么多年依舊不是高手)。我就假設(shè)這一步大家都做完了。

第二步:因素分析

本來我也不知道為什么要做因素分析。直到我最近看書才了解,給大家解釋一下做因素分析的原因。用戶畫像就是把一堆數(shù)據(jù)分類,分到同一組的數(shù)據(jù)所代表的人就是一類。那么聚類就需要考慮把哪些數(shù)據(jù)拿出來聚類呢?比如說個人收入和家庭總收入。這是兩列數(shù)據(jù),最后可能都會決定我是屌絲還是白富美。要把這兩個數(shù)據(jù)放進去一起聚類嗎?恐怕不是!聚類是不建議把高度相關(guān)的數(shù)據(jù)都扔進去的。為什么?因為高度相關(guān)了就基本等于同一個數(shù)據(jù)了,你把同一個數(shù)據(jù)放進去兩遍,不就是加重了這個數(shù)據(jù)在所有數(shù)據(jù)里的權(quán)重了么!這里一些專業(yè)統(tǒng)計詞我就不過分解釋了,這次真的可以百度。

知道了為什么要因素分析,就談?wù)勔蛩胤治龅淖饔?,因素分析就是把N個數(shù)據(jù)先歸歸類,特別相同的就是一類的了,我們選其中一些數(shù)據(jù)就可以了。這樣因素分析就可以幫我們把N列數(shù)據(jù)減少到幾列數(shù)據(jù)。至于因素分析怎么做,我也不在這里廢話了。有一個神奇的老師叫吳明隆,他有一本SPSS實操,那里手把手教學(xué)。各位可以去自行查閱。

第三步:相關(guān)分析

我們已經(jīng)把數(shù)據(jù)N列減少到重要的幾個了。在開始聚類之前,還要做一件事就是看一下這些數(shù)據(jù)的相關(guān)性。一般我們選擇中等相關(guān)的數(shù)據(jù)。太相關(guān)不能用原因見上一條。太不相關(guān)了也別放進去了,畢竟個人收入的數(shù)據(jù)和隔壁老王的體重數(shù)據(jù)放在一起也沒什么大用。相關(guān)分析怎么做也請見吳老師的寶書。

第四步:聚類分析

好的,我們終于說到我們的主角了,聚類分析。我曾記得當初我做的時候一個恩師姐姐建議我,聚類都做一遍。雖然我還不懂她在說什么。但是就我現(xiàn)在的理解,給大家談一談。首先SPSS里有三種聚類方式。見圖。

254

上面看到啦,這是SPSS里的3中聚類方式。我會首先做一下兩步聚類。為啥呢,因為兩步聚類不需要動腦子。為什么這么說。就是你丟一堆數(shù)據(jù)進去,你不需要預(yù)設(shè)你要聚類成幾類。就是你可以不知道到底有幾類啊,看SPSS大大的心情啊。兩步聚類把數(shù)據(jù)類型分分開就可以了,別把連續(xù)的放在類別的里面。就可以了。聚類之后你會得到這樣一個結(jié)果。上圖。

456

醬紫的。具體的解釋和怎么看。建議去看沈浩老師博客的聚類分析,百度一下你值得擁有。然后我們把一些重要程度很低的變量可以試著剔除一些了。這里就是第一次聚類。

然后到了第二次聚類,K均值聚類。第一步已經(jīng)知道大概的聚類類別了。我這個是聚出了1類。K均值的時候有一個聚類數(shù)需要你填寫。你就把兩步聚類里的聚類數(shù)填進去就好啦。然后就得到了K均值聚類的結(jié)果。我們這樣不斷調(diào)試刪除增加變量的原因是為了讓聚類結(jié)果更加穩(wěn)定。

最后的最后,系統(tǒng)聚類。你可以看到一個長得很酷的圖,然后可以看看結(jié)構(gòu)什么的。也是為了確定聚類結(jié)果的穩(wěn)定性。具體操作也自行解決吧。

第五步:判別分析

聚類好了之后,我們是有態(tài)度有素質(zhì)的團隊嘛。就要看看自己聚類出來的結(jié)果準不準。就需要判別分析了,把已經(jīng)聚類好的數(shù)據(jù)和待驗證的數(shù)據(jù)放進去看下結(jié)果,來評判一下聚類的效果。本來我想上個圖,覺得要保護我司的數(shù)據(jù)安全。就放棄了。大家百度一下貝葉斯判別,很多效果圖那邊。這里只講步驟。

好啦。最后的結(jié)果如果穩(wěn)定且驗證后效果良好。那你的用戶就真的畫完了。很多人在說每個標簽權(quán)重的事情。我個人是這么理解的,看貴司用戶占這些分類的多少比較重要。說的更直接點,加權(quán)重給每個畫像這個事情,我暫時還沒有知道要怎么做。如果有牛人用R或者什么統(tǒng)計軟件完爆我,我真的認真的說,請收我為徒。我真的很想要一個老師。為了實現(xiàn)我做最好的用研的夢想。

 

作者:王蕊 (微信號Xiaolan_psy),斗魚用戶研究員。1年互聯(lián)網(wǎng)用戶研究經(jīng)驗,曾主導(dǎo)同程旅游多款項目的產(chǎn)品調(diào)研與數(shù)據(jù)分析工作。

本文由 @王蕊 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 確認過眼神 是看不懂的文

    來自上海 回復(fù)
  2. 確認過眼神 是看不懂的文

    來自廣東 回復(fù)
  3. 文章標題應(yīng)該改成 “SPSS在數(shù)據(jù)分析中的應(yīng)用舉例”

    來自河南 回復(fù)
  4. 看一遍只看明白要用SPSS軟件。。。 ??

    來自廣東 回復(fù)
  5. 所以是用SPSS做的分析而不是大數(shù)據(jù)軟件???

    來自北京 回復(fù)
  6. 邏輯不太清

    來自廣東 回復(fù)
  7. 兩步聚類已經(jīng)聚成1類,還要用kmeans再聚成1類,意義何在?還有文章里面有很多話不通順,望作者下次寫文章能自己讀一遍再發(fā)。

    來自陜西 回復(fù)
  8. 更多的是在詳細描述用spss工具做數(shù)據(jù)分析的步驟,沒有太多關(guān)于數(shù)據(jù)分析用在用戶畫像方面的思想和見解,缺了點靈氣兒的感覺?

    來自廣東 回復(fù)
    1. 關(guān)于數(shù)據(jù)分析在用戶畫像方面的思想和見解,這個建議我會記下來,可能因為現(xiàn)在只是才有機會做一個這樣的項目,能知道怎么做對我來說就很好了,對于思想和見解,可能需要更多的經(jīng)驗和積累。我會努力在后面的過程中總結(jié)出這樣的內(nèi)容分享。謝謝您~如果您有這方面的思考,我真的非常希望能有機會和您學(xué)習~ ??

      來自湖北 回復(fù)
  9. 感覺只講了SPSS 沒說到用戶畫像到底怎么弄出來的

    來自廣東 回復(fù)
  10. 好文

    回復(fù)
  11. ? 看不懂

    來自上海 回復(fù)
  12. 大概意思明白了。邏輯和條理有些老火!

    回復(fù)
  13. 語文當初考幾分?

    來自廣東 回復(fù)
  14. 除了上面提到幾個關(guān)于SPSS學(xué)習的,還有什么比較基礎(chǔ)的。麻煩說一下。謝謝。

    來自廣東 回復(fù)
  15. ????看完之后略懂

    回復(fù)
  16. 文章寫的不錯,感同身受!麻煩講解下動態(tài)數(shù)據(jù)在用戶畫像時的怎么處理唄!謝謝!

    來自北京 回復(fù)
  17. 是spss的軟文?感覺像在介紹軟件

    來自北京 回復(fù)
    1. 額。。。。。是需要用到的操作步驟。哈哈

      來自湖北 回復(fù)
    2. spss不需要軟文吧……

      來自廣東 回復(fù)
  18. 看不懂 ?

    來自廣東 回復(fù)