實(shí)案分析:如何用一道多選題給用戶畫像?
![](http://image.woshipm.com/wp-files/img/52.jpg)
本例僅僅是基于調(diào)研目的靈活處理的一個(gè)例子,適合短平快的項(xiàng)目;如果需要系統(tǒng)了解用戶,深入挖掘用戶需求,更大的樣本量和更扎實(shí)的定性研究依然是必不可少的。
現(xiàn)代商業(yè)離不開對用戶的理解,任何業(yè)務(wù)的決策者都不會希望在認(rèn)識用戶上存在盲區(qū),因此在用研的日常工作中,“做一個(gè)用戶畫像”是經(jīng)常收到的需求。但同樣的需求背后,往往對應(yīng)著不同的目標(biāo)和問題,搞清楚了解用戶能幫助業(yè)務(wù)方解決什么問題,才能更有效地制定研究方案。大而全的數(shù)據(jù)平臺,不一定可以和粒度很細(xì)的調(diào)研目標(biāo)精確匹配;傳統(tǒng)市場調(diào)研或設(shè)計(jì)調(diào)研的方法又會增加周期和成本,不適合短平快的項(xiàng)目。那么是否可以使用簡單的測量-統(tǒng)計(jì)方法,較敏捷地得到一個(gè)需求方期望的“用戶畫像”呢?本文來分享這樣一個(gè)案例。
(一)背景-為什么想做一個(gè)“用戶畫像”
在接手話題版塊改版方向調(diào)研的過程中,其中一項(xiàng)調(diào)研目標(biāo)比較有意思:運(yùn)營同學(xué)發(fā)現(xiàn),網(wǎng)易新聞客戶端話題版塊中,一些女性相關(guān)話題活躍度格外高,這與對目標(biāo)用戶的預(yù)期有一些偏差。依照大家的印象,新聞客戶端中壯年男性比例偏高,典型用戶是一個(gè)體制內(nèi)老劉的形象-時(shí)政、社會、歷史、軍事版塊的重度讀者-因此在話題運(yùn)營上也更偏向了此類內(nèi)容。然而偶爾為之的母嬰、情感類的話題,無論從參與熱度還是質(zhì)量來考量,效果都不錯(cuò)。運(yùn)營同學(xué)陷入思考之中,懷疑話題版塊活躍著一些假的網(wǎng)易新聞用戶。
那么話題社區(qū)的活躍用戶真的與客戶端整體不同嗎?運(yùn)營同學(xué)由此提出了調(diào)研需求,希望了解話題活躍用戶的“性別、年齡、婚姻狀況。?!钡鹊鹊囊粩堊尤丝趯W(xué)變量描述,簡言之-“做一個(gè)話題版塊的用戶畫像”。
不管如何做,先梳理一下需求,把目標(biāo)拆解成回答以下兩個(gè)問題:
- 網(wǎng)易新聞客戶端的用戶可以分為哪幾類?
- 這幾類用戶中,哪些是話題版塊可以發(fā)力的核心用戶?
(二)以什么標(biāo)準(zhǔn)區(qū)分用戶-一個(gè)簡單的題目設(shè)計(jì)
大家可能注意到,需求方在提需求的時(shí)候,順帶提了一下自己對用戶區(qū)分維度的界定“性別、年齡、婚姻狀況。?!薄U\然,人口學(xué)變量用來區(qū)分用戶很經(jīng)典,但并不適用于所有研究目標(biāo),比如在本例中的效果就未必好。原因有二。首先,人口學(xué)變量并不直接能落地到業(yè)務(wù),還需要基于業(yè)務(wù)理解進(jìn)行二次推演,不夠直觀;而好的分類標(biāo)準(zhǔn)應(yīng)該能直接與現(xiàn)有資源結(jié)合來指導(dǎo)業(yè)務(wù);二是完全無預(yù)設(shè)的情況下,事前很難確定各個(gè)人口學(xué)變量的影響權(quán)重,那么如果需要進(jìn)行探索性分析,需要在問題中納入足夠多的變量。這樣短短問卷難以承載,也會讓分析頭緒無端變多。
所以研究用了另一個(gè)解決方案,直接用內(nèi)容偏好特征來區(qū)分用戶。這樣做的好處是,作為內(nèi)容分發(fā)平臺,直接以內(nèi)容偏好為標(biāo)簽的用戶畫像天然具有可落地的屬性,而不必再通過人口學(xué)特征去推斷。另外,對內(nèi)容的需求偏好往往反映了一個(gè)人當(dāng)前的綜合狀態(tài)-社會經(jīng)濟(jì)地位、文化傾向、人口學(xué)特征-可以預(yù)期是一個(gè)很有效的探測點(diǎn)。
相關(guān)的問題設(shè)計(jì)很簡單,只是在問卷結(jié)尾處加一道內(nèi)容偏好的多選,備選項(xiàng)參考了主流新聞app的版塊分類。
您平時(shí)使用網(wǎng)易新聞客戶端時(shí),喜歡看哪些內(nèi)容?(多選)
- 科技互聯(lián)網(wǎng)、數(shù)碼IT
- 體育賽事、運(yùn)動健身
- 財(cái)經(jīng)金融、投資理財(cái)
- 時(shí)事要聞
- 母嬰親子
- 情感兩性
- 時(shí)尚美妝
- 娛樂明星
- 動物萌圖
- 游戲動漫、二次元
- 影視音樂、攝影旅行
- 健康醫(yī)療、營養(yǎng)養(yǎng)生
- 社會民生、房產(chǎn)資訊
- 汽車知識
- 國際政治局勢
- 歷史掌故、軍事動態(tài)
- 神跟貼、幽默段子
- 星座命理
- 其他(請注明)
這里有個(gè)問題簡單說明一下-為什么要把選項(xiàng)切到這么碎,而不加以合并。這種處理方式實(shí)際是基于以下兩點(diǎn)考慮。
- 希望基于用戶認(rèn)知形成分類-當(dāng)然可以根據(jù)對業(yè)務(wù)的理解,對選項(xiàng)內(nèi)容進(jìn)行合并和抽象,但預(yù)設(shè)的歸類方式與用戶會采用的未必吻合。如果希望降低預(yù)設(shè)對用戶選擇的影響,完全通過用戶反應(yīng)情況來建立項(xiàng)目間的關(guān)聯(lián),那不妨呈現(xiàn)具體細(xì)致的選項(xiàng)。這好比景觀規(guī)劃時(shí),直接在行人足跡最深的地方鋪路。
- 準(zhǔn)確性和易答性-抽象度越高的描述,包含的信息越多,不同人腦中的典型代表差異會越大,也越可能包括的矛盾案例?;卮稹笆遣皇窍矚g狗”時(shí),更有可能陷入“我有點(diǎn)喜歡松獅但是又有點(diǎn)討厭泰迪到底選不選喜歡呢”的糾結(jié)中,而問“是不是喜歡泰迪”就會更加容易回答。另外,抽象度高的選項(xiàng),往往需要詳細(xì)描述并給出具體例子,進(jìn)一步增加閱讀難度;而答題者處理短而多的選項(xiàng)時(shí),未必需要比長而少的選項(xiàng)花費(fèi)更多認(rèn)知資源。
因此,問題選項(xiàng)呈現(xiàn)采用了具體細(xì)分的列舉,而細(xì)分項(xiàng)的合并化簡,則將在問卷回收后,根據(jù)用戶的實(shí)際反應(yīng)來處理。
(三)讓分析過程更簡明-數(shù)據(jù)降維
問卷投出去一段時(shí)間后,樣本池漸漸上漲,內(nèi)容偏好的數(shù)據(jù)餅圖五彩斑斕地分布起來。這時(shí)就發(fā)現(xiàn)問卷選項(xiàng)細(xì)碎的不方便之處-同時(shí)考慮18個(gè)選項(xiàng)遠(yuǎn)遠(yuǎn)超出了人類工作記憶的負(fù)荷,讓分析過程頗有些尾大不掉。當(dāng)然這是意料之中的。如前所述,之所以把選項(xiàng)粒度做得很小,是希望通過用戶的實(shí)際選擇模式來找到相關(guān)聯(lián)的內(nèi)容。因此,首先要使用一下因子分析的方法,把數(shù)據(jù)進(jìn)行濃縮。
岔開幾句簡單說說因子分析的用途。所謂因子分析,是處理多變量數(shù)據(jù)的一種常用的預(yù)處理方法,使用場景是當(dāng)實(shí)際用于測量的變量較多且相關(guān)時(shí),可以將比較瑣碎繁多的變量,用幾個(gè)易于解釋的因子表達(dá)出來,從而更清晰地展示數(shù)據(jù)的結(jié)構(gòu)和規(guī)律。拿這個(gè)項(xiàng)目來說,我們得到的多選題數(shù)據(jù)是用多重二分法表示的-每一個(gè)選項(xiàng)作為一個(gè)單獨(dú)變量-題目反應(yīng)數(shù)據(jù)共包括18個(gè)變量(如下圖)。顯然這些變量之間是存在相關(guān)關(guān)系的,存在歸納的可能,這正符合因子分析的使用場景。
因子分析使用SPSS完成,操作過程略去不表,分類結(jié)果如下圖所示,將18個(gè)選項(xiàng)濃縮為5類因子。根據(jù)每個(gè)選項(xiàng)在各因子上的載荷(也就是原始選項(xiàng)和因子之間的相關(guān)系數(shù)),可以看出該因子大概代表了哪一類內(nèi)容。為了便于理解,分別給它們起了一個(gè)比較直觀的名字。如下圖所示。
5個(gè)因子作為新的變量保存下來(如下圖,注意保留下來的變量已經(jīng)標(biāo)準(zhǔn)化為Z分?jǐn)?shù)),留作后續(xù)進(jìn)行用戶聚類的依據(jù)。每個(gè)用戶對某個(gè)因子分?jǐn)?shù)越高,就意味著對該因子對應(yīng)內(nèi)容的偏好程度更強(qiáng)。例如第2個(gè)用戶,就明顯是“女性生活”因子相關(guān)內(nèi)容的重度瀏覽者。
(四)為用戶打內(nèi)容偏好標(biāo)簽-聚類分析
完成了數(shù)據(jù)化簡,接下來根據(jù)用戶在五個(gè)內(nèi)容偏哈因子上的得分,對用戶進(jìn)行聚類分析。由于因子本身為Z分?jǐn)?shù),不用再進(jìn)行標(biāo)準(zhǔn)化處理,直接分析即可。
這里再岔開幾句簡單說說聚類分析的原理。聚類算法的原理是通過計(jì)算各個(gè)案例點(diǎn)在變量空間中的距離遠(yuǎn)近(SPSS中計(jì)算距離的方法有30多種,大多數(shù)情況只選擇默認(rèn)設(shè)置的歐式距離就好),來把它們分簇處理的。變量空間名字聽起來挺厲害,其實(shí)就是把n個(gè)變量當(dāng)作n個(gè)坐標(biāo)軸,參照三個(gè)維度構(gòu)成三維“空間”的說法,將n個(gè)變量的情境稱為n維空間。每個(gè)case在這n個(gè)變量上的取值,構(gòu)成了一個(gè)n維坐標(biāo),根據(jù)坐標(biāo)可以計(jì)算case間的距離,根據(jù)距離遠(yuǎn)近形成不同的分類簇。例如,上圖表格中每一行都是一個(gè)五維坐標(biāo)向量,描述了該行對應(yīng)用戶在“內(nèi)容偏好空間”的位置,不同用戶位置間的距離越近,就越可能被歸為一類。
聚類分析仍使用SPSS完成,結(jié)果如下表所示。表格中數(shù)字代表每類用戶對特定內(nèi)容的偏好程度,數(shù)字越大偏好程度越高。根據(jù)幾類用戶的內(nèi)容偏好模式分別起一個(gè)鮮明易記的名字,例如,給更偏好“女性生活”與“宅文化”內(nèi)容的用戶打上“時(shí)尚麗人”的標(biāo)簽。
現(xiàn)在每一位樣本中的用戶都有了一個(gè)內(nèi)容偏好標(biāo)簽,這個(gè)標(biāo)簽也保存為一個(gè)新的變量(如下圖),留待與其它題目進(jìn)行交叉分析。
首先就可以用內(nèi)容標(biāo)簽與人口學(xué)變量來交叉分析一下,驗(yàn)證一下偏好某類內(nèi)容的用戶是否具有比較特殊的人口學(xué)屬性。結(jié)果如下圖所示(具體數(shù)據(jù)略)。可以看到,盡管由于樣本中男性比例偏大造成一些bias,相對趨勢的比較還是驗(yàn)證了很多印象:例如“時(shí)尚麗人”中年輕女性的比例顯著偏高,“財(cái)經(jīng)科技控”高學(xué)歷高收入比例顯著高等等。
納入與人口學(xué)變量的交叉分析結(jié)果,最終得到的用戶分類如下表所示。從樣本占比推斷,“隨意用戶”和“時(shí)政歷史迷”最有可能是客戶端主流人群,這與業(yè)務(wù)經(jīng)驗(yàn)得到的印象是一致的。
(五)哪類用戶是話題版塊的核心用戶
現(xiàn)在關(guān)鍵的問題來了,畫像的幾類人群,哪類是話題版塊的核心用戶、需要重點(diǎn)發(fā)力運(yùn)營呢?
首先看看活躍用戶中各類用戶的占比(活躍度根據(jù)問卷中覺知情況和使用頻次的問題答案來判斷)。由下圖可以看到,活躍用戶的類別分布和整體差異并不大-“隨意用戶”和“時(shí)政歷史迷”占了最大的部分。這也符合預(yù)期,畢竟話題版塊的流量從客戶端整體滲透過來,各類用戶體量上不應(yīng)該有太大的差異
那么哪種用戶的增量潛力比較大呢?這個(gè)問題反過來看比較清晰-我們可以這樣假設(shè),如果某類人群中活躍用戶比例越大,滿意度越高,那么這類用戶更可能是話題版塊的目標(biāo)用戶。
首先將活躍度與內(nèi)容偏好進(jìn)行交叉分析。可以看到,“時(shí)尚麗人”中話題使用活躍者占比最高(42%),無覺知者占比則最低(29%)-年輕女性用戶看起來天然對話題討論很敏感。
再看一下滿意度的差異。年輕女性用戶對話題社區(qū)各方面的滿意度都高于其他用戶,她們在話題社區(qū)玩得更開心。
所以,給出結(jié)論&建議-年輕女性用戶雖然在話題版塊的體量不大,但她們的活躍度和滿意度更高,討論質(zhì)量更好,對促進(jìn)話題社區(qū)良性發(fā)展有很大幫助,可以從相關(guān)內(nèi)容版塊進(jìn)行重點(diǎn)引流。而反過來,如果話題社區(qū)這種形式對“時(shí)尚麗人”獨(dú)具吸引力,也可以將話題版塊與時(shí)尚、母嬰、情感等垂直頻道打通,通過話題運(yùn)營進(jìn)行流量反哺。
最后,本例僅僅是基于調(diào)研目的靈活處理的一個(gè)例子,適合短平快的項(xiàng)目;如果需要系統(tǒng)了解用戶,深入挖掘用戶需求,更大的樣本量和更扎實(shí)的定性研究依然是必不可少的。不過在日常工作中,有意識地以經(jīng)濟(jì)敏捷的方式擴(kuò)展關(guān)于用戶的基礎(chǔ)知識,也不失為一種很好的積累沉淀吧。
(本案例數(shù)據(jù)和結(jié)論僅作為例子展示,不涉及真實(shí)情況)
作者:驢爺
來源:公眾號:ME網(wǎng)易移動設(shè)計(jì)
版權(quán):人人都是產(chǎn)品經(jīng)理遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會明確標(biāo)注作者和來源,若標(biāo)注有誤,請聯(lián)系主編QQ:419297645
不知道能否 在有空的時(shí)候把中間略去不表的 SPSS分析過程寫一下呢