DNA級用戶畫像:直達用戶內(nèi)心
本文分享點是通過用戶熱詞反推用戶特征,希望對用戶研究、商業(yè)分析、數(shù)據(jù)分析的同事有幫助。
一、什么是用戶畫像?為何要做用戶畫像?
在進騰訊前,聽說互聯(lián)網(wǎng)產(chǎn)品都喜歡做用戶畫像調(diào)研,但成功應(yīng)用沒幾個。進公司后看了幾份用戶畫像報告,基本點面都覆蓋了,數(shù)據(jù)和分析也沒什么偏差,但不知道解決哪些問題。所以這里我先探討兩個問題,什么是用戶畫像,為何要做用戶畫像。
剛?cè)胝{(diào)研的行業(yè)時候,覺得調(diào)研是無所不能,后來覺得調(diào)研無所能。其實關(guān)鍵是我們想清楚兩個問題:一是我們解決什么問題,二是用戶能回答哪些問題。
自從進了騰訊,才大概了解到一個產(chǎn)品工作流程:
商業(yè)分析->產(chǎn)品交互DEMO->供應(yīng)商BD->產(chǎn)品設(shè)計->前后臺開發(fā)->市場推廣->用戶運營->售后客服->商業(yè)分析(重頭開始,迭代2)
可以看到,我們常面對三類問題:產(chǎn)品設(shè)計、市場和技術(shù)。針對這三類問題,用戶能回答哪些?答案是顯然的:
- 技術(shù)問題:用戶無法回答。
- 產(chǎn)品設(shè)計:產(chǎn)品需求問題,用戶僅能意識到淺層問題,但不思考需求背后邏輯、需求主次關(guān)系等,故他們的回答僅能參考。所以說產(chǎn)品設(shè)計不需要看用戶調(diào)查。交互設(shè)計問題,我們可看用戶能否完成主要任務(wù),評估交互操作是否符合用戶基本習(xí)慣,如信息主次是否分明、色彩色塊引導(dǎo)是否合理、圖標(biāo)是否存在認(rèn)知混亂、邏輯結(jié)構(gòu)是否易于記憶??梢?,用研在產(chǎn)品設(shè)計方面有所幫忙,但有一定的局限性。
- 市場問題,向哪些用戶推廣,在哪些渠道推廣,推廣什么。這些問題都可以通過用研得到結(jié)果,可見用戶研究對市場推廣有較大幫助。
回到剛才第一個問題,什么是用戶畫像?這個是什么不重要,重要的是我們要解決什么問題。一般而言,用戶畫像是解決市場推廣問題,較少解決產(chǎn)品設(shè)計問題的調(diào)研報告。
二、做用戶畫像的前提條件:其實我們早已有解決方案!
作為一個用研同事,我們經(jīng)常面對兩個問題:一是調(diào)研報告出來后就涼在那里,似乎沒起什么作用;二是產(chǎn)品同事經(jīng)常報怨,不知道用戶有哪些需求,如何解決目前困難。
如前面談及,用戶研究不是無所不能,它僅是提高產(chǎn)品/市場工作效率的工具之一,但不能代替各同事專業(yè)技能。或許有人說,這是你們用研沒有做好做得深入,沒有突破。
實際上,讓用研同事入門產(chǎn)品設(shè)計或品牌推廣專業(yè)技能,大概需要半年時間,然后才能提出一些專業(yè)解決方案。但沒人等得起半年,最多等2周,所以調(diào)研報告解決不了產(chǎn)品經(jīng)理的問題。
后來,作為用研,我調(diào)入到產(chǎn)品組,再后來調(diào)入品牌組,每個組呆了半年,自己切入產(chǎn)品設(shè)計和品牌推廣具體工作,才知道大概需要是哪些東西,如何解決。
但假如大家沒有這個條件,可讓產(chǎn)品經(jīng)理先說說潛在幾個解決方案,然后每個方案需要獲取哪些數(shù)據(jù)來驗證是否可行。這樣用研項目才會有價值。用戶研究再深,也不能代替設(shè)計師的活,畫出蒙羅麗莎。
三、我們?yōu)楹我鲇脩舢嬒瘢?/strong>
在品牌組常被問到一個問題:用戶具有哪些特征,他們喜歡什么東西?當(dāng)這個問題經(jīng)常被提問,就有覺得有解決的必要,其實不是,是我們看到這個答案如何應(yīng)用:
- 我們希望根據(jù)用戶心理訴求,策劃一些有共鳴的話題/活動,以便SNS傳播分享。
- 我們希望根據(jù)用戶品牌喜好,尋找一些異業(yè)品牌、娛樂節(jié)目、明星偶像合作,用曝光資源換取優(yōu)質(zhì)品牌合作,提升會員的美譽度。
- 我們希望根據(jù)用戶生活形態(tài),在線下渠道/商家推廣會員品牌,投放更加精準(zhǔn)。
從上述可以看到,我們回答“用戶喜歡什么東西”是有應(yīng)用價值,因此我們清楚我們需要收集哪些數(shù)據(jù),調(diào)研哪些問題。
四、真實世界與用戶畫像的距離
(1)問卷調(diào)查法
傳統(tǒng)用戶畫像調(diào)研,基本都是通過用戶訪談+問卷調(diào)查完成。在報告綜述的時候,基本都是采取調(diào)查數(shù)據(jù)來總結(jié)歸納。但后來我們多少發(fā)現(xiàn),無論我們問了多少個問題,用戶畫像還是不清晰的。
例如,QQ會員用戶喜歡看電影,比非QQ會員用戶高出10%,但我們不能以是否喜歡看電影作為QQ會員用戶核心特征。因為在看電影這件事情上,也有很多非QQ會員也喜歡。
如此情況經(jīng)常發(fā)生,是否喜歡逛街、購物、旅游、看書、聽音樂、玩游戲等等,您會發(fā)現(xiàn)我們很難用幾百個問卷調(diào)查指標(biāo)來將QQ會員用戶生活形態(tài)描繪出來,因為95%指標(biāo)都缺乏顯性差異。這就是現(xiàn)實世界:mess。假如用戶問卷調(diào)查數(shù)據(jù)描繪一群人的生活形態(tài),就像下圖的感覺,模糊大概知道是兩個人,但有點看不清。
若回想為何看不清用戶形態(tài),總結(jié)原因有兩個:
①筆觸太粗:即我們提問指標(biāo)不夠多,問卷調(diào)查一般可覆蓋用戶生活形態(tài)的100個指標(biāo),但在這100個指標(biāo)中找出有效指標(biāo),估計不到10個。
②顏色太少:很多時候我們僅能問用戶是否喜歡某件事情(2選項),或根據(jù)“非常喜歡”、“喜歡”、”一般“、”不喜歡“、”非常不喜歡“(5選項),甚至評分制(10選項),用戶根據(jù)自己感知打分,敏感度還是有限的。一般情況下,像評分制,用戶根據(jù)自己感覺打分,一般僅能區(qū)分5-6級別差異。但現(xiàn)實世界是,在一件事情態(tài)度上,可以有幾千種態(tài)度差異,后面會講述。
(2)外部調(diào)查數(shù)據(jù)與內(nèi)部后臺數(shù)據(jù)結(jié)合法
后來我們嘗試將用戶后臺數(shù)據(jù)全部提取,大約有300-500個指標(biāo)。但受信息安全限制,我們僅能拿到自己和合作部門數(shù)據(jù),而電商數(shù)據(jù)、豆瓣閱讀喜歡的數(shù)據(jù),基本都是缺乏的。
不過有了后臺數(shù)據(jù),用戶畫像是稍微清晰點。這里清晰并不單是數(shù)據(jù)指標(biāo)多,而是緯度更多。因為這300個指標(biāo)中,經(jīng)過因子分析,我們發(fā)現(xiàn)用戶盡在10個緯度上是有差異。意思是說,這300個指標(biāo)可整合為10個指標(biāo),來描述用戶差異,其余大部分指標(biāo)都是基于這10個指標(biāo)演變而成。下面可以概括有哪些指標(biāo):
- 年齡相關(guān):年齡、學(xué)歷、職業(yè)、收入強相關(guān)
- 活躍相關(guān):登陸數(shù)、關(guān)系鏈數(shù)、C2C消息數(shù)、群數(shù)、群消息數(shù)強相關(guān)
- 付費習(xí)慣相關(guān):各鉆開通紀(jì)錄、財付通充值消費等強相關(guān)
- 等級相關(guān):Q齡、現(xiàn)有等級、每天加速
- ……
經(jīng)過更多緯度,我們可將用戶畫像描寫得更細(xì),如下圖。現(xiàn)在大家還是猜得他們是誰?相信很多人會猜到是一個成年男人和小孩,但不太確定他們特質(zhì)。這就是將外部調(diào)研數(shù)據(jù)和內(nèi)部后臺數(shù)據(jù)結(jié)合輸出的用戶畫像報告。
(3)文本挖掘法
經(jīng)過后臺數(shù)據(jù)補充,我們可以發(fā)現(xiàn)更多有區(qū)隔性的特征指標(biāo),但用戶內(nèi)心訴求還是不太清楚。在這個時候,我們跟微趨勢團隊探討如何利用文本挖掘技術(shù),來還原用戶畫像。
抽象地理解,我們想讓每個點不僅是黑白兩個顏色,而是有6萬4千多個的真彩色。轉(zhuǎn)換成操作方法,就是在一個事情態(tài)度上,我們不希望僅檢測用戶用戶是否喜歡,而是檢測到他喜歡哪些東西。但這里有幾個挑戰(zhàn)點:
- 豆瓣、電商、大眾點評有詳細(xì)用戶偏好數(shù)據(jù),不單止知道用戶喜歡閱讀玄幻小說,還知道他喜歡看那幾本,如70后,80后,90后喜歡言情小說是不一樣的。而我們是缺乏這些生活類數(shù)據(jù)。
- 騰訊優(yōu)勢在于SNS,用戶數(shù)據(jù)就是UGC內(nèi)容。那么,我們能否拿UGC的內(nèi)容,分析用戶常提及哪些關(guān)鍵字,以此判斷用戶的特征?
于是,我整理了兩個樣本,分別是100w會員用戶和100w非會員用戶,提取最近一個月在騰訊微博所發(fā)布文本內(nèi)容,用微趨勢系統(tǒng)做文本挖掘,看看用戶常提及那些詞。
操作流程是順利的,但微博文本中存在大量廣告雜質(zhì),幾乎占據(jù)整體數(shù)據(jù)量50%。即使經(jīng)過數(shù)據(jù)篩選清洗,用戶高頻次的詞往往集中在兩塊:
生活用詞:如知道,沒有,可以,喜歡,開心,幸福,流淚,需要,覺得,希望等。這些詞是日常用,故提及率很高,但缺乏具體的含義。
最近流行詞(又稱新詞):如特么,光棍節(jié),牛逼,期中考試,黃鉆,年費,呃呃呃呃呃,微博,坑爹,洗個澡。這些新詞是基于對比原有詞庫,機器發(fā)現(xiàn)最近出現(xiàn)很多,但受節(jié)假日、活動運營、廣告等因素嚴(yán)重影響,并非用戶原始想法,故有效性也很低。
看來,在無限定主題情況下,用機器挖掘高頻次熱詞來歸納用戶特征是困難,微趨勢文本挖掘技術(shù)更適合在特定關(guān)鍵詞下一級關(guān)聯(lián)分析,如QQ會員用戶經(jīng)常提及斗戰(zhàn)神,微趨勢可以分析用戶在提及斗戰(zhàn)神時候,關(guān)聯(lián)提及哪些熱詞,那么我們就知道他們對斗戰(zhàn)神的想法是什么。這非常適合做專題分析和傳播。
(4)熱詞反查法
假如在沒主題或關(guān)鍵字限制情況下,機器挖熱詞是困難的,那么我們能否反過來,拿我們想測試熱詞列表,反過來計算每個詞被提及的頻次?于是,我們根據(jù)百度風(fēng)云榜(http://top.baidu.com/)整理一份熱詞表,共有2300個當(dāng)下熱詞,來分析用戶提及哪些詞語/事物更多,以此作為用戶畫像標(biāo)簽。
我們計算會員用戶不同年齡的提及熱詞的差異,找出不同年齡會員用戶關(guān)注哪些類目(如科幻片、喜劇片、劇情片),還算出不同年齡用戶分別喜歡看哪些不同的科幻片(如13-15歲喜歡看雷神2,23-29歲喜歡看速度與激情)。通過這次用戶喜好數(shù)據(jù),我們就得出QQ會員用戶畫像及心理訴求。
到此,我們可以看到在某一個緯度上面,用戶有千萬種態(tài)度。用戶畫像也更加colorful和清晰。好吧,看得出是林志穎和kimi:)
回顧我們?nèi)粘UZ言內(nèi)容,會受到兩個因素影響:
①社會流行:如最近流行電影、電視劇、段子、口頭禪、網(wǎng)絡(luò)新詞等等。這些語言不管什么人都喜歡使用,成了社會流行。所以,我們?nèi)粘I钪袝峒昂芏嗌鐣餍惺挛铩_@些詞語的特點是提及率高,用戶間無差異。
②個人因素:70后和90后的說話詞語是不一樣,這是受年齡因素影響;屌絲和白富美說話內(nèi)容是不一樣,這是受經(jīng)濟因素影響。所以,我們可根據(jù)某群體的高頻提及關(guān)鍵字,來作為這群用戶的標(biāo)簽。
所以,若要找出不同年齡的QQ會員用戶差異,通過“該年齡會員用戶提及該詞頻次/會員用戶提及該詞頻次”公式即可實現(xiàn)。
在統(tǒng)計關(guān)鍵字提及頻次方面,有以下注意事項:
①關(guān)鍵詞太長:用戶會較少提及,如饑餓游戲2星火燎原,很多人會在微博上輸入全稱,故我們將關(guān)鍵字縮短,改為饑餓游戲2。
②關(guān)鍵詞過于常見:如最近一部電視劇叫《晴天》。用戶在微博上會因日常生活常提及這個詞,故我們得剔除,不納入分析。
③品牌詞:微博上廣告內(nèi)容占總體信息量50%,拿品牌詞統(tǒng)計關(guān)鍵字提及頻次難以客觀。
最后,利用熱詞表的提及頻次來描述用戶畫像,他的優(yōu)點和缺點在于同一地方。優(yōu)點是,我們可以拿不同項目類型熱詞表,來查看用戶在某個類目上的態(tài)度,如航空公司名稱、牙膏牌子。只要熱詞越獨特,其統(tǒng)計經(jīng)準(zhǔn)確性越高。只要有一批用戶微博文本內(nèi)容,我們就可以擴展很多類目描繪。但它的缺點是一致的,就是我們得整理出一份全面的熱詞表,且每個熱詞都有自己的獨特性和當(dāng)下流行性,不能像企鵝、老虎那樣通用。
四、未來是大數(shù)據(jù)?
剛才提及,用戶淘寶的購物數(shù)據(jù)、豆瓣電影/閱讀數(shù)據(jù)、阿瑪遜和當(dāng)當(dāng)?shù)臅鴨?、百度關(guān)鍵詞,用這些數(shù)據(jù)來描繪用戶畫像會更加清晰。原因是他們的數(shù)據(jù)更加精準(zhǔn),是用戶喜好、搜索、購買行為數(shù)據(jù),故百度、阿瑪遜和豆瓣推薦一般都很精準(zhǔn)。
其實,在大數(shù)據(jù)這個詞發(fā)明之前,統(tǒng)計學(xué)、數(shù)據(jù)挖掘?qū)W都發(fā)展很多年。以前我們會用大量數(shù)據(jù)來做關(guān)聯(lián)分析(如買啤酒的人傾向買紙尿布),或做聚類分析(如開通QQ會員有4個細(xì)分市場)。所以大數(shù)據(jù)并不是什么新鮮的事情。只是回到我們第一個問題,我們需要解決問題,只是用戶畫像,而不是預(yù)估用戶下一次購買的商品。所以我們的數(shù)據(jù)精度就沒有那么吹毛求疵。
當(dāng)然,我們自身也沒這塊數(shù)據(jù),也是不足。其實,說這段話的意思是,做調(diào)研,做什么事情,可以多嘗試,但有時候得回過頭來看,我們的問題或目標(biāo)是什么,而方法招式都是輔助的。
最后,POST一下照片原圖,看看他們的帥照,哈哈。
注:文中圖片均來自網(wǎng)絡(luò)
作者:鄔嘉文,微信高級運營
本文由 @鄔嘉文 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自unsplash,基于CC0協(xié)議
寫得很用心。學(xué)習(xí)了。
PS:用那個照片逐步清晰的展示,太棒了1