抽絲剝繭,深入的數(shù)據(jù)分析這么做!
編輯導語:如何才能全面洞察數(shù)據(jù)背后的價值,實現(xiàn)深度數(shù)據(jù)分析,用數(shù)據(jù)分析結(jié)果來實現(xiàn)業(yè)務支撐?本篇文章里,作者便結(jié)合應用場景,對數(shù)據(jù)分析的“解法”做了相對全面的解讀,不如一起來看看深入的數(shù)據(jù)分析究竟怎么做吧!
很多同學總覺數(shù)據(jù)分析做得不深入,到底該怎么做?今天結(jié)合一個具體的例子,分享下如何做一個深入的數(shù)據(jù)分析項目。
深入級別:0級
某天,你收到一個需求:“看下我司APP新增的A功能,過去5天內(nèi)累計使用1+次的人有多少(去重)”。這問題太簡單了,直接跑個數(shù)丟過去即可,“過去5天累計使用人數(shù)10000人”搞掂。
但是這種分析完全不深入,甚至壓根不能叫“分析”,這就是提個數(shù)而已。確實,當需求是很具體的取數(shù)指標+統(tǒng)計時間的時候,這就是取個數(shù),第0級深入就是如此。
深入級別:1級
某天,你又收到一個需求:“看下我司APP新增的A功能,過去5天有多少人在用”。
聽起來和之前的問題差不多,但注意,“多少人”并不是一個明確的指標,只是個籠統(tǒng)的說法,細分起來,有:
- 5天內(nèi)累計使用1+次的人(去重);
- 5天內(nèi)累計有多少人次使用(不去重);
- 5天內(nèi),每天有多少人在使用;
- 5天內(nèi),累計使用5、4、3、2、1天的人有多少;
- 5天內(nèi),各使用頻次人數(shù)(1、2、3……10、10+次);
- ……
好幾個指標拼起來,才能把這個多少人說明白。有些同學會覺得,這么搞是不是太麻煩了。我就默認他是看不去重的人次唄。實際上,工作中相當多的重復取數(shù),加班加點,被業(yè)務追著屁股催數(shù),就是從“沒確認清楚需求,自己默認一個業(yè)務不想要的指標”開始的。特別是你問業(yè)務:想看哪個口徑。業(yè)務會說:都看。這時候最好自己先提前想多幾個,避免重復返工。
這種主動思考,才是深入分析的起點。因為這幾個指標對業(yè)務都有用:
- 看去重的人數(shù),可以評估總用戶滲透了多少;
- 看每天人次,可以看出發(fā)展趨勢;
- 看各類型累計使用天數(shù),可以判斷有多少重度用戶;
- 看各類型累計使用天數(shù),可以判斷有多少重度用戶。
而且,我們發(fā)現(xiàn),第0級的成果,成為第1級產(chǎn)出的一部分。后續(xù)也是一樣,越深入,設計的指標、維度越多,問題會越復雜。
深入級別:2級
某天,你又收到一個需求:“看下我司APP新增的A功能,過去5天使用的人,付費行為是不是比其他人更好”。
注意,這里也沒有明確的數(shù)據(jù)指標,因此得先拆解問題:
- 主語是:過去5天使用過A功能的用戶。那得先知道有多少人在用?第1級深入的數(shù)據(jù),這里都需要加上。
- 付費行為:付費行為是個籠統(tǒng)說法。是付費金額,還是頻次?沒說清就先都拎出來看。
- 比其他人更好:什么是其他人?是全體用戶,還是未使用該功能用戶。從問題場景上看,應該區(qū)分出過去5天內(nèi)未使用過該功能,并且至少活躍1次的用戶,這樣才有可比性。
有了這三步拆解??梢园堰@句不清晰的需求,落地成一個取數(shù)需求:
- 過去5天內(nèi)使用過A功能用戶基本情況(人數(shù),使用天數(shù)分布,使用頻次分布)。
- 過去5天內(nèi)使用過A功能用戶付費行為(多大比例,付費人群的5天內(nèi)累計付費金額,5天內(nèi)付費頻次,人均付費金額,人均付費次數(shù))。
- 過去5天內(nèi)未未使用過A功能,且活躍的用戶的活躍天數(shù)、付費比例,付費金額,付費頻次,人均付費金額,人均付費次數(shù))。
這樣,兩個群體一對比,就能出結(jié)論了。然而這么做,很快會引發(fā)下一個問題:“為什么使用A的人群比其他群體高/低?”
深入級別:3級
某天,你又收到一個需求:“分析下為啥使用A功能的人付費更好?”注意,先問是不是,再問為什么,是回答問題的基本要求。因此在拆解問題的時候,得先把深入2級功課都做完。做實了“A的付費更好”以后再分析原因。
分析原因的時候,假設很重要。需求既然關(guān)注A功能,那A功能到底有沒有用就是關(guān)鍵。在分析原因的時候,證偽比證真更容易,所以我們可以先剔除一些明顯的錯誤答案,比如“A功能用戶本身都是高付費群體”,這一下就能把“A功能對付費轉(zhuǎn)化有用”直接干掉。
但這樣,邏輯上還是站不住,因為:
- 本身消費高,但是用了A功能以后消費更高了;
- 本身消費高,但是比不用A的人更高;
- 消費低的人,用了A也有提高;
- 消費低的人,不用A只會更低;
- ……
即使看到數(shù)據(jù):A群體消費天然比不用的高,還是有至少這4種可能性要排除。所以得列清楚假設邏輯樹,逐一排查可能性。這也是我們說的:驗證觀點,需要同時找正反兩面的例子。
注意,即使這樣,還是有反駁觀點。因為我們都是基于過去數(shù)據(jù)分析,很有可能一個反駁觀點是:“A功能只能吸引到這一小簇用戶,不能做大”或者“A用戶只是嘗新,過了這段時間就沒有效果了”這兩個觀點,都涉及未來數(shù)據(jù)情況,因此需要觀察一段時間才能有結(jié)論。
如果我們等不了那么久,還可以做測試,比如測試:“做不大”這個點,可以主動向其他群體推廣A功能,觀察A功能增量以及留存效果,如果增量少,或者有增量但是留存差,那就可以推論:確實做不大。想要做深入分析,測試與長期觀察是不可少的,好結(jié)論需要時間沉淀。
深入級別:4級
某天,你又收到一個需求:“分析下A功能對用戶有啥影響?”看起來問題表達更簡單了,可要解這個問題卻更復雜了。因為從0級到3級,我們只討論了“付費”這一個影響,實際上還有可能有更多影響,比如活躍、留存、轉(zhuǎn)介紹等等。每個方向都得經(jīng)歷這么漫長的拆分、分析,才能得出綜合結(jié)果。
到這里,我們的分析已經(jīng)非常有深度了。有趣的是,我們的問題,反而非常簡單。實際上,如果一個問題:
- 有清晰的衡量指標;
- 有明確的判斷指標好壞的標準;
- 有明顯的指標間影響邏輯;
- 基于封閉的業(yè)務場景,容易測試。
那這個問題就是很容易解決的。
可現(xiàn)實中的問題,常常是:
- 口語化表達的;
- 包含了多個方面的;
- 沒有清晰判斷標準的;
- 雜糅了很多影響因素;
- 沒有時間、場地給我們慢悠悠測試。
這時候就能從頭開始,一點點梳理。把本篇文章的順序倒出來,就是從0開始梳理業(yè)務問題的場景。
當然,并不是所有的分析都需要這樣從頭到尾過一遍。
- 有可能提問人自己完全沒概念,此時可以先給到1級深度數(shù)據(jù),讓他建立認知,再給2級深度的數(shù)據(jù),引導他關(guān)注差異。
- 有可能提問人嘴上說得含糊,但心里有明確的目標,這時候可以進行深入溝通,清晰需求。
- 有可能提問的人不需要嚴密的論證,有部分證據(jù)即打算直接下結(jié)論,這時論證其最疑惑的點即可
這時候唯一不要干的,就是不溝通,自己拍腦袋隨便仍幾個數(shù),或者到網(wǎng)上找所謂“模型”生搬硬套。這樣閉門造車,返工、加班、被diss都是經(jīng)常的事。
如果在某個業(yè)務場景下,我們已經(jīng)做了很多次驗證,論證了業(yè)務問題的關(guān)鍵指標+判斷標準+因果關(guān)系,這時候就可以直接套用,這就是我們說的:業(yè)務分析模型。不過在沉淀出來之前,還是得多做論證的,特別是因果關(guān)系論證,做的不夠細致,分分鐘被打臉。
#專欄作家#
接地氣的陳老師,微信公眾號:接地氣學堂,人人都是產(chǎn)品經(jīng)理專欄作家。資深咨詢顧問,在互聯(lián)網(wǎng),金融,快消,零售,耐用,美容等15個行業(yè)有豐富數(shù)據(jù)相關(guān)經(jīng)驗。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議。
老師您這個邏輯真的是滿分啊!
我感覺陳老師的分析每一次都那么的到位,真的很喜歡陳老師,果然很接地氣啊
原來分了那么多的層次,以前我做的數(shù)據(jù)老是感覺差了點什么,現(xiàn)在終于懂了,感謝
原來以前的我的數(shù)據(jù)分析得都不夠深入,看了這篇文章感覺受益匪淺,支持作者
還是你靠譜
學到了學到了
學習學習