數(shù)據(jù)分析沒思路,這些數(shù)據(jù)分析方法掌握了么?
為了更好的理解用戶,洞察用戶的需求,數(shù)據(jù)分析就能很好的幫助解決這個(gè)需求。但是在數(shù)據(jù)分析時(shí),沒有思路該怎么辦呢?對(duì)此,本文從整體思考框架5W2H、描述問題現(xiàn)狀對(duì)比分析等七個(gè)方面做了分析,希望對(duì)你有所幫助。
對(duì)于產(chǎn)品經(jīng)理來說,產(chǎn)品的每一次迭代和升級(jí),都需要評(píng)估效果,以便今后改進(jìn)。如果僅僅是憑借肉眼觀察和主觀感受,下一個(gè)“用戶反饋很好”、“用戶很喜歡這個(gè)新功能”類似的結(jié)論,是很蒼白無力的。更多時(shí)候,會(huì)因?yàn)橹饔^感覺而產(chǎn)生誤判,另外,數(shù)據(jù)分析還可以幫助產(chǎn)品經(jīng)理更好地了解用戶,洞察用戶的需求。
而對(duì)于運(yùn)營而言,作為與用戶和產(chǎn)品接觸最頻繁的人,也是策略的制定者和實(shí)施者,但產(chǎn)品運(yùn)營的好與壞,最直觀的體現(xiàn)就是數(shù)據(jù),通過數(shù)據(jù)的高和低作為衡量的一個(gè)標(biāo)準(zhǔn)。對(duì)于運(yùn)營來說,數(shù)據(jù)產(chǎn)生和決策制定中間,一定還有大量可以優(yōu)化的空間,這種空間很大程度上可來源于數(shù)據(jù)。從數(shù)據(jù)中發(fā)現(xiàn)知識(shí),優(yōu)化決策,將會(huì)成為大大提升運(yùn)營效率。
所以,無論是產(chǎn)品還是運(yùn)營,在數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)的大背景下,數(shù)據(jù)分析都是必須要掌握的一項(xiàng)技能,本文介紹了7種常用的數(shù)據(jù)分析方法,介紹了一個(gè)完整的數(shù)據(jù)分析過程中可能用到的系列方法:
從界定問題→診斷現(xiàn)狀→定位問題環(huán)節(jié)→追溯問題原因→判斷問題發(fā)展趨勢。
一、整體思考框架:5W2H
著名教育學(xué)家陶行知先生曾經(jīng)寫過一首小詩:
我有幾位好朋友,曾把萬事指導(dǎo)我,
你若想問其姓名,
名字不同都姓何,
何事何故何人何時(shí)何地何法,
好像弟弟和哥哥,
還有一個(gè)西洋派,
姓名顛倒叫幾何,
若向七賢常請(qǐng)教,
即使笨人不會(huì)錯(cuò)。
這首小詩講的就是5W2H:What(何事) When(何時(shí)) Where(何地) Who(何人) Why(何故) How(何法) How much(何幾),5W2H是對(duì)目標(biāo)計(jì)劃進(jìn)行分解和決策的思維框架,它對(duì)要解決的問題進(jìn)行完整的刻畫,以便清晰地界定問題并找到解決方案。
- What:何事?發(fā)生了什么?一般用來指的是問題是什么?是否真的發(fā)生了?比如DAU真的下降了嗎?;
- When:何時(shí)?在什么時(shí)候發(fā)生的?問題發(fā)生的時(shí)間,比如DAU下降了,下降的具體時(shí)間是什么?是不是節(jié)假日等等;
- Where:何地?在哪里發(fā)生的?問題發(fā)生的拆解其中一個(gè)環(huán)節(jié), DAU下降了, 是哪一個(gè)的地區(qū)的下降了,哪個(gè)終端的用戶下降了?還是哪一個(gè)功能的使用的人下降了等等;
- Who:何人?比如DAU下降了, 是哪一部分的用戶群體在降, 是什么年齡、 性別、活躍度的用戶等等;
- Why:何故?為什么會(huì)這樣?問題發(fā)生的原因猜想, 比如android用戶的DAU降低了, 其他終端的DAU沒有降低, 是不是android新發(fā)版本存在bug;
- How:何法?明確上面的問題后, 我們要采取什么樣的方法和策略去解決DAU下降的問題;
- How Much:何幾?做到什么程度?DAU下降了以后, 我們對(duì)應(yīng)策略的成本是多少, 以及我們要把這個(gè)問題解決到什么程度才可以;
5W2H分析方法從問題出發(fā),有一套科學(xué)完整的分析思路,對(duì)造成問題的原因進(jìn)行推測,并提出相應(yīng)的解決方案,最終解決問題,形成閉環(huán)。
當(dāng)然,5W2H只是一種思維方式,在實(shí)際應(yīng)用過程當(dāng)中可能還會(huì)遇到各種各樣的業(yè)務(wù)場景,針對(duì)不同的業(yè)務(wù)場景,整體的思路是一樣的, 但分析的維度就需要根據(jù)不同的產(chǎn)品形態(tài)和業(yè)務(wù)特性來調(diào)整。
二、描述問題現(xiàn)狀:對(duì)比分析
通過5W2H已經(jīng)有了整體的思維框架,形成了大致的分析思路,接下來就要針對(duì)問題進(jìn)行具體分析,首先從問題現(xiàn)狀入手。
沒有對(duì)比,就沒有優(yōu)化提升的方向。在數(shù)據(jù)分析中,沒有對(duì)比,就沒有結(jié)論。
比如,小虎某次期末考試的成績不好,數(shù)學(xué)只得了 40 分。
小虎的媽媽對(duì)他說:“你上次考試數(shù)學(xué)考了 70 分,這次怎么就考得這么差?你看你的同班同學(xué),這次都考 80 分以上。我之前跟你說考90分給你買奧特曼,這下別想了……”
常見的對(duì)比思維有以下 5 種:
- 跟目標(biāo)對(duì)比:本月目標(biāo)銷售額500w,實(shí)際完成了300w,目標(biāo)達(dá)成率60%;
- 跟上個(gè)月比:上個(gè)月銷售額200w,環(huán)比增長50%;
- 跟去年同比:去年同期銷售額400w,同比下降25%;
- 分渠道對(duì)比:線上/線下渠道銷售分別200w、100w;
- 跟同類競對(duì)比:同水平競對(duì)A、B、C本月銷售額分別為600w、500w、100w;
總結(jié)一下上面的對(duì)比思維,主要是橫向和縱向?qū)Ρ龋?/p>
橫向?qū)Ρ龋和粫r(shí)期,外部和競對(duì)比,內(nèi)部各渠道對(duì)比
- 同一時(shí)期和外部競對(duì)對(duì)比,整體市場表現(xiàn)以及所占市場份額變化;
- 同一時(shí)期自己內(nèi)部各渠道對(duì)比,看銷售額貢獻(xiàn)和貢獻(xiàn)占比變化;
縱向?qū)Ρ龋鹤陨聿煌瑫r(shí)期對(duì)比
- 和上一期數(shù)據(jù)對(duì)比,近期有無提升/后退;
- 和去年同期對(duì)比,季節(jié)周期性考量下對(duì)比,是否有提升/后退;
數(shù)據(jù)分析的過程,就是在明確目標(biāo)之后,通過對(duì)比等思維,找到問題的原因,得出分析的結(jié)論,提出可行的建議,從而起到幫助決策和指導(dǎo)行動(dòng)的作用。
三、定位問題環(huán)節(jié):漏斗分析
已經(jīng)通過橫向、縱向?qū)Ρ却笾铝私饬藰I(yè)務(wù)的現(xiàn)狀,知道業(yè)務(wù)是在變好/變壞,以及變好/變壞的程度,如果業(yè)務(wù)在持續(xù)變壞,我們就需要通過漏斗分析來定位問題到底出現(xiàn)在哪個(gè)環(huán)節(jié)上。
漏斗模型,本質(zhì)是分解和量化,這里以電商購物漏斗模型舉例。
也就是把購物的整個(gè)流程拆解成從選購商品到最終轉(zhuǎn)化成購買的一個(gè)個(gè)子環(huán)節(jié),用相鄰環(huán)節(jié)的轉(zhuǎn)化率/流失率來量化每一個(gè)環(huán)節(jié)的表現(xiàn)。所以整個(gè)漏斗模型就是先將整個(gè)購買流程拆分成一個(gè)個(gè)步驟,然后用轉(zhuǎn)化率/流失率來衡量每一個(gè)步驟的表現(xiàn),最后通過異常的數(shù)據(jù)指標(biāo)找出有問題的環(huán)節(jié),從而解決問題,優(yōu)化該步驟,最終達(dá)到提升整體購買轉(zhuǎn)化率的目的,整體漏斗模型的核心思想其實(shí)可以歸為分解和量化。
漏斗分析其實(shí)是一種業(yè)務(wù)流程拆解和量化的思路,任何業(yè)務(wù)流程都可以按照這個(gè)思路來拆解,常見的業(yè)務(wù)漏斗模型還有很多:消費(fèi)者行為AIDMA漏斗、用戶生命周期的AARRR等。
四、細(xì)分分析原因:細(xì)分拆解
通過漏斗分析我們大致可以定位到問題出現(xiàn)在哪個(gè)環(huán)節(jié),但是,到底是什么這個(gè)環(huán)節(jié)的哪個(gè)部分出了問題,我們還需要進(jìn)一步細(xì)分拆解定位問題癥結(jié)所在。
在數(shù)據(jù)分析中,細(xì)分是數(shù)據(jù)分析的靈魂,沒有細(xì)分拆解,就沒有數(shù)據(jù)分析。
小虎期中考試的總成績不好,細(xì)分一看,發(fā)現(xiàn)其他科目的成績都不錯(cuò),只有數(shù)學(xué)成績特別差,只得了 40 分,而且三角函數(shù)一題都沒有做對(duì)。
常見的細(xì)分方法有以下 5 種:例如本季度的銷售額沒有達(dá)標(biāo),可以按照以下思路進(jìn)行細(xì)分:
- 按時(shí)間細(xì)分:哪個(gè)時(shí)間段的銷售額出了問題?
- 按空間細(xì)分:哪個(gè)區(qū)域的銷售額出了問題?
- 按過程細(xì)分:售前導(dǎo)購、購買體驗(yàn)還是售后服務(wù)的哪個(gè)過程出了問題?
- 按公式細(xì)分:GMV=流量*轉(zhuǎn)化率*客單價(jià),流量、轉(zhuǎn)化率和客單價(jià)的哪個(gè)部分出了問題?
- 按模型細(xì)分:用戶價(jià)值分層模型,不同價(jià)值的用戶的銷售額貢獻(xiàn),是哪類用戶出了問題?
拆解的方式千千萬,在運(yùn)用細(xì)分拆解思維的過程中,要做到有的放矢,圍繞數(shù)據(jù)分析的目標(biāo),找到合適的拆解方法,否則只能無頭蒼蠅一樣到處亂撞。
另外,當(dāng)發(fā)現(xiàn)數(shù)據(jù)異常時(shí),嘗試從不同的維度進(jìn)行細(xì)分,這樣既能鍛煉數(shù)據(jù)分析思維,又能加深對(duì)業(yè)務(wù)的理解。
五、尋找相關(guān)因素:相關(guān)性分析
如果一個(gè)變量改變的時(shí)候,另一個(gè)變量也朝著相同的方向發(fā)生變化,那么我們就說這兩個(gè)變量之間存在相關(guān)性。
分析一家商場的產(chǎn)品銷量數(shù)據(jù)發(fā)現(xiàn),尿布和啤酒的銷量會(huì)出現(xiàn)大致相同的變化趨勢,啤酒和尿布有什么關(guān)聯(lián)呢?采訪小虎的爸爸,他說自己下班后,給小虎的弟弟買尿布的同時(shí),也會(huì)購買自己喜歡喝的啤酒。
相關(guān)性分析,就是尋找變量之間相互關(guān)聯(lián)的程度,相關(guān)性一般通過相關(guān)系數(shù)衡量。最常用的是用于計(jì)算線性相關(guān)系數(shù)的Pearson相關(guān)系數(shù),取值區(qū)間在1到-1之間。1表示兩個(gè)變量完全線性相關(guān),-1表示兩個(gè)變量完全負(fù)相關(guān),0表示兩個(gè)變量不相關(guān)。數(shù)據(jù)越趨近于0表示相關(guān)關(guān)系越弱。
用Excel進(jìn)行簡單的相關(guān)分析,通常包括以下 3 個(gè)步驟:
- 收集相關(guān)數(shù)據(jù)
- 繪制散點(diǎn)圖形
- 計(jì)算相關(guān)系數(shù)
需要注意的是,相關(guān)性不等于因果性。兩個(gè)變量之間相關(guān)性,并不代表其中一個(gè)變量的改變,是由另一個(gè)變量的變化導(dǎo)致的。
比如說,分析發(fā)現(xiàn),國家的諾貝爾獎(jiǎng)數(shù)量,與巧克力消費(fèi)量之間呈現(xiàn)正相關(guān)關(guān)系,但這并不是說,多吃巧克力有助于獲得更多的諾貝爾獎(jiǎng)。一種合理的解釋是,諾貝爾獎(jiǎng)的數(shù)量與巧克力的消費(fèi)量,很可能都是由其他變量導(dǎo)致的,例如國民的受教育程度和富裕程度。
六、溯源影響因素:歸因分析
實(shí)際業(yè)務(wù)中,很多問題的出現(xiàn)并非是單個(gè)因素造成的,而是經(jīng)過多種因素的影響而共同造成的。
所以數(shù)據(jù)分析最頭禿的問題就是:導(dǎo)致問題的原因到底是什么?歸因分析(Attribution Analysis)要解決的問題就是多因素影響的情況下,最終效果的提升/下降,應(yīng)該如何合理地分配給過程中的各個(gè)因素。
小虎在手機(jī)上看到了朋友圈廣告發(fā)布了最新的iPhone,午休的時(shí)候刷抖音看到了有網(wǎng)紅在測評(píng)這款手機(jī),下班在地鐵上刷朋友圈的時(shí)候發(fā)現(xiàn)已經(jīng)有小伙伴收到手機(jī)在曬圖了,于是喝了一杯江小白壯壯膽回家跟老婆申請(qǐng)經(jīng)費(fèi),最后老婆批準(zhǔn)了讓他去京東買,有保障。那么請(qǐng)問,朋友圈廣告、抖音、好友朋友圈、京東各個(gè)渠道對(duì)這次成交分別貢獻(xiàn)了多少價(jià)值?
現(xiàn)實(shí)情況往往是很復(fù)雜的,在衡量其貢獻(xiàn)價(jià)值時(shí),只依靠單渠道歸因分析得到的結(jié)果是不科學(xué)的,需要引入多渠道歸因分析。常見的多渠道歸因分析模型如下:
- 末次歸因模型:將功勞100%分配給成交前的最后一個(gè)環(huán)節(jié)
- 首次歸因模型:將功勞100%分配給第一個(gè)環(huán)節(jié)
- 線性歸因模型:將功勞平均分配給過程中的每個(gè)環(huán)節(jié)
- 時(shí)間衰減歸因模型:距離最終結(jié)果時(shí)間越短的環(huán)節(jié),可以獲得越多的權(quán)重
- 位置歸因模型:第一次和最后一次環(huán)節(jié)各貢獻(xiàn)40%,中間的所有環(huán)節(jié)平分剩下的20%貢獻(xiàn)
- 自定義模型:根據(jù)自身業(yè)務(wù)的需求,自定義各環(huán)節(jié)分配比例
沒有完美的歸因分析模型,任何模型都存在它的局限性和不足,如何有效地結(jié)合使用場景和模型特點(diǎn)是用好歸因模型的前提。
七、預(yù)測變化趨勢:預(yù)測分析
了解完問題的現(xiàn)狀,定位到問題的原因后,我們還需要預(yù)測問題接下來的發(fā)展趨勢。
另一方面,在各行業(yè)各領(lǐng)域,只要有核心的業(yè)務(wù)指標(biāo),都要預(yù)測核心業(yè)績未來的走勢,銷售,市場營銷,運(yùn)營,財(cái)務(wù)等,一方面可以對(duì)未來的發(fā)展趨勢有個(gè)大致的掌握,另一方面也可以提前規(guī)劃,設(shè)定各子部門的KPI,以便盡可能地完成或者超過KPI,所以,如何準(zhǔn)確地預(yù)測核心指標(biāo)的變化趨勢非常重要。
什么是預(yù)測?用最簡單的術(shù)語來說,它是在分析過去和現(xiàn)在的數(shù)據(jù),進(jìn)而預(yù)測未來的過程。我們主要根據(jù)時(shí)間序列數(shù)據(jù)進(jìn)行定量預(yù)測。我們通過一個(gè)案例說明時(shí)間序列數(shù)據(jù)的主要組成。
如下是各年搭乘飛機(jī)飛行乘客數(shù)量的趨勢。
- 趨勢性:趨勢是事物發(fā)展或變化的總體方向。在上面的例子中,我們看到時(shí)間序列呈增長趨勢,這意味著在搭乘飛機(jī)飛行的乘客數(shù)量整體趨勢上是在增加。如下圖中第一張圖所示。
- 季節(jié)性:在上述時(shí)間序列中可以看到的另一個(gè)清晰的模式,就是該變化趨勢以固定的時(shí)間周期重復(fù),我們稱為季節(jié)性。在特定時(shí)間周期內(nèi)重復(fù)出現(xiàn)或重復(fù)的時(shí)間序列中任何可預(yù)測的變化模式都可以說是季節(jié)性。下圖中第二張圖所示。
- 隨機(jī)性:去除趨勢性和季節(jié)性后,剩下的就是一些隨機(jī)的、無任何規(guī)律的白噪聲。下圖中第三張圖所示。
時(shí)間序列預(yù)測的模型有很多,主要?dú)w為以下2類:
(1)傳統(tǒng)預(yù)測方法
- AR(Auto Regressive Model)自回歸模型
- MA(Moving Average Model)移動(dòng)平均模型
- ARMA(Auto Regressive and Moving Average Model)自回歸移動(dòng)平均模型
- ARIMA(Auto Regressive Integrate Moving Average Model)差分自回歸移動(dòng)平均模型等
(2)現(xiàn)代預(yù)測方法
基于機(jī)器學(xué)習(xí)方法、深度學(xué)習(xí)的預(yù)測方法。對(duì)于機(jī)器學(xué)習(xí)方法,xgboost,隨機(jī)森林及SVM這些都是可以用的,也沒有說哪個(gè)模型好用,需要看具體的場景及實(shí)驗(yàn),總之就是看效果說話。
(3)用Excel也能做預(yù)測
黑貓白貓,能抓住老鼠的就是好貓,不需要復(fù)雜的算法和模型,用Excel也能做簡單的預(yù)測。
以上就是產(chǎn)品、運(yùn)營工作中7種常見的數(shù)據(jù)分析方法的內(nèi)容。
本文由@數(shù)據(jù)分析星球 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評(píng)論,等你發(fā)揮!