九大數(shù)據(jù)分析方法:相關(guān)分析法
編輯導(dǎo)語(yǔ):在平常工作中,我們常常會(huì)需要衡量?jī)烧咧g的關(guān)系,這時(shí),我們就可以用到一種基礎(chǔ)的分析方法——相關(guān)分析法。本文介紹了相關(guān)分析法的使用方法以及其不足之處,希望對(duì)你在數(shù)據(jù)分析中有所幫助。
在工作中,我們經(jīng)常會(huì)問:
- 下雨和業(yè)績(jī)下降有多大關(guān)系?
- 銷售上漲和新品上市有多大關(guān)系?
- 營(yíng)銷投入與業(yè)績(jī)產(chǎn)出有多大關(guān)系?
這些問題,都有一個(gè)基礎(chǔ)分析方法有關(guān):相關(guān)分析法。
一、什么叫“相關(guān)
簡(jiǎn)單來說,相關(guān)就是兩個(gè)事件之間有關(guān)系。比如:
- 廣告投入與銷售業(yè)績(jī)
- 下雨刮風(fēng)和門店人流
- 用戶點(diǎn)擊和消費(fèi)行為
即使沒有做分析,直觀上看這些事件之間也有關(guān)系。但是不做分析的話,具體是啥樣的關(guān)系,很難說清楚。而相關(guān)分析,就是找出這種關(guān)系的辦法。
二、什么是“相關(guān)分析”?
相關(guān)分析,特指:找到兩個(gè)數(shù)據(jù)指標(biāo)之間的相關(guān)關(guān)系。比如一個(gè)APP里,用戶反復(fù)瀏覽一款商品,所以他會(huì)買嗎?
- 一派認(rèn)為:看的多,說明用戶感興趣,所以會(huì)買
- 另一派認(rèn)為:看了這么久都不買,那肯定不會(huì)買了
- 還有一派認(rèn)為:看多少次跟買不買沒關(guān)系,得看有沒有活動(dòng)
聽聽似乎都有理,最后還是得數(shù)據(jù)說話。這里討論的,就是:用戶瀏覽行為與消費(fèi)行為之間,是否有關(guān)系的問題。相關(guān)分析,即要找出這兩個(gè)指標(biāo)之間的關(guān)系。
三、直接相關(guān)關(guān)系
注意:指標(biāo)之間可能天生存在相關(guān)關(guān)系。常見的有三種形態(tài):
- 在結(jié)構(gòu)分析法中,整體指標(biāo)與部分指標(biāo)之間關(guān)系
- 在指標(biāo)拆解法中,主指標(biāo)與子指標(biāo)之間的關(guān)系
- 在漏斗分析法中,前后步驟指標(biāo)之間的關(guān)系
(如下圖所示)
這三種情況,稱為:直接相關(guān)直接相關(guān)不需要數(shù)據(jù)計(jì)算,通過指標(biāo)梳理就能看清楚關(guān)系。直接相關(guān)的情況下,兩個(gè)指標(biāo)出現(xiàn)同時(shí)上漲/下跌的趨勢(shì),是很好理解的。比如:
- 整個(gè)公司業(yè)績(jī)都不好,所以A分公司業(yè)績(jī)也很差(結(jié)構(gòu)分析)
- 客戶數(shù)太少了,所以整體業(yè)績(jī)不好(主指標(biāo)、子指標(biāo))
- 看到廣告人數(shù)太少了,所以最后轉(zhuǎn)化不好(前后步驟)
如果直接相關(guān)的兩個(gè)指標(biāo)沒有同漲同跌,往往意味著問題。比如做用戶增長(zhǎng),注冊(cè)的新用戶數(shù)量大漲,但付費(fèi)轉(zhuǎn)化率持續(xù)大幅度下跌,這就說明獲客效率在下降,可能是目標(biāo)用戶已耗盡,也有可能是渠道在造假,也有可能是獲客方法有誤,總之要深入分析(如下圖)。
四、間接相關(guān)關(guān)系
有些指標(biāo)并非直接相關(guān),但理論上是有關(guān)系的。比如品牌廣告與銷售收入,理論上肯定是存在關(guān)系:廣告多了,知名度高了,銷量肯定好。
但是品牌廣告又沒有帶貨鏈接,不能直接說:有5000萬的銷售業(yè)績(jī)是用戶通過廣告鏈接購(gòu)買的。此時(shí)就是典型的間接相關(guān)關(guān)系(如下圖)。分析間接相關(guān)關(guān)系,有2種常用方法,一種是散點(diǎn)圖法,可以直接做散點(diǎn)圖,發(fā)現(xiàn)相關(guān)關(guān)系(如下圖所示)
另一種是計(jì)算相關(guān)系數(shù)。這里先不講相關(guān)系數(shù)具體公式,小伙伴們只要記得excel里對(duì)應(yīng)的操作即可(如下圖)。
計(jì)算出可以發(fā)現(xiàn),廣告投入與銷售兩個(gè)指標(biāo)之間,確有相關(guān)關(guān)系。至于具體是怎么相關(guān)的,可以再做進(jìn)一步研究。間接相關(guān)關(guān)系,經(jīng)常用來找改進(jìn)業(yè)績(jī)的措施。比如互聯(lián)網(wǎng)行業(yè)里著名的“魔法數(shù)字”法,本質(zhì)就是找用戶瀏覽、點(diǎn)贊、分享、登錄等行為,與用戶留存、付費(fèi)行為之間的相關(guān)關(guān)系。
如果發(fā)現(xiàn):當(dāng)用戶點(diǎn)贊4次以后,用戶的90天留存會(huì)明顯增高。那么就把這個(gè)“4次留存”稱為魔法數(shù)字,然后努力推動(dòng)用戶完成4次點(diǎn)贊。
五、相關(guān)分析的不足之處
世界上沒有完美的分析方法,相關(guān)分析有兩大不足之處。
1. 相關(guān)不等于因果
兩個(gè)指標(biāo)相關(guān)關(guān)系,本質(zhì)上只是一條數(shù)據(jù)公式計(jì)算出來的結(jié)果,至于兩個(gè)指標(biāo)為啥相關(guān)?不能直接從計(jì)算里得結(jié)論。實(shí)際上只要兩個(gè)指標(biāo)走勢(shì)相似,在計(jì)算的時(shí)候就能顯示出相關(guān)關(guān)系。
這里有一個(gè)經(jīng)典例子,下圖是我在小區(qū)里種的一棵樹的高度,與我國(guó)GDP之間的相關(guān)分析。大家會(huì)發(fā)現(xiàn):哇塞!這倆指標(biāo)完美相關(guān)哦!那么我種的這顆樹就是我國(guó)的龍脈,能保佑我國(guó)經(jīng)濟(jì)騰飛咯?——當(dāng)然不是!這就是相關(guān)不等于因果的直接體現(xiàn)。
2. 相關(guān)分析不能解決非量化指標(biāo)問題
很多時(shí)候,我們想找的關(guān)系不能用數(shù)據(jù)量化。比如我們想知道:旗艦店是不是比社區(qū)店更能吸引消費(fèi)者。一個(gè)店是不是旗艦,取決于位置、裝修、宣傳等諸多因素,不能粗暴的用開店面積、員工人數(shù)等指標(biāo)來代替。想分析這種非量化特征與指標(biāo)之間的關(guān)系,需要用到另一種分析方法:標(biāo)簽分析法。
作者:碼工小熊,微信公眾號(hào):碼工小熊
本文由 @碼工小熊 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議
寫的非常好