產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

4 評論 6059 瀏覽 59 收藏 22 分鐘

編輯導(dǎo)語:數(shù)據(jù)分析是每一位產(chǎn)品經(jīng)理必備技能,如果你想掌握一些好用又簡易的數(shù)據(jù)分析方法,那么,我推薦你看這篇文章,本文作者據(jù)此總結(jié)了許多類型的分析方法,既簡單又好用,感興趣的朋友來一起學(xué)習(xí)吧。

前面《數(shù)據(jù)分析之前知道這 7 件事,少花 80% 時間》講了在數(shù)據(jù)分析之前需要知道的事,在進(jìn)入數(shù)據(jù)分析階段,筆者總結(jié)整理了一些好用易上手的分析方法,讓你事半功倍。以下,Enjoy~

一、數(shù)據(jù)分析的金字塔模型

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

數(shù)據(jù)分析從難易程度區(qū)分大致可以劃分為 5 個層級,覆蓋了數(shù)據(jù)整理、統(tǒng)計、機(jī)器學(xué)習(xí)的過程,數(shù)據(jù)分析后的決策環(huán)節(jié)不在本次討論的范圍。

5 個層級分別包括了:量化現(xiàn)況、量化變數(shù)之間的相關(guān)性、量化變數(shù)之間的因果關(guān)系、預(yù)測未來和求最佳解。

Q1:SaaS銷售人員拜訪新客戶次數(shù)的走勢如何?

比如層級 1,需要解的問題是量化現(xiàn)況。可以使用“敘述統(tǒng)計”、“數(shù)據(jù)可視化”等方法,把數(shù)據(jù)通過圖表的方式表現(xiàn)出來,從中觀察圖表的數(shù)量、頻次、波動、分布等等,這個層級主要是依賴可視化后的觀察得以實現(xiàn)。

Q2:SaaS銷售人員拜訪新客戶的次數(shù),跟營業(yè)額有相關(guān)嗎?

Q3:市場部增加廣告投放量,就能得到更多訂單嗎?

像層級 2、3 中探索數(shù)據(jù)的相關(guān)和因果關(guān)系,是需要藉由數(shù)據(jù)觀察后,再進(jìn)行二次推論,屬于數(shù)據(jù)挖掘。

Q4:SaaS產(chǎn)品經(jīng)理追蹤哪些數(shù)據(jù),才能知道用戶下個月會不會取消訂閱?

Q5:CEO該如何分配員工開發(fā)新客戶,才能讓營收最大化?

而層級 4、5 則是希望通過已有數(shù)據(jù)的樣本,去預(yù)估未來數(shù)據(jù)的可能性/概率、最佳解或近似解,屬于數(shù)據(jù)探索。

對于不同層級,需要面對的問題也不一樣,可以層層遞進(jìn),由易到難,逐一選擇數(shù)據(jù)分析需要解的問題。在進(jìn)入數(shù)據(jù)分析階段,具備數(shù)據(jù)分析的層級結(jié)構(gòu)認(rèn)知尤為重要,這決定了你能夠在對的時機(jī)做對的事情。

二、7 種常見數(shù)據(jù)分析方法

2.1 總量分析

用于描述某個母群(population,指你想了解的集合體,可能是顧客或產(chǎn)品)或某個市場區(qū)隔,或者比較兩個市場區(qū)隔的差異,是最常用、最簡單的分析方法。

Q:哪些人會在酒莊辦婚禮呢?

查閱過往 3 年、300 位顧客的預(yù)約記錄→分析性別、年齡、戶籍地址→ 85% 女性、平均年齡 33 歲、60% 是當(dāng)?shù)厝恕绾吾槍@群人溝通、拓展業(yè)務(wù)?

2.2 相關(guān)分析

觀察 2 件或多件事情間的關(guān)系,期望能用一個因素解釋或驅(qū)動另一個因素。

Q:為什么推出某個功能后,轉(zhuǎn)化率會下降?

  • 假設(shè) 1:轉(zhuǎn)化率跟瀏覽器有關(guān)。
  • 假設(shè) 2:轉(zhuǎn)化率跟有無網(wǎng)絡(luò)信標(biāo)(web bug)有關(guān)。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

結(jié)論:

  • Chrome 瀏覽器如果有網(wǎng)絡(luò)信標(biāo),會造成轉(zhuǎn)化率下降 13%。
  • Chrome 瀏覽器造成轉(zhuǎn)化率下降 20%。
  • 60% 的轉(zhuǎn)化率下降仍然無法解釋。

注:網(wǎng)絡(luò)信標(biāo)(web bug)是一個放在網(wǎng)頁或電子郵件上的文件對象,用于監(jiān)測用戶的行為。

2.3 趨勢分析

分析一段時期內(nèi)的趨勢,常用于檢視一段時間內(nèi)的銷售績效或營業(yè)成長率,目標(biāo)是找出中斷的節(jié)點,并指出那段時期內(nèi)受影響的原因。

Q:營收增長,但成長率卻下降,原因出在哪?

步驟 1,觀察一段時間內(nèi)的趨勢。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

步驟 2,加入各產(chǎn)品、各渠道的營收和成長率。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

觀察結(jié)果:S 成長率不斷下降、M 的站外成長率卻在上升。

步驟 3,量化影響。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

觀察結(jié)果:S 占營收成長率下降的 84%,必須集中心力采取行動。

2.4 規(guī)模估計

在缺乏歷史的情況下,以結(jié)構(gòu)化的方法估算。通常用于進(jìn)軍新市場的企劃,或是要了解未上市產(chǎn)品的銷售潛力。

Q:想在廣東某城市推廣小學(xué)夏令營產(chǎn)品,怎么估算市場規(guī)模?

步驟 1,分層。將問題切割,找出可能不同的市場區(qū)隔。

市區(qū)和郊區(qū)的小學(xué)密度可能不同

步驟 2,設(shè)計方程式。確定哪些數(shù)值和因素可能影響正在估算的規(guī)模數(shù)值。

城市、人口和財富可能影響小學(xué)的數(shù)量

小學(xué)數(shù)量=城市數(shù)量x每座城市的人口數(shù)x每群人口的學(xué)校數(shù)量x財富因數(shù)(市區(qū)和郊區(qū)的財富對比)

步驟 3,計算方程式。對方程式里的數(shù)值進(jìn)行假設(shè)。

市區(qū)人口=50K,郊區(qū)人口=10K。

每10K人有1所學(xué)校,市區(qū)的財富是郊區(qū)的2倍。

市區(qū)小學(xué)估計值:20x50000x1/10000=200

郊區(qū)小學(xué)估計值:20x10000x1/10000=20

約有220所小學(xué)

2.5 預(yù)測分析

分析目前和過去的事實數(shù)據(jù),來預(yù)測未來的事件或行為,最常使用的統(tǒng)計技術(shù)是回歸和分類。

Q:結(jié)賬的轉(zhuǎn)化率變低了,為什么?

利用邏輯回歸建立模型(特別的回歸形式,適用于因變數(shù)是二元性質(zhì),“有或沒有”,此案例考量即為有轉(zhuǎn)化或沒轉(zhuǎn)化)

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

因變數(shù):想要預(yù)測的目標(biāo),如轉(zhuǎn)化率。

自變數(shù):指可能和因變數(shù)有關(guān)系,或是沒有關(guān)系的一些未知數(shù),由所提出的假設(shè)決定,如藍(lán)色按鈕、橫幅廣告等。

2.6 市場區(qū)隔

區(qū)隔顧客或產(chǎn)品成有意義的群組,通常是為了鎖定目標(biāo),透過量身打造的方式,讓該目標(biāo)群體產(chǎn)生更高的價值。

Q:哪些客戶只想折扣?哪些客戶想要第一手信息?

用 RFM 模型為顧客分組。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

2.7 顧客生命周期分析

觀察消費(fèi)者的購買流程,以確定某一群顧客正處于哪個階段,以及怎么將他們推向下一個階段。

Q:怎么讓使用者成為重度玩家?

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

同類群組分析→ 客戶存活的天數(shù)過短,就必須加強(qiáng)使用者體驗;若新客戶人數(shù)逐漸減少,則必須加強(qiáng)廣告或增加促銷活動。

三、4 種統(tǒng)計數(shù)值掌握數(shù)據(jù)特性

手上有一群數(shù)據(jù)的時候,要快速掌握數(shù)據(jù)的特征,可以從“平均數(shù)”、“中位數(shù)”、“眾數(shù)”和“標(biāo)準(zhǔn)差”下手。

Q:這是公司全體員工職業(yè) IT 素養(yǎng)程度報告,身為公司數(shù)字化轉(zhuǎn)型的負(fù)責(zé)人,該如何利用它擬定教育訓(xùn)練策略?

整體實力中等,滿分 10 分,拿到平均成績?yōu)?5.8 分。

組織實力分布不均,中位數(shù)低于平均數(shù),表示能力落后的成員較多,應(yīng)依能力設(shè)計不同的課程,或由能力佳者帶領(lǐng)落后者學(xué)習(xí)。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

員工職業(yè)IT素養(yǎng)程度表

四、2 個敘述統(tǒng)計的陷阱

敘述統(tǒng)計雖然能夠幫助我們掌握數(shù)據(jù)的特征,快速產(chǎn)生觀點,但在應(yīng)用平均數(shù)、百分比推導(dǎo)結(jié)論時,要留意陷阱。

4.1 平均數(shù)陷阱

平均分提高了 1.2 分,表現(xiàn)優(yōu)異。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

平均數(shù)雖然提高了,但標(biāo)準(zhǔn)差只縮小 0.6分,代表組織內(nèi)程度差距未縮小,可能是有IT背景者進(jìn)步幅度大,拉高了平均分。

4.2 百分比陷阱

近 3 年員工職業(yè) IT 素養(yǎng)的成績持平,2021 年成績跟 2019 年一樣。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

不要用百分比去推算分?jǐn)?shù)是否成長,因為每年的基期不一樣,所以增長或減少的數(shù)值會不同。下表所示,2021 年成績比 2019 年少了 0.71 分。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

五、5 種數(shù)據(jù)比較的方式

「比較」是讓數(shù)據(jù)產(chǎn)生意義的有效方式,但怎么比、跟誰比?我整理了 5 種比較方式,以拿到某品牌掛耳咖啡的銷售數(shù)據(jù)為例。

5.1 差距比較:分析對象和比較對象的差異

Q:某公司掛耳咖啡包全年營收 3 億在市場上的表現(xiàn)如何?跟競爭對手的差距為何?

步驟 1,選擇比較對象,同類性質(zhì)互比。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

步驟 2,設(shè)定比較基準(zhǔn)值,繪制條形圖。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

A:掛耳咖啡包為 A 公司主力商品,雖然 A 公司在咖啡包全年收入上超越我們,但比起 A 公司,我們具有多項產(chǎn)品同步發(fā)展的優(yōu)勢。

5.2 趨勢比較:分析一段時期內(nèi)市場、營收、產(chǎn)品的走勢

Q:某公司掛耳咖啡包 2021 年營收 3 億,跟前幾年比有成長嗎?成長了多少呢?

步驟 1,搜集近 10 年公司咖啡包營收數(shù)據(jù),繪制折線圖。

步驟 2,觀察曲線走向,根據(jù)轉(zhuǎn)折點、異常值推測變化的原因。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

A:跟 2020 年比沒有成長太多,但與 2012 年相比營收成長了 10 倍,顯然販?zhǔn)勐?lián)名商品有效果。

5.3 指數(shù)分析:利用總體市場數(shù)據(jù),判斷品牌的目標(biāo)對象

Q:某公司掛耳咖啡包在市場上哪個年齡層最有優(yōu)勢?

步驟 1,搜集比較對象的人口分布比例。

步驟 2,計算指數(shù)數(shù)值。當(dāng)指數(shù)小于 95,代表在該年齡層為相對少數(shù),指數(shù)大于 105 代表在該年齡層為相對多數(shù)。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

A:咖啡包在 25~44 歲的客群中有競爭優(yōu)勢,45 歲以上的客群還需要經(jīng)營。

5.4 異質(zhì)比較:分析數(shù)據(jù)的結(jié)構(gòu)是否明確偏向或集中某處

Q:假設(shè)掛耳咖啡包月度營收為 250 萬,跟公司的其他產(chǎn)品相比表現(xiàn)算好嗎?

步驟 1,將所有產(chǎn)品月度營收分布由大至小排列,并記錄區(qū)間次數(shù)。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

步驟 2,繪制直方圖,注意分散的程度、峰值數(shù)量。

圖 1:一個峰值位于中間、圖偏向「鐘型曲線」,代表數(shù)據(jù)為常態(tài)分布,產(chǎn)品的營收平均值與中位數(shù)較不受異常值影響,分布比較平均。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

圖 2:有 2 個峰值,平均數(shù)、中位數(shù)受異常值影響,數(shù)據(jù)分布不平均。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

A:產(chǎn)品月度營收分布如圖 1 所示,代表產(chǎn)品的月度營收分布平均,集中在 151~200 萬區(qū)間,咖啡包收入 250 萬高于平均,表現(xiàn)不錯。

5.5 變數(shù)分析:比較多個事件的關(guān)系,希望找到其中一個事件能去解釋另外一個事件

Q:網(wǎng)絡(luò)廣告費(fèi)用的多少,是否影響掛耳咖啡包的銷售額?

步驟 1,利用 Excel 的 CORREL 函數(shù)計算廣告投入費(fèi)、銷售額的相關(guān)系數(shù),系數(shù)越接近 1,代表廣告費(fèi)投入與銷售額呈正相關(guān);系數(shù)越接近 -1,則表示兩者為負(fù)相關(guān)。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

步驟 2,將數(shù)據(jù)繪制成分布圖。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

A:廣告投入費(fèi)用與產(chǎn)品銷售額呈正相關(guān),代表投廣告的行銷策略有效,下次退出新品時可參考此策略。

六、數(shù)據(jù)比較的陷阱

Q:患者死亡率是評估醫(yī)療品質(zhì)的指標(biāo)之一,試試從下表評判,A、B醫(yī)院,哪間醫(yī)療品質(zhì)更好?

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

無法評判。

參考表 1 時,B 醫(yī)院平均死亡率比 A 更低,B 醫(yī)院表現(xiàn)比 A 更好;但表2加入「輕重癥死亡人數(shù)」變項時,A醫(yī)院無論在輕癥、重癥死亡率都比 B 更好,為什么會這樣?

原因:

因為 A 醫(yī)院的重癥人數(shù)是 B 的3倍以上,導(dǎo)致平均死亡率被拉升,只要 A、B 醫(yī)院輕重癥患者比例相同,就不會有類似的問題。這個案例被稱為「辛普森悖論」現(xiàn)象,也就是當(dāng)某項統(tǒng)計變項為搜集到(此例為輕重癥人數(shù)比例),造成統(tǒng)計結(jié)果逆轉(zhuǎn)的現(xiàn)象。

避免方式:

  1. 比較對象程度一致:醫(yī)院不跟診所比。
  2. 依分析目的決定數(shù)據(jù)分析方法:整體狀況適用平均數(shù)分析;群體內(nèi)比較則搜集更多統(tǒng)計變項的數(shù)據(jù)。

七、相關(guān)關(guān)系與因果關(guān)系

Q:許多世界知名的領(lǐng)導(dǎo)者都愛好運(yùn)動,前美國總統(tǒng)奧巴馬從小打籃球、youtube總裁沃西基擅長冰球。所以我們可以推測,「擅長運(yùn)動的孩子,學(xué)習(xí)力更好」?

運(yùn)動與學(xué)習(xí)力之間應(yīng)為相關(guān)關(guān)系而非因果關(guān)系,兩者之間可能存在著第三變數(shù),也就是家長對教育的重視程度。

產(chǎn)品經(jīng)理好用易上手的數(shù)據(jù)分析方法

培養(yǎng)運(yùn)動能力,未必能提升學(xué)習(xí)力。運(yùn)動能力→學(xué)習(xí)能力→家長對教育的重視程度。重視教育的家長,會引導(dǎo)孩子學(xué)習(xí),所以他們的成績比較出色。重視教育的家長,會注意孩子的飲食均衡,導(dǎo)致體力變好。

X 導(dǎo)致 Y 或 Y 導(dǎo)致 X,其實存在另一個變數(shù) Z,是 Z 導(dǎo)致 X 和 Y。舉例來說,冰淇淋的銷售量會隨著穿短褲的人數(shù)增加而增加,不是「越多人穿短褲」導(dǎo)致「越多人買冰淇淋」,而是兩種發(fā)生的共同原因是「夏天氣溫較高」。

如果混淆了因果和相關(guān),比方廣告預(yù)算越多,銷售額越高,容易導(dǎo)致做出錯誤的商業(yè)決策。所以,較謹(jǐn)慎的做法是進(jìn)行隨機(jī)對照實驗(RCT,Randomized Controlled Trial),或者稱 A/B 測試(A/B Testting),就是把受試者隨機(jī)分為兩組,兩組只有一個變數(shù)不同,如果導(dǎo)致不同結(jié)果,便可以稱該變數(shù)導(dǎo)致某結(jié)果,或變數(shù)和結(jié)果有因果關(guān)系。

八、利用 A/B 測試,確認(rèn)因果關(guān)系

南美國總統(tǒng)奧巴馬的競選團(tuán)隊,便是利用 RCT 測試哪一種首頁的注冊率最高。結(jié)果相比原本想選擇「影片」和「望向遠(yuǎn)方的獨照」,最后經(jīng)對實驗選擇「奧巴馬全家?!沟姆桨缸屪匀藬?shù)多了 288 萬人,并多募得 6000 萬美元的政治獻(xiàn)金。

如果環(huán)境不允許,或是沒有資源做隨機(jī)對照實驗,《數(shù)據(jù)分析的力量》建議用「自然實驗(natural experience)」替代,就是進(jìn)行一系列假設(shè)、驗證,厘清因果關(guān)系。

舉例來說,想知道改變自付額,對醫(yī)療服務(wù)使用頻率的影響??梢韵燃僭O(shè)「如果自付額會影響醫(yī)療服務(wù)的使用,70 歲以上的人,應(yīng)該會比 70 歲以下的人,更常使用」,因為日本法令規(guī)范,70 歲開始,自付額由 3 成降為 1 成。

查詢公開數(shù)據(jù)后發(fā)現(xiàn),隨著年齡愈大,醫(yī)療服務(wù)的使用者也愈多。但到了 70歲,原本緩慢上升的曲線突然大跳躍!

這個「斷層」代表有變數(shù)發(fā)生,而 69~70 歲比較普遍的改變,就是自付額的高低。自付額和醫(yī)療服務(wù)的使用頻率有因果關(guān)系得到了驗證。

#專欄作家#

龍國富,公眾號:龍國富,人人都是產(chǎn)品經(jīng)理專欄作家,人因工程碩士。致力于終身學(xué)習(xí)和自我提升,分享用戶研究、客戶體驗、服務(wù)科學(xué)等領(lǐng)域資訊,觀點和個人見解。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)授權(quán),禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

專欄作家

龍國富,公眾號:龍國富,人人都是產(chǎn)品經(jīng)理專欄作家,CxHub主理人。致力于終身學(xué)習(xí)和自我提升,分享用戶研究、客戶體驗、服務(wù)科學(xué)等領(lǐng)域資訊,觀點和個人見解。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)授權(quán),禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 關(guān)注公眾號“龍國富”, ???♂?進(jìn)入客戶體驗交流群~ 來一起嘮嘮客戶體驗。

    來自廣東 回復(fù)
  2. 有具體表格數(shù)據(jù)就好了,可以實踐一下

    來自廣東 回復(fù)
  3. 這個寫得太好了

    回復(fù)
  4. 這幾個方法確實相對簡單好上手呢,收藏起來慢慢學(xué)習(xí)了!

    來自廣東 回復(fù)