數(shù)據(jù)分析實戰(zhàn):數(shù)據(jù)分析的5大關(guān)鍵環(huán)節(jié)
![](http://image.woshipm.com/wp-files/img/107.jpg)
大數(shù)據(jù)及移動互聯(lián)網(wǎng)時代,每一個使用移動終端的人無時無刻不在生產(chǎn)數(shù)據(jù),而作為互聯(lián)網(wǎng)服務(wù)提供的產(chǎn)品來說,也在持續(xù)不斷的積累數(shù)據(jù)。數(shù)據(jù)如同人工智能一樣,往往能表現(xiàn)出更為客觀、理性的一面,數(shù)據(jù)可以讓人更加直觀、清晰的認識世界,數(shù)據(jù)也可以指導人更加理智的做出決策。
數(shù)據(jù)驅(qū)動的時代,無論你的工作內(nèi)容是什么,掌握一定的數(shù)據(jù)分析能力,可以幫助你更好的認識這個世界,更好的提升工作效率。
數(shù)據(jù)分析流程主要分為五個關(guān)鍵環(huán)節(jié):明確數(shù)據(jù)分析目的、明確數(shù)據(jù)源及數(shù)據(jù)口徑、數(shù)據(jù)處理、數(shù)據(jù)分析、輸出。
一、明確數(shù)據(jù)分析目的
任何一件事在做之前都是有目的性的,數(shù)據(jù)分析也是如此,在進行數(shù)據(jù)分析之前首先要明確數(shù)據(jù)分析為什么要做?下面通過用戶、需求、場景三要素拆解法來明確數(shù)據(jù)分析的目的。
1、用戶
這里提到的用戶是指數(shù)據(jù)分析內(nèi)容或者結(jié)果給誰看?這里的目標用戶主要分三類:你自己、企業(yè)內(nèi)部業(yè)務(wù)部門、外部客戶。這里主要對后兩種進行解析。
企業(yè)內(nèi)部業(yè)務(wù)部門:
這類用戶通常會通過制定不同策略提升企業(yè)某些指標的提升,可以是市場部門、運營部門或者是維系部門。他們往往指導企業(yè)內(nèi)部積累了大量數(shù)據(jù),但是不知道如何使用,如何通過數(shù)據(jù)分析形成有效的決策。
外部客戶:
這類用戶通常不具有某一領(lǐng)域或多個領(lǐng)域的行業(yè)數(shù)據(jù),希望通過這些數(shù)據(jù)了解他的用戶或市場,而恰巧你的企業(yè)具備這樣的數(shù)據(jù),這種情況下通過數(shù)據(jù)價值變現(xiàn),形成對外的數(shù)據(jù)分析輸出,對外部用戶來說可以更好的了解市場,對于你來說也可以通過數(shù)據(jù)形成價值變現(xiàn),為企業(yè)帶來收益。
2、需求
你的用戶即數(shù)據(jù)分析問題提出者為什么要做數(shù)據(jù)分析,他們是希望通過數(shù)據(jù)分析發(fā)現(xiàn)問題還是希望提升某個業(yè)務(wù)指標,這些都是在做數(shù)據(jù)分析前需要了解的,只有了解了需求才能制定更合理的數(shù)據(jù)分析思路(后面會介紹到數(shù)據(jù)分析方法)。
3、場景
場景更多體現(xiàn)的是數(shù)據(jù)分析的場景,如業(yè)務(wù)部門想了解用戶在注冊流程中的用戶流失原因,那么這就是問題的場景,要根據(jù)場景去定義問題,梳理數(shù)據(jù)分析思路,選擇數(shù)據(jù)分析的方法。
二、明確數(shù)據(jù)源及數(shù)據(jù)口徑
1、數(shù)據(jù)源
數(shù)據(jù)的獲取主要有三種方式,第一種通過一些基于前端頁面的數(shù)據(jù)采集工具獲取,如GrowingIO等可視化的數(shù)據(jù)采集產(chǎn)品;第二種是在產(chǎn)品設(shè)計過程中通過數(shù)據(jù)埋點的方式,在需要數(shù)據(jù)時可以進行簡單提取,這種方式的前提是在產(chǎn)品規(guī)劃階段就已經(jīng)對未來的數(shù)據(jù)獲取提前做好了準備;第三種是如果前期沒有進行功能埋點、可視化的采集工具也無法獲取數(shù)據(jù)時,找研發(fā)團隊通過后臺腳本或技術(shù)研發(fā)的方式獲取數(shù)據(jù)。
2、數(shù)據(jù)口徑
數(shù)據(jù)口徑,即定義某一個數(shù)據(jù)指標的含義。舉個簡單栗子來說,針對于用戶流失指標的定義,不同的產(chǎn)品或者不同的領(lǐng)域會有所不同。對于普通電商產(chǎn)品來說,用戶三天之內(nèi)沒有登錄或購買就是流失,但是對于奢侈品電商來說,僅僅用幾天沒有登錄或購買即算作用戶流失是不合理的。
對于數(shù)據(jù)口徑的明確,需要結(jié)合數(shù)據(jù)分析任務(wù)提出者的需求以及具體業(yè)務(wù)場景,定義清晰的數(shù)據(jù)口徑對后面的數(shù)據(jù)處理以及數(shù)據(jù)分析具有關(guān)鍵的意義。
三、數(shù)據(jù)處理
數(shù)據(jù)處理階段主要做的工作是數(shù)據(jù)清洗、數(shù)據(jù)補全、數(shù)據(jù)整合。
1、數(shù)據(jù)清洗
發(fā)現(xiàn)數(shù)據(jù)中的異常值,如對連續(xù)多天的用戶登錄數(shù)據(jù)進行處理時,如果有一天的登錄數(shù)遠遠超過正常值,那么就需要分析,該天是否有重大營銷活動,還是采集數(shù)據(jù)時出現(xiàn)的錯誤,通過異常值不僅可以發(fā)現(xiàn)數(shù)據(jù)采集方法的問題,同時可能通過異常值找到數(shù)據(jù)分析的目標。比如對信用卡詐騙的分析,就是通過查找異常數(shù)據(jù)的方式。
2、數(shù)據(jù)補全
針對數(shù)據(jù)缺失的情況如何解決,一種方式是根據(jù)數(shù)據(jù)前后的關(guān)聯(lián)關(guān)系填充平均值等方式,另一種則是直接選擇丟失該條記錄不用于數(shù)據(jù)分析。兩種方式各有優(yōu)劣,建議結(jié)合具體問題具體分析。
3、數(shù)據(jù)整合
在采集數(shù)據(jù)時,不同類型數(shù)據(jù)之間可能存在潛在關(guān)聯(lián)關(guān)系,通過數(shù)據(jù)的整合,豐富數(shù)據(jù)維度,更利于發(fā)現(xiàn)更多有價值的信息。如用戶注冊數(shù)據(jù)與用戶購買數(shù)據(jù)相關(guān)聯(lián),可以通過用戶的基礎(chǔ)屬性信息判斷用戶購買的商品是自己使用還是送人等等。
四、數(shù)據(jù)分析
數(shù)據(jù)分析思路又叫數(shù)據(jù)分析方法,數(shù)據(jù)分析一定是以目的為導向的,通過目的選擇數(shù)據(jù)分析的方法。通常來說主要有以下集中分析思路
1、異常分析
通過數(shù)據(jù)分析發(fā)現(xiàn)異常情況,找到解決異常問題的方法。
2、尋找關(guān)聯(lián)關(guān)系
關(guān)聯(lián)關(guān)系也可以成為購物車分析,耳熟能詳?shù)奈譅柆斈虿寂c啤酒的案例就是關(guān)聯(lián)關(guān)系的最佳實踐,通過分析不用商品或不同行為之間的關(guān)系,發(fā)現(xiàn)用戶的習慣。
3、分類、分層
通過用戶特征、用戶行為對用戶進行分類分層,形成精細化運營、精準化業(yè)務(wù)推薦,進一步提升運營效率和轉(zhuǎn)化率。
4、預測
通過用戶歷史行為預測用戶未來可能的行為,提升用戶感知和使用體驗。
五、輸出
在前面層提到,數(shù)據(jù)分析的目的是通過數(shù)據(jù)清晰的了解用戶、產(chǎn)品和當前業(yè)務(wù)形態(tài),從而得到有效的戰(zhàn)略決策指導下一步的發(fā)展。
如何通過數(shù)據(jù)清晰了解用戶、產(chǎn)品和業(yè)務(wù)生態(tài)?一行行枯燥的數(shù)字是無法讓業(yè)務(wù)部門或外部客戶直觀了解數(shù)據(jù)背后的含義的,所以需要通過數(shù)據(jù)可視化的方法,簡單來說就是將一行行的數(shù)據(jù)轉(zhuǎn)化為圖表,直觀化展現(xiàn)數(shù)據(jù)的趨勢、數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系等等。在對數(shù)據(jù)可視化時,需要著重考慮數(shù)據(jù)有幾個維度、數(shù)據(jù)要向看的人展現(xiàn)什么,這些都影響著數(shù)據(jù)可視化的形式。
如針對注冊用戶男女性別比例的展現(xiàn)可以用餅狀圖,展現(xiàn)注冊用戶數(shù)隨時間變化的增長趨勢可以用曲線圖,展現(xiàn)注冊用戶歸屬地可以通過柱狀圖或地圖等等。在選擇可視化方式時,要充分考慮數(shù)據(jù)的特點以及希望用圖表展現(xiàn)出來的內(nèi)涵是什么,這樣才能用合理的方式展現(xiàn)出更直觀的分析結(jié)果。
此外,數(shù)據(jù)分析的輸出通常以數(shù)據(jù)分析報告的形式展現(xiàn),數(shù)據(jù)分析報告的主要結(jié)構(gòu)如下:
- 數(shù)據(jù)分析背景
- 數(shù)據(jù)來源及數(shù)據(jù)說明
- 數(shù)據(jù)分析方法
- 數(shù)據(jù)可視化
- 數(shù)據(jù)決策
以上是一份較為正式的數(shù)據(jù)分析報告的大體框架,如果針對日報一類并不要求正式性的數(shù)據(jù)分析結(jié)果展現(xiàn),則可以具體問題具體分析。
六、總結(jié)
數(shù)據(jù)分析方法論一定是為指導具體工作實踐而服務(wù)的,所以僅僅掌握方法論并不夠,還要通過實踐不斷完善優(yōu)化方法。只有當你真正去做數(shù)據(jù)分析這件事時,才能發(fā)現(xiàn)自己的不足,說再多不如直接去做。
#專欄作家#
記小憶,人人都是產(chǎn)品經(jīng)理專欄作者,野蠻生長的產(chǎn)品經(jīng)理,擅長從0-1搭建產(chǎn)品經(jīng)理知識體系。公眾號:PM龍門陣。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Pixabay,基于CC0協(xié)議
會統(tǒng)計不會分析?滴滴策略運營經(jīng)理帶你快速入門,15天掌握一套數(shù)據(jù)分析流程和方法!戳我報名>>http://996.pm/YNG4e
簡直水中之神,你的文章真的是用心寫的嗎?
沒明白 數(shù)據(jù)口徑是啥意思??!
我的理解就是標準,比如定義活躍用戶,可以定義為每天登錄的用戶,也可以定義為每天登錄一小時以上的用戶,根據(jù)不同產(chǎn)品或背景,這個定義不同,也就是數(shù)據(jù)口徑不同。
沒有實例,說的都是書上那種概念的東西
太泛了!
“耳熟能詳?shù)奈譅柆斈虿寂c啤酒的案例就是關(guān)聯(lián)關(guān)系的最佳實踐”這個案例真實性有待考究,說是最佳實踐就不嚴謹了,現(xiàn)在有很多是把啤酒和尿布放在一起賣的么?
比較表面,不深入,沒有什么細節(jié)
太籠統(tǒng)了