數(shù)據(jù)分析實戰(zhàn):數(shù)據(jù)分析的5大關(guān)鍵環(huán)節(jié)

9 評論 63678 瀏覽 290 收藏 10 分鐘

大數(shù)據(jù)及移動互聯(lián)網(wǎng)時代,每一個使用移動終端的人無時無刻不在生產(chǎn)數(shù)據(jù),而作為互聯(lián)網(wǎng)服務(wù)提供的產(chǎn)品來說,也在持續(xù)不斷的積累數(shù)據(jù)。數(shù)據(jù)如同人工智能一樣,往往能表現(xiàn)出更為客觀、理性的一面,數(shù)據(jù)可以讓人更加直觀、清晰的認識世界,數(shù)據(jù)也可以指導人更加理智的做出決策。

數(shù)據(jù)驅(qū)動的時代,無論你的工作內(nèi)容是什么,掌握一定的數(shù)據(jù)分析能力,可以幫助你更好的認識這個世界,更好的提升工作效率。

數(shù)據(jù)分析流程主要分為五個關(guān)鍵環(huán)節(jié):明確數(shù)據(jù)分析目的、明確數(shù)據(jù)源及數(shù)據(jù)口徑、數(shù)據(jù)處理、數(shù)據(jù)分析輸出

一、明確數(shù)據(jù)分析目的

任何一件事在做之前都是有目的性的,數(shù)據(jù)分析也是如此,在進行數(shù)據(jù)分析之前首先要明確數(shù)據(jù)分析為什么要做?下面通過用戶、需求場景三要素拆解法來明確數(shù)據(jù)分析的目的。

1、用戶

這里提到的用戶是指數(shù)據(jù)分析內(nèi)容或者結(jié)果給誰看?這里的目標用戶主要分三類:你自己、企業(yè)內(nèi)部業(yè)務(wù)部門、外部客戶。這里主要對后兩種進行解析。

企業(yè)內(nèi)部業(yè)務(wù)部門:

這類用戶通常會通過制定不同策略提升企業(yè)某些指標的提升,可以是市場部門、運營部門或者是維系部門。他們往往指導企業(yè)內(nèi)部積累了大量數(shù)據(jù),但是不知道如何使用,如何通過數(shù)據(jù)分析形成有效的決策。

外部客戶:

這類用戶通常不具有某一領(lǐng)域或多個領(lǐng)域的行業(yè)數(shù)據(jù),希望通過這些數(shù)據(jù)了解他的用戶或市場,而恰巧你的企業(yè)具備這樣的數(shù)據(jù),這種情況下通過數(shù)據(jù)價值變現(xiàn),形成對外的數(shù)據(jù)分析輸出,對外部用戶來說可以更好的了解市場,對于你來說也可以通過數(shù)據(jù)形成價值變現(xiàn),為企業(yè)帶來收益。

2、需求

你的用戶即數(shù)據(jù)分析問題提出者為什么要做數(shù)據(jù)分析,他們是希望通過數(shù)據(jù)分析發(fā)現(xiàn)問題還是希望提升某個業(yè)務(wù)指標,這些都是在做數(shù)據(jù)分析前需要了解的,只有了解了需求才能制定更合理的數(shù)據(jù)分析思路(后面會介紹到數(shù)據(jù)分析方法)。

3、場景

場景更多體現(xiàn)的是數(shù)據(jù)分析的場景,如業(yè)務(wù)部門想了解用戶在注冊流程中的用戶流失原因,那么這就是問題的場景,要根據(jù)場景去定義問題,梳理數(shù)據(jù)分析思路,選擇數(shù)據(jù)分析的方法。

二、明確數(shù)據(jù)源及數(shù)據(jù)口徑

1、數(shù)據(jù)源

數(shù)據(jù)的獲取主要有三種方式,第一種通過一些基于前端頁面的數(shù)據(jù)采集工具獲取,如GrowingIO等可視化的數(shù)據(jù)采集產(chǎn)品;第二種是在產(chǎn)品設(shè)計過程中通過數(shù)據(jù)埋點的方式,在需要數(shù)據(jù)時可以進行簡單提取,這種方式的前提是在產(chǎn)品規(guī)劃階段就已經(jīng)對未來的數(shù)據(jù)獲取提前做好了準備;第三種是如果前期沒有進行功能埋點、可視化的采集工具也無法獲取數(shù)據(jù)時,找研發(fā)團隊通過后臺腳本或技術(shù)研發(fā)的方式獲取數(shù)據(jù)。

2、數(shù)據(jù)口徑

數(shù)據(jù)口徑,即定義某一個數(shù)據(jù)指標的含義。舉個簡單栗子來說,針對于用戶流失指標的定義,不同的產(chǎn)品或者不同的領(lǐng)域會有所不同。對于普通電商產(chǎn)品來說,用戶三天之內(nèi)沒有登錄或購買就是流失,但是對于奢侈品電商來說,僅僅用幾天沒有登錄或購買即算作用戶流失是不合理的。

對于數(shù)據(jù)口徑的明確,需要結(jié)合數(shù)據(jù)分析任務(wù)提出者的需求以及具體業(yè)務(wù)場景,定義清晰的數(shù)據(jù)口徑對后面的數(shù)據(jù)處理以及數(shù)據(jù)分析具有關(guān)鍵的意義。

三、數(shù)據(jù)處理

數(shù)據(jù)處理階段主要做的工作是數(shù)據(jù)清洗、數(shù)據(jù)補全、數(shù)據(jù)整合。

1、數(shù)據(jù)清洗

發(fā)現(xiàn)數(shù)據(jù)中的異常值,如對連續(xù)多天的用戶登錄數(shù)據(jù)進行處理時,如果有一天的登錄數(shù)遠遠超過正常值,那么就需要分析,該天是否有重大營銷活動,還是采集數(shù)據(jù)時出現(xiàn)的錯誤,通過異常值不僅可以發(fā)現(xiàn)數(shù)據(jù)采集方法的問題,同時可能通過異常值找到數(shù)據(jù)分析的目標。比如對信用卡詐騙的分析,就是通過查找異常數(shù)據(jù)的方式。

2、數(shù)據(jù)補全

針對數(shù)據(jù)缺失的情況如何解決,一種方式是根據(jù)數(shù)據(jù)前后的關(guān)聯(lián)關(guān)系填充平均值等方式,另一種則是直接選擇丟失該條記錄不用于數(shù)據(jù)分析。兩種方式各有優(yōu)劣,建議結(jié)合具體問題具體分析。

3、數(shù)據(jù)整合

在采集數(shù)據(jù)時,不同類型數(shù)據(jù)之間可能存在潛在關(guān)聯(lián)關(guān)系,通過數(shù)據(jù)的整合,豐富數(shù)據(jù)維度,更利于發(fā)現(xiàn)更多有價值的信息。如用戶注冊數(shù)據(jù)與用戶購買數(shù)據(jù)相關(guān)聯(lián),可以通過用戶的基礎(chǔ)屬性信息判斷用戶購買的商品是自己使用還是送人等等。

四、數(shù)據(jù)分析

數(shù)據(jù)分析思路又叫數(shù)據(jù)分析方法,數(shù)據(jù)分析一定是以目的為導向的,通過目的選擇數(shù)據(jù)分析的方法。通常來說主要有以下集中分析思路

1、異常分析

通過數(shù)據(jù)分析發(fā)現(xiàn)異常情況,找到解決異常問題的方法。

2、尋找關(guān)聯(lián)關(guān)系

關(guān)聯(lián)關(guān)系也可以成為購物車分析,耳熟能詳?shù)奈譅柆斈虿寂c啤酒的案例就是關(guān)聯(lián)關(guān)系的最佳實踐,通過分析不用商品或不同行為之間的關(guān)系,發(fā)現(xiàn)用戶的習慣。

3、分類、分層

通過用戶特征、用戶行為對用戶進行分類分層,形成精細化運營、精準化業(yè)務(wù)推薦,進一步提升運營效率和轉(zhuǎn)化率。

4、預測

通過用戶歷史行為預測用戶未來可能的行為,提升用戶感知和使用體驗。

五、輸出

在前面層提到,數(shù)據(jù)分析的目的是通過數(shù)據(jù)清晰的了解用戶、產(chǎn)品和當前業(yè)務(wù)形態(tài),從而得到有效的戰(zhàn)略決策指導下一步的發(fā)展。

如何通過數(shù)據(jù)清晰了解用戶、產(chǎn)品和業(yè)務(wù)生態(tài)?一行行枯燥的數(shù)字是無法讓業(yè)務(wù)部門或外部客戶直觀了解數(shù)據(jù)背后的含義的,所以需要通過數(shù)據(jù)可視化的方法,簡單來說就是將一行行的數(shù)據(jù)轉(zhuǎn)化為圖表,直觀化展現(xiàn)數(shù)據(jù)的趨勢、數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系等等。在對數(shù)據(jù)可視化時,需要著重考慮數(shù)據(jù)有幾個維度、數(shù)據(jù)要向看的人展現(xiàn)什么,這些都影響著數(shù)據(jù)可視化的形式。

如針對注冊用戶男女性別比例的展現(xiàn)可以用餅狀圖,展現(xiàn)注冊用戶數(shù)隨時間變化的增長趨勢可以用曲線圖,展現(xiàn)注冊用戶歸屬地可以通過柱狀圖或地圖等等。在選擇可視化方式時,要充分考慮數(shù)據(jù)的特點以及希望用圖表展現(xiàn)出來的內(nèi)涵是什么,這樣才能用合理的方式展現(xiàn)出更直觀的分析結(jié)果。

此外,數(shù)據(jù)分析的輸出通常以數(shù)據(jù)分析報告的形式展現(xiàn),數(shù)據(jù)分析報告的主要結(jié)構(gòu)如下:

  1. 數(shù)據(jù)分析背景
  2. 數(shù)據(jù)來源及數(shù)據(jù)說明
  3. 數(shù)據(jù)分析方法
  4. 數(shù)據(jù)可視化
  5. 數(shù)據(jù)決策

以上是一份較為正式的數(shù)據(jù)分析報告的大體框架,如果針對日報一類并不要求正式性的數(shù)據(jù)分析結(jié)果展現(xiàn),則可以具體問題具體分析。

六、總結(jié)

數(shù)據(jù)分析方法論一定是為指導具體工作實踐而服務(wù)的,所以僅僅掌握方法論并不夠,還要通過實踐不斷完善優(yōu)化方法。只有當你真正去做數(shù)據(jù)分析這件事時,才能發(fā)現(xiàn)自己的不足,說再多不如直接去做。

#專欄作家#

記小憶,人人都是產(chǎn)品經(jīng)理專欄作者,野蠻生長的產(chǎn)品經(jīng)理,擅長從0-1搭建產(chǎn)品經(jīng)理知識體系。公眾號:PM龍門陣。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Pixabay,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 會統(tǒng)計不會分析?滴滴策略運營經(jīng)理帶你快速入門,15天掌握一套數(shù)據(jù)分析流程和方法!戳我報名>>http://996.pm/YNG4e

    來自廣東 回復
  2. 簡直水中之神,你的文章真的是用心寫的嗎?

    來自北京 回復
  3. 沒明白 數(shù)據(jù)口徑是啥意思??!

    回復
    1. 我的理解就是標準,比如定義活躍用戶,可以定義為每天登錄的用戶,也可以定義為每天登錄一小時以上的用戶,根據(jù)不同產(chǎn)品或背景,這個定義不同,也就是數(shù)據(jù)口徑不同。

      回復
  4. 沒有實例,說的都是書上那種概念的東西

    來自北京 回復
  5. 太泛了!

    來自福建 回復
  6. “耳熟能詳?shù)奈譅柆斈虿寂c啤酒的案例就是關(guān)聯(lián)關(guān)系的最佳實踐”這個案例真實性有待考究,說是最佳實踐就不嚴謹了,現(xiàn)在有很多是把啤酒和尿布放在一起賣的么?

    來自四川 回復
  7. 比較表面,不深入,沒有什么細節(jié)

    來自廣東 回復
  8. 太籠統(tǒng)了

    回復