以互聯(lián)網(wǎng)行業(yè)為背景下的數(shù)據(jù)分析通識(中)

0 評論 4224 瀏覽 16 收藏 21 分鐘

導語:上一期我們從互聯(lián)網(wǎng)行業(yè)特性、互聯(lián)網(wǎng)行業(yè)常見的數(shù)據(jù)指標、數(shù)據(jù)分析概述等幾個方面了解一下基于互聯(lián)網(wǎng)行業(yè)背景下的數(shù)據(jù)分析一些基本的概念(以互聯(lián)網(wǎng)行業(yè)為背景下的數(shù)據(jù)分析通識(上))。本期繼續(xù)將從數(shù)據(jù)分析入門、數(shù)據(jù)分析基本流程兩個方面來進行梳理!

四、數(shù)據(jù)分析入門

我們不要局限于入門專職數(shù)據(jù)分析的崗位,而是從廣義“數(shù)據(jù)分析”的角度,來理解一下如何入門數(shù)據(jù)分析。不存在質(zhì)疑自己合不合適做數(shù)據(jù)分析、糾結(jié)零基礎(chǔ)入門難、文科生是不是很難入門等疑問,主要讓大家了解“數(shù)據(jù)分析”如何入門。

但如果你想入行數(shù)據(jù)分析,就需要好好思考一些問題:我希望進入哪些數(shù)據(jù)分析的崗位呢?這職位有前景嗎?自己的性格適不適合做數(shù)據(jù)分析?符合自己未來的職業(yè)定位么?入行后需要什么樣的知識結(jié)構(gòu)?等問題了。

因此,從什么樣的人適合從事數(shù)據(jù)分析、有哪些入門的書可以推薦、有哪些入門數(shù)據(jù)分析工具推薦、其他建議幾個方面,來梳理“數(shù)據(jù)分析”如何入門。

【原創(chuàng)】互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)分析通識(中)

1. 什么樣的人適合從事數(shù)據(jù)分析?

1)首先:從性格、興趣、愛好等方面來看

要有一定的好奇心和不斷探索未知的性格,并有興趣去知道數(shù)據(jù)背后的邏輯,當面對分析需求、寫sql代碼、整理海量數(shù)據(jù)等繁瑣枯燥的工作,能克服枯燥的感覺并嚴謹?shù)耐瓿蛇@些工作,同時更要求有與人溝通以及合作的協(xié)調(diào)的能力,因為做數(shù)據(jù)分析需要與業(yè)務(wù)部門、研發(fā)部門等頻繁溝通和合作、明確需求以及推動執(zhí)行的。這些工作,是你喜歡的、擅長的嗎?

2)其次:從學習、思考的能力方面來看

如何根據(jù)數(shù)據(jù),來推演、分析、提出解決方案,需要你常常腦洞大開,并且數(shù)據(jù)分析是需要不斷持續(xù)保持學習狀態(tài)的。因為數(shù)據(jù)分析的結(jié)論,有時候會和我們的直覺背道而馳,這就需要不斷的通過思考以及學習,完善自己的知識體系。

3)再者:從工具使用的熟練程度來看

我們分析數(shù)據(jù), 就需要有數(shù)據(jù)源,然后處理數(shù)據(jù)。也就是說數(shù)據(jù)查詢和處理的能力是做數(shù)據(jù)分析基本的內(nèi)功。在數(shù)據(jù)處理上,就涉及到了大大小小各種各樣的工具,所以就需要掌握這些工具的使用,如Excel、SQL、Tableau、Pyhon等工具。

4)最后:從心態(tài)上想想自己是否具有開放性、可容錯性以及堅持不懈的毅力

數(shù)據(jù)分析的圈子里面,都非常開放。數(shù)據(jù)也好,還是數(shù)據(jù)指標也好,其本身并不是完美的,也會出錯,所以我們必須擁有開放的心態(tài)以及堅持不懈的精神,所以,才能使我們不斷的從數(shù)據(jù)中探索,尋求答案。

【原創(chuàng)】互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)分析通識(中)

小結(jié):總之,對于一些缺點和不足,可以考慮改進,使之不再成為短板,比如學習數(shù)據(jù)分析的基本原理、技術(shù)、工具,但是興趣、性格、心態(tài)的方面呢?或者會成為你放棄不擅長的職業(yè)的原因。

2. 有哪些入門的書可以推薦?

對于數(shù)據(jù)分析入門,我們先要有數(shù)據(jù)分析的基本數(shù)學概念,初級數(shù)據(jù)思維,初級數(shù)據(jù)工具技能。因此,推薦的入門書籍如下:

  • 基本數(shù)學概念推薦書籍:《深入淺出數(shù)據(jù)分析》《深入淺出統(tǒng)計學》等——了解基本的統(tǒng)計知識,鍛煉扎實統(tǒng)計基礎(chǔ)。
  • 初級數(shù)據(jù)思維:《精益數(shù)據(jù)分析》 《數(shù)據(jù)思維:從數(shù)據(jù)分析到商業(yè)價值》等——了解分析方法、案例、鍛煉數(shù)據(jù)思維。
  • 初級數(shù)據(jù)工具技能:《誰說菜鳥不會數(shù)據(jù)分析:入門篇》《誰說菜鳥不會數(shù)據(jù)分析(工具篇)》等——了解基本知識,掌握基本的工具。

【原創(chuàng)】互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)分析通識(中)

小結(jié):總之,數(shù)據(jù)分析需要具備多方面的理論基礎(chǔ),比如

  • 基本的數(shù)據(jù)分析知識:統(tǒng)計、概率論、數(shù)據(jù)挖掘基礎(chǔ)理論等;
  • 基本的商業(yè)意識:營銷理論、戰(zhàn)略規(guī)劃等;
  • 數(shù)據(jù)處理知識:數(shù)據(jù)庫、數(shù)據(jù)結(jié)構(gòu)等。

但是對于小白而言,這實在是信息量太大了,所以在入門的階段,以上推薦書籍,基本上能清晰地讓我們剛?cè)腴T的朋友們知道數(shù)據(jù)分析能解決什么問題、需要什么方法論、需要掌握什么基本技術(shù)及原理等這些就足夠。懂得常規(guī)知識并能找到基礎(chǔ)的工作是入門階段的目標。

3. 有哪些入門數(shù)據(jù)分析工具推薦?

在工具方面,推薦從Excel+SQL這2個來作為入門的數(shù)據(jù)分析工具。剩下的一些工具根據(jù)自身能力去學習,都可以自學 ,但等有SQL基礎(chǔ)后再學Python等復雜的工具會相對容易些。

1)Excel:最基礎(chǔ)的底層能力, 當然也是必備的

在實際工作中Excel的使用頻率非常高,因為Excel函數(shù)、透視表可解決大部分問題,并能夠把存儲、分析、數(shù)據(jù)可視化很好的結(jié)合在一起。而且Excel的熟練程度,也會極大提升數(shù)據(jù)分析過程中的效率,讓分析更加的強大。還有一個很重要的原因就是Excel的受眾廣。

特別是可以把分析結(jié)果展示給業(yè)務(wù)部門,或者與業(yè)務(wù)部門對接的時候,會節(jié)省大量的時間成本。但Excel功能太多,對于剛?cè)腴T數(shù)據(jù)分析的也不可能掌握所有的功能,可以則需而取。主要掌握常見的功能和函數(shù)基本上就可以覆蓋大部分的應用場景了,比如:

  • 基礎(chǔ)功能: 列排序、篩選、去重、求和、求平均;
  • 高級功能: 透視表行列值匯總、占比匯總、過濾、排序 (主要是可視化圖表);
  • 數(shù)值函數(shù):ABSCEILFLOOR···
  • 邏輯函數(shù): IFIFERROR ···
  • 字符函數(shù): LEFTRIGHTCONCATENATEVALUE ···
  • 時間函數(shù): YEARMONTHDAYDATE ···
  • 高級函數(shù): VLOOKUP···

(后面我們有專門Excel講解,這里就 不一一展開了)

2)SQL:一門專門為數(shù)據(jù)查詢所設(shè)計的編程語言,也是所有數(shù)據(jù)分析師們都必須掌握的基礎(chǔ)要求

因為當小規(guī)模的數(shù)據(jù)處理、分析、展示Excel都可以搞定,但對于大規(guī)模的數(shù)據(jù)處理而言,Sql是必備的取數(shù)手段,在數(shù)據(jù)獲取和數(shù)據(jù)清洗環(huán)節(jié)都會用到SQL,要看哪些數(shù)據(jù)需要處理,然后導出數(shù)據(jù)。

對于剛?cè)腴T數(shù)據(jù)分析來講,可以先從幾個核心語句入手學習SQL:

  • 檢索數(shù)據(jù):SELECT FROM
  • 篩選數(shù)據(jù):WHERE / HAVING
  • 數(shù)據(jù)分組:GROUP BY
  • 匯總函數(shù):聚合函數(shù)
  • 數(shù)據(jù)排序:ORDER BY
  • 數(shù)據(jù)選取:LIMIT

掌握以上語句和一些基礎(chǔ)函數(shù)后,在實際應用中可以滿足我們80%左右的查詢需求。而關(guān)于增刪改語句,我們可以進行了解,在應用中我們基本不會接觸到修改數(shù)據(jù)庫的權(quán)限。推薦《SQL必知必會》這本書可以熟悉基礎(chǔ)用法。如果為了應聘,可以去牛客網(wǎng)找一些真題練手,學習SQL主要還是以練題為主(后面我們有專門SQL講解,這里就不展開了)。

【原創(chuàng)】互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)分析通識(中)

小結(jié):總之,“工欲善其事,必先利其器” ,一件稱手的工具能讓我們事半功倍。對于數(shù)據(jù)分析人員來說,數(shù)據(jù)分析基本流程中的數(shù)據(jù)獲取、數(shù)據(jù)清洗、數(shù)據(jù)可視化分析的部分,最常用的組合是 SQL + Excel + PPT/可視化(入門級的Excel 就可以做可視化,還有一些Power BI、Tableau等可視化軟件這里就不展開了)。

4. 其他建議

對于入門數(shù)據(jù)分析主要建議還是主要把精力放在數(shù)據(jù)分析的思維以及方法論的熟悉與訓練上。

比如:

  • 平時可以多去看一些商業(yè)數(shù)據(jù)模型、數(shù)據(jù)分析案例;
  • 關(guān)注一下數(shù)據(jù)類的公眾號(比如我的公眾號木木自由(專注數(shù)據(jù)領(lǐng)域干貨、經(jīng)驗、實戰(zhàn)、課程分享),哈哈,但公眾號的文章類目可能比較雜,建議看完要自己歸類整理吸收,必須形成自己的數(shù)據(jù)體系);
  • 加入一些數(shù)據(jù)分析的專業(yè)社群也是一個不錯的入門法子;
  • 網(wǎng)上很多數(shù)據(jù)分析的資料(人人都是產(chǎn)品經(jīng)理等那些優(yōu)質(zhì)網(wǎng)站),最后逐步的一點一點的形成自己的分析思路。

【原創(chuàng)】互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)分析通識(中)

小結(jié):總之,數(shù)據(jù)分析入門并不難,入門之后的知識積累才是重點,如何在實際工作、項目中真正發(fā)揮數(shù)據(jù)分析的作用,產(chǎn)生價值。并且優(yōu)秀的數(shù)據(jù)分析人員一定是主動發(fā)現(xiàn)問題、解決問題并扛得住壓力的。只要明確了方向,那么剩下的就是堅持了!

五、數(shù)據(jù)分析基本流程

數(shù)據(jù)分析基本流程一般是這樣的:

【原創(chuàng)】互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)分析通識(中)

1. 數(shù)據(jù)理解

數(shù)據(jù)理解,即明確數(shù)據(jù)分析的目的以及問題。

因為,我們做任何事情都要有明確目的,數(shù)據(jù)分析更是如此,需要把問題以及目標定義清楚。在做分析之前,我們可以要明確幾個問題:

  • 理解分析的需求目標:我們?yōu)槭裁匆鰯?shù)據(jù)分析?分析什么?想要達到什么樣的效果;
  • 理解受眾用戶和業(yè)務(wù):想通過分析達到一個什么樣目的?是提升相關(guān)業(yè)務(wù)指標還是發(fā)現(xiàn)問題?只有明確目的才能制定合理的數(shù)據(jù)分析思路;
  • 明確需求數(shù)據(jù)來源:即數(shù)據(jù)如何產(chǎn)生的,分析怎樣的場景,比如app用戶從下載到成為會員的用戶路徑,從而制作漏斗模型,優(yōu)化付費成為會員環(huán)境,提高付費量,這就是場景。要根據(jù)場景去定義問題,梳理數(shù)據(jù)分析思路,選擇數(shù)據(jù)分析的方法;
  • 明確分析業(yè)務(wù)問題優(yōu)先級:通過對問題進行重要性及緊急性排序,針對行的分析較為重要的問題。

2. 數(shù)據(jù)收集

數(shù)據(jù)是一切分析的基礎(chǔ),一般情況下,每個公司都有自己的一些服務(wù)器和數(shù)據(jù)庫或者運營后臺。而數(shù)據(jù)收集的程度和準確性往往就決定了數(shù)據(jù)分析結(jié)果的可靠性和有效性。

3. 數(shù)據(jù)清洗

收集好以后,我們需要對數(shù)據(jù)去做一些清洗。因為很多數(shù)據(jù)有問題,不準確的數(shù)據(jù)分析出的結(jié)果毫無價值意義。比如 數(shù)據(jù)殘缺(空數(shù)據(jù))、數(shù)據(jù)錯誤、數(shù)據(jù)重復、數(shù)據(jù)異常等問題,我們都需要對這些數(shù)據(jù)進行清洗。

4. 數(shù)據(jù)分析

在數(shù)據(jù)進行簡單的清洗后,我們就需要去做一些數(shù)據(jù)分析了。

即通過一系列的數(shù)據(jù)分析方法從數(shù)據(jù)得到可以回答需求的答案,根據(jù)分析需求以及目的,圍繞是多少、是什么、為什么、會怎樣、又如何來展開,通過進行描述性分析、診斷、用戶分類/分層、預測等分析方法,對數(shù)據(jù)進行分析。

1)是多少、是什么:描述性分析,評估業(yè)務(wù)現(xiàn)狀

描述性分析主要是將基礎(chǔ)數(shù)據(jù)進行匯總,并轉(zhuǎn)化為便于理解的形式,清晰地展示目前的業(yè)務(wù)是怎么樣的,例如各種周月報表、圖表等。通過描述性分析可以快速評估業(yè)務(wù)特征,以及找到分析的方向。通過觀察數(shù)據(jù)的分布情況、 業(yè)務(wù)指標的波動情況,從中找到出現(xiàn)異常的數(shù)據(jù),并分析出異?,F(xiàn)象的原因。

2)為什么:相關(guān)性分析,找到關(guān)鍵因素,進行指標拆解

基于描述分析進行問題的深入挖掘,尋找業(yè)務(wù)變化的原因,通過相關(guān)性分析,找到關(guān)鍵因素,進行指標拆解,分析問題是如何發(fā)生的,我們就可以從哪些方面去解決問題。

例如:發(fā)現(xiàn)本月整體的GMV(成交總額)減少,我們該如何發(fā)現(xiàn)原因?

首先,可以通過計算各個級別門店GMV變化與整體GMV變化的相關(guān)系數(shù),確定那個類別的門店GMV對整體GMV影響最大(這里不展開具體分析,簡單了解一下場景)。

其次,拆解GMV業(yè)務(wù)指標:GMV =顧客總數(shù)*成交轉(zhuǎn)化率 * 平均客單價= 門店數(shù)量 * 店均人數(shù) * 人效,當GMV發(fā)生變化時,我們可以通過分析門店數(shù)據(jù)、平均客單價、成交轉(zhuǎn)化率、門店人效等子指標的變化來確定原因。

再者,指標維度下鉆,GMV = A店GMV + B店GMV +C店GMV ,通過逐步細化指標維度,實現(xiàn)原因判斷。常用的維度下鉆有日期、地理等維度。

最后,挖掘并總結(jié)各種事物的相關(guān)性,進而,對于制定精準營銷策略具有指導意義。

3)會怎樣:預測

預測未來可能發(fā)生的事情,側(cè)重于未來的走勢以及是否可以提前規(guī)避風險。實際工作中,可根據(jù)歷史數(shù)據(jù)和分析技術(shù)(如機器學習)對未來結(jié)果進行預測。

通過技術(shù)手段可以以很高的精度形成對未來的見解。但需要高深的技術(shù)知識,對于入門的朋友來說,可以通過同比,環(huán)比,對比分析,趨勢、回歸分析等,結(jié)合以往經(jīng)驗和知識,進行預測分析和判斷。

4)又如何:分群、分層

基于描述、指標拆解、預測等以上一系列操作分析 ,對業(yè)務(wù)提出可落地可執(zhí)行的措施。并進行用戶特征、用戶行為對用戶進行分群分層,實現(xiàn)精細化運營,進一步提升運營效率和轉(zhuǎn)化率。

比如,以要實現(xiàn)GMV的穩(wěn)定增長為例,通過數(shù)據(jù)分析描述現(xiàn)狀、發(fā)現(xiàn)原因、指標拆解、預測未來變化等操作,并結(jié)合業(yè)務(wù)狀況,和業(yè)務(wù)運營共同制定用戶分層精細化運營、增加活動力度,提升轉(zhuǎn)化率等運營策略。

總之,數(shù)據(jù)分析方法有很多,如對比分析、多維分析、轉(zhuǎn)化分析、留存分析等,這里就不一一展開了,可根據(jù)自己的業(yè)務(wù)場景,選擇合適的分析方法!

5. 數(shù)據(jù)展現(xiàn)

其實也就是數(shù)據(jù)可視化,把數(shù)據(jù)結(jié)果通過不同的表和圖形,可視化展現(xiàn)出來。

可視化是數(shù)據(jù)分析結(jié)果呈現(xiàn)的重要步驟,可視化是以圖表方式呈現(xiàn)數(shù)據(jù)分析結(jié)果,這樣的結(jié)果會更清晰、直觀,容易被理解,對于入門級別的常見的數(shù)據(jù)可視化工具可以是excel。

6. 數(shù)據(jù)報告

經(jīng)過上述一些列的步驟,得出了哪些結(jié)論?可以采取哪些優(yōu)化措施?這些都需要以數(shù)據(jù)報告的形式進行呈現(xiàn)?;窘Y(jié)構(gòu)如下:

  • 背景——描寫報告的業(yè)務(wù)背景,只有受眾了解了才能知道報告的價值所在;
  • 數(shù)據(jù)來源——注明數(shù)據(jù)來源,才能提高可信度;
  • 數(shù)據(jù)展示——數(shù)據(jù)文字合理的排版,才會有好的可視化效果;
  • 拋出結(jié)論——有結(jié)論的分析才有意義;
  • 提出建議——根據(jù)分析結(jié)論提出相應的建議。

7. 結(jié)果驗證

數(shù)據(jù)分析結(jié)果的應用是數(shù)據(jù)產(chǎn)生價值的直接體現(xiàn),而這個過程需要具有數(shù)據(jù)溝通能力,業(yè)務(wù)推動能力和項目工作能力。

如果得到了結(jié)果卻不知道做什么,那么這個數(shù)據(jù)分析可能就是失敗的。此時我們就需要檢查數(shù)據(jù)分析方法是不是有問題;其次,數(shù)據(jù)是否進行過加工處理?再其次,數(shù)據(jù)收集的是否可靠?這就需要具體問題,具體分析了。

【原創(chuàng)】互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)分析通識(中)

小結(jié):

以上就是一次標準又簡潔的數(shù)據(jù)分析全流程。然而,在實際的業(yè)務(wù)分析中,一般在第七步得到了驗證結(jié)果后還要回到第一步,回顧分析的目的,去與業(yè)務(wù)或者運營人員溝通,反饋結(jié)論,比如哪里有異常、原因、下一步動作等事宜,這也就使數(shù)據(jù)分析形成了“閉環(huán)”

然后相關(guān)業(yè)務(wù)人員再次提出疑問去確立新的分析目標,通過如此反復的迭代優(yōu)化及分析,可提高營銷活動有效性,提高投資回報率等數(shù)據(jù)指標……“閉環(huán)”其實就是“揚長避短”,讓數(shù)據(jù)引導動作到更有價值的地方,實現(xiàn)資源配置最大化,也就是所謂的數(shù)據(jù)驅(qū)動業(yè)務(wù)。

#專欄作家#

木兮擎天@,微信公眾號:木木自由,人人都是產(chǎn)品經(jīng)理專欄作家。多年互聯(lián)網(wǎng)數(shù)據(jù)運營經(jīng)驗,涉獵運營領(lǐng)域較廣,關(guān)注于運營、數(shù)據(jù)分析的實戰(zhàn)案例與經(jīng)驗以及方法論的總結(jié),探索運營與數(shù)據(jù)的神奇奧秘!

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!