數(shù)據(jù)產品指北(五):大數(shù)據(jù)分析平臺

2 評論 10883 瀏覽 98 收藏 19 分鐘

搭建大數(shù)據(jù)分析平臺的工作是循序漸進的,不同公司要根據(jù)自身所處階段選擇合適的平臺形態(tài),沒有必要過分追求平臺的分析深度和服務屬性,關鍵是能解決當下的問題。

如果說用戶行為分析平臺是互聯(lián)網行業(yè)等線上業(yè)務特有的數(shù)據(jù)分析產品,那么大數(shù)據(jù)分析平臺就是適用于全行業(yè)的數(shù)據(jù)分析產品。任何行業(yè)的公司發(fā)展和精進都離不開數(shù)據(jù)分析,而大數(shù)據(jù)分析平臺就是實現(xiàn)數(shù)據(jù)分析,為業(yè)務人員提供分析能力的基礎產品。如果沒有該數(shù)據(jù)分析平臺,企業(yè)則不得不招聘專業(yè)的數(shù)據(jù)分析師完成全部的數(shù)據(jù)分析工作。

一方面數(shù)據(jù)分析師的招聘門檻更高,一方面數(shù)據(jù)分析師對實際業(yè)務的了解程度也并不如運營、市場等業(yè)務方人員。

所以更合理的做法是為業(yè)務人員提供易用的數(shù)據(jù)分析產品,配合特定的數(shù)據(jù)分析培訓,以使業(yè)務同事可自行完成絕大部分數(shù)據(jù)分析需求。同時輔以數(shù)名數(shù)據(jù)分析師完成更專業(yè)的數(shù)據(jù)分析任務,產出數(shù)據(jù)報告或決策等關鍵信息。

大數(shù)據(jù)分析平臺是對大數(shù)據(jù)時代的數(shù)據(jù)分析產品(或稱作模塊)的泛稱,諸如業(yè)務報表、OLAP應用、BI工具等都屬于大數(shù)據(jù)分析平臺的范疇。與用戶行為分析平臺相比,其分析維度更集中在核心業(yè)務數(shù)據(jù),特別是對于一些非純線上業(yè)務的領域,例如線上電商、線下零售、物流、金融等行業(yè)。而用戶行為分析平臺會更集中分析與用戶及用戶行為相關的數(shù)據(jù)。

企業(yè)目前實現(xiàn)大數(shù)據(jù)分析平臺的方法主要有三種:

(1)采購第三方相關數(shù)據(jù)產品

例如Tableau、Growing IO、神策等。此類產品能幫助企業(yè)迅速搭建數(shù)據(jù)分析環(huán)境,不少第三方廠商還會提供專業(yè)的技術支持團隊。但選擇此方法,在統(tǒng)計數(shù)據(jù)的廣度、深度和準確性上可能都有所局限。例如某些主打無埋點技術的產品,只能統(tǒng)計到頁面上的一些通用數(shù)據(jù)。

隨著企業(yè)數(shù)據(jù)化運營程度的加深,這類產品可能會力不從心。該方案適合缺少研發(fā)資源、數(shù)據(jù)運營初中期的企業(yè)。一般一些創(chuàng)業(yè)公司、小微企業(yè)可能會選擇此方案。

(2)利用開源產品搭建大數(shù)據(jù)分析平臺

筆者曾經待過的一家公司就是采用該方案搭建的OLAP應用。對于有一定開發(fā)能力的團隊,可以采用該方式快速且低成本地搭建起可用的大數(shù)據(jù)分析平臺。該方案的關鍵是對開源產品的選擇,選擇正確的框架,在后續(xù)的擴展過程中會逐步體現(xiàn)出優(yōu)勢。而如果需要根據(jù)業(yè)務做一些自定義的開發(fā),最后還是繞不過對源碼的修改。

(3)完全自建大數(shù)據(jù)分析平臺

對于中大型公司,在具備足夠研發(fā)實力的情況下,通常還是會自己開發(fā)相關的數(shù)據(jù)產品。自建平臺的優(yōu)勢是不言而喻的,企業(yè)可以完全根據(jù)自身業(yè)務需要定制開發(fā),能夠對業(yè)務需求進行最大化的滿足。

對于平臺型業(yè)務,開發(fā)此類產品也可以進行對外的商業(yè)化,為平臺上的B端客戶服務。例如淘寶官方推出的生意參謀就是這樣一款成熟的商用數(shù)據(jù)分析產品,且與淘寶業(yè)務和平臺優(yōu)勢有非常強的結合。

接下來,本篇將重點介紹幾種不同階段的大數(shù)據(jù)分析平臺產品形態(tài)。

報表分析平臺

提到數(shù)據(jù)分析,很多人的第一反應應該都是報表。確實報表應該就是最基礎的數(shù)據(jù)分析工具,因此不少公司在搭建數(shù)據(jù)分析平臺時,也是先從滿足報表需求起步的。

在平臺搭建初期,優(yōu)先實現(xiàn)重要的固化報表沒有任何問題,但隨著業(yè)務的發(fā)展,對數(shù)據(jù)分析的需求會成倍增加,不可能一直靠業(yè)務新增查詢需求,數(shù)據(jù)團隊對前后端進行開發(fā)改動這種低效的方式來實現(xiàn)。

因此我們可以在報表平臺上開發(fā)一套擴展工具,用于完成對取數(shù)需求的條件配置。本質上是將日常業(yè)務查詢的SQL語句進行了產品化,并羅列了可支持的數(shù)據(jù)指標、維度、時間等信息。

至此,報表平臺便擁有了直接新增報表的功能,業(yè)務人員可根據(jù)自身需求在平臺上配置所需的報表,而不用每次由研發(fā)團隊單獨開發(fā)。例如下圖是生意參謀中的新建報表功能,商家可以通過一系列的條件選擇完成報表的配置。

數(shù)據(jù)產品指北(五)— 大數(shù)據(jù)分析平臺

生意參謀-新建報表

除去簡單的報表生成,我們還可以擴展圖表模塊,對報表進行可視化??梢赃x擇常見的圖表樣式,例如折線圖、柱狀圖、餅圖等。

不過受限于產品形態(tài),所有的配置操作都是在既定的框架下完成的,研發(fā)人員需要事先在頁面上規(guī)定可選的維度、時間周期、指標的信息。若遇到對當前頁面還不支持的指標或維度的分析需求(在實際使用時會經常發(fā)生),仍需要進行開發(fā),升級平臺。為了滿足更定制化的查詢需求,該平臺也可以做到支持書寫SQL完成查詢。

某種程度上來看,其實該階段的分析平臺對業(yè)務人員還不夠友好,可能更多時候是數(shù)據(jù)產品經理和數(shù)據(jù)分析師在進行使用,以滿足自身分析需求或承接業(yè)務的數(shù)據(jù)需求。為了真正讓業(yè)務人員直接具備查詢、分析數(shù)據(jù)的能力,我們需要進入下一個階段。

自助分析平臺

如果說擴展后的報表平臺能很大程度的釋放研發(fā)生產力的話,搭建自助分析平臺將可以解放數(shù)據(jù)分析師的大量工作。自助分析平臺已經基本能滿足業(yè)務人員的全部數(shù)據(jù)查詢和分析需求了。當然,在平臺上線后還是需要組織適當?shù)呐嘤?,提供友好的產品說明文檔。

自助分析平臺是進一步將我們的數(shù)據(jù)查詢、分析語言產品化。與報表平臺相比,自助分析平臺至少有了以下進步:

  1. 可以選擇數(shù)據(jù)源,可以在權限允許范圍內訪問數(shù)據(jù)源內全量的數(shù)據(jù),并讀取數(shù)據(jù)源的數(shù)據(jù)結構,用于后續(xù)的查詢配置。例如定位到具體的數(shù)據(jù)倉庫。
  2. 可以自由選擇數(shù)據(jù)指標和維度,構建Cube。即可以自由地選擇不同主題下的維度,作為表格的行和列。行和列都支持維度的嵌套,構建層次化的索引。
  3. 支持豐富的指標計算方式。與用戶行為分析平臺類似,自助分析平臺也支持通過表達式對基礎指標進行計算,構建新的指標。在輸出結果時,也可以制定對指標的聚合方式,包括求和(SUM)、求平均(AVG)、累計求和(CUMSUM)、計數(shù)(COUNT)、求最大值(MAX)、求最小值(MIN)等常見的計算方式。
  4. 支持豐富的條件篩選。包括了最常用的時間段篩選,以及可在各個維度下通過一系列關鍵字組合設置篩選條件,例如大于(>)、等于(=)、小于(<)、不等于(!=)、在或不在某列表內(IN/NOT IN),在或不在某范圍內(BETWEEN…AND…/NOT BETWEEN…AND…)。
  5. 可根據(jù)業(yè)務需求開發(fā)其他針對表達格式的配置選項,例如可配置數(shù)據(jù)的表達形式是整數(shù)、小數(shù)(及位數(shù))、百分數(shù)等。

下圖是筆者過去搭建的某自主分析平臺產品的簡易原型。

數(shù)據(jù)產品指北(五)— 大數(shù)據(jù)分析平臺

新建查詢

在完成查詢條件的篩選后,會構建出如下表格。同一維度下的查詢字段會構建層次化索引,不同維度下的查詢字段會類似concat連接在一起。

數(shù)據(jù)產品指北(五)— 大數(shù)據(jù)分析平臺

查詢結果

自助分析平臺的另一個優(yōu)勢是可直接根據(jù)數(shù)據(jù)生成各式的圖表,典型的折線圖、柱狀圖、堆積面積圖、直方圖、餅圖、散點圖等,以及根據(jù)業(yè)務需求可以支持漏斗圖或基于GIS信息的圖表等。

在線智能分析平臺

自助分析平臺雖然功能強大,但其本質上仍是構建數(shù)據(jù)表格的工具。業(yè)務人員更自然的使用方式是利用平臺構建表格并導出,之后在Excel進行分析和圖表的制作,這其實違背了我們希望平臺本身能解決數(shù)據(jù)分析問題的初衷。這一方面是因為用戶的習慣很難改變,另一方面也是平臺構建表格的屬性引導了用戶。

若要通過平臺直接完成數(shù)據(jù)分析,這就要求平臺不能只是構建表格這么簡單。我們需要重點優(yōu)化平臺的數(shù)據(jù)表達和交互功能,以體現(xiàn)出平臺的分析屬性。這個階段可以稱為在線智能分析平臺。這里的關鍵詞有兩個:“在線”和“智能”。

其進步表現(xiàn)在可以直接在構建完的數(shù)據(jù)之上進行交互,產生更多的數(shù)據(jù)洞察。類似于我們在python中直接通過matplot或seaborn進行可視化,和利用bokeh進行數(shù)據(jù)表達的區(qū)別。雖然seaborn已經可以做出優(yōu)秀的可視化報告,但其表達形式主要還是靜態(tài)圖表,更多時候是展現(xiàn)在分析報告中。而bokeh構建的圖表支持一系列的交互操作,不同使用人員可根據(jù)自身需求在圖表上完成分析。

最典型的區(qū)別,有以下幾點:

(1)支持圖表的基本交互操作

包括了對區(qū)域的圈選高亮、全局或針對單一坐標軸的放大縮小、鼠標懸停時的詳細數(shù)據(jù)展示等常用操作。

(2)支持數(shù)據(jù)的下鉆

選中具體數(shù)據(jù)后,可根據(jù)所支持的維度進行數(shù)據(jù)下鉆。例如我們發(fā)現(xiàn)某天的GMV下降明顯,選中當天數(shù)據(jù)后可以根據(jù)GMV在業(yè)務上定義的構成指標(訂單量、客單價等)或其他查詢維度(門店/類目等)進行下鉆以定位具體問題??赡茏罱K會發(fā)現(xiàn)是某家重點門店當天經營異常而導致了整體GMV的下降。

(3)支持數(shù)據(jù)間的聯(lián)動

根據(jù)分析需求,我們可能需要同時分析有關聯(lián)關系的數(shù)據(jù),洞察數(shù)據(jù)間的關系或影響。其核心是以某一字段作為關聯(lián)圖表或表格的關聯(lián)字段,建立多份數(shù)據(jù)間的聯(lián)系。這樣在同一個工作區(qū)內,對其中任意一份數(shù)據(jù)進行圈選、拖拽等操作,在其他的數(shù)據(jù)中也會同步展示。

例如A表是SKU信息表,B表是訂單詳情表,C表是商品銷量的圖表,商品運營同事在分析具體SKU銷售情況時,會在A表中選中具體的SKU,在B表中為自動選出包含該SKU的訂單,在C表中會自動選出該SKU的銷量情況。

在這些功能的支撐下,我們便可以直接在平臺上在線完成大部分數(shù)據(jù)分析的工作,而不用導出數(shù)據(jù)后在其他工具中進行分析。

根據(jù)數(shù)據(jù)分析的方法和目的,我們可以簡單的劃分為三類:描述性分析、預測性分析和規(guī)范性分析。

描述性分析給出的數(shù)據(jù)表現(xiàn)的客觀事實;預測性分析會基于過去的數(shù)據(jù)預測未來表現(xiàn)和可能性;規(guī)范性分析會通過分析提供指導和建議,就像醫(yī)生會對我們的體檢報告標注出異常并給出建議。

而在線智能分析平臺的“智能”也可以體現(xiàn)在對數(shù)據(jù)的診斷解讀上。一方面業(yè)務人員的數(shù)據(jù)分析水平可能參差不齊,無法要求所有人都有專業(yè)的分析能力,另一方面我們查看數(shù)據(jù)的主要目的也是想洞察數(shù)據(jù)背后的結論,而不是數(shù)據(jù)本身。因此平臺如果可以針對數(shù)據(jù)表現(xiàn)直接給出解讀,將大大提升平臺的服務屬性。

平臺可以對核心指標的異常范圍進行定義,比如可利用3σ原則,即對于服從正態(tài)分布的數(shù)據(jù),具體數(shù)值與整體平均值的差值大于3倍標準差時,可認定為異常值。也可以與業(yè)務進行溝通,定義數(shù)據(jù)的異常波動范圍。

針對不同的異常情況,可以提示不同的話術,并匹配建議方案。例如下圖是筆者過去負責的某款數(shù)據(jù)產品中,對具體指標給出的診斷解讀。對于不具備分析能力或時間寶貴的同學,直接概覽此模塊,就能對當前的經營情況有個大致了解。

數(shù)據(jù)產品指北(五)— 大數(shù)據(jù)分析平臺

數(shù)據(jù)診斷解讀

數(shù)據(jù)分析自動化

對大數(shù)據(jù)分析平臺用戶的需求進行深挖,我們會發(fā)現(xiàn)不同用戶群所關注的數(shù)據(jù)也會有所不同,而同一用戶往往會持續(xù)關注同一批數(shù)據(jù)。再想想,我們的運營人員、數(shù)據(jù)分析師等角色是不是每周或每月都會發(fā)送相關數(shù)據(jù)的周報或月報?

可以認為,每個人在查看數(shù)據(jù)的時候,是在閱讀一份數(shù)據(jù)報告。

因此,平臺若能定周期產出符合目標用戶數(shù)據(jù)需求的,既有數(shù)據(jù),又有洞察,帶有指導意義,且閱讀友好的數(shù)據(jù)報告,將能進一步提升平臺自身的價值。

為了讓平臺可以自動生成報告,我們需要結合平臺之前的所有能力。用戶可以在平臺上配置適合自己及其他閱讀受眾的報告模板(組合相關的數(shù)據(jù)圖表及設置樣式),定義關鍵指標的解讀方法(定義數(shù)據(jù)波動區(qū)間及對應話術)。由系統(tǒng)給出解釋原因或預留備注空間由人工解釋。根據(jù)業(yè)務需要,配置報告的生成周期、發(fā)送對象、發(fā)送方式等信息。如下圖數(shù)據(jù)產品,每周會產出運營數(shù)據(jù)簡報。

數(shù)據(jù)運營簡報

對于不同的用戶,還可以查看細分欄目的周報,例如下圖是客戶維度的周報。

客戶數(shù)據(jù)運營周報

隨著數(shù)據(jù)驅動的意識越來越被重視,且大量傳統(tǒng)行業(yè)開始數(shù)字化轉型,大數(shù)據(jù)分析平臺在企業(yè)中扮演的角色會越來越重要。

目前看到的情況是,大家對于大數(shù)據(jù)分析平臺的產品形態(tài)和發(fā)展趨勢的判斷基本是一致的。平臺最初用于解決基礎的數(shù)據(jù)查詢和分析需求,之后會逐步解放人力提升人效,最后我們都希望能由數(shù)據(jù)和機器直接生成決策。

當然,搭建大數(shù)據(jù)分析平臺的工作是循序漸進的,不同公司要根據(jù)自身所處階段選擇合適的平臺形態(tài),沒有必要過分追求平臺的分析深度和服務屬性,關鍵是能解決當下的問題。

大數(shù)據(jù)分析平臺篇到此結束。

 

作者:Rowan;公眾號:羅老師別這樣

本文由 @Rowan 原創(chuàng)發(fā)布于人人都是產品經理,未經許可,禁止轉載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 謝謝作者。仔細看完后,對大數(shù)據(jù)分析平臺了解深入了很多

    回復
  2. 大家期待已久的《數(shù)據(jù)產品經理實戰(zhàn)訓練營》終于在起點學院(人人都是產品經理旗下教育機構)上線啦!
    本課程非常適合新手數(shù)據(jù)產品經理,或者想要轉崗的產品經理、數(shù)據(jù)分析師、研發(fā)、產品運營等人群。
    課程會從基礎概念,到核心技能,再通過典型數(shù)據(jù)分析平臺的實戰(zhàn),幫助大家構建完整的知識體系,掌握數(shù)據(jù)產品經理的基本功。
    學完后你會掌握怎么建指標體系、指標字典,如何設計數(shù)據(jù)埋點、保證數(shù)據(jù)質量,規(guī)劃大數(shù)據(jù)分析平臺等實際工作技能~
    現(xiàn)在就添加空空老師(微信id:anne012520),咨詢課程詳情并領取福利優(yōu)惠吧!

    來自廣東 回復