實(shí)戰(zhàn)案例解析:如何參照阿里OneData構(gòu)建數(shù)據(jù)指標(biāo)體系?
隨著業(yè)務(wù)規(guī)模的擴(kuò)大,各類相關(guān)的數(shù)據(jù)量增大、數(shù)據(jù)指標(biāo)也越來越多,如果缺乏指標(biāo)體系就會(huì)造成難以衡量產(chǎn)品/活動(dòng)效果、難以判斷整體業(yè)務(wù)發(fā)展?fàn)顩r等問題。而本文就通過拆解阿里制定指標(biāo)的規(guī)范,來為我們建立數(shù)據(jù)指標(biāo)體系做一些參考。
在建立OneData之前,阿里數(shù)據(jù)有30000多個(gè)指標(biāo),其中,即使是同樣的命名,但定義口徑卻不一致。即使是中等規(guī)模的公司,也是如此,隨著數(shù)據(jù)量的增大,數(shù)據(jù)指標(biāo)也會(huì)越來越多,缺乏指標(biāo)體系的管理會(huì)存在各種各樣的問題。
一、指標(biāo)不規(guī)范帶來的問題
1. 在數(shù)據(jù)指標(biāo)概念=0時(shí),業(yè)務(wù)方按“我覺得”來辦事,難以衡量效果
產(chǎn)品設(shè)計(jì)、運(yùn)營(yíng)同學(xué)通常是:我覺得用戶會(huì)喜歡我們新推出的這個(gè)功能,我覺得新推的活動(dòng),活動(dòng)效果會(huì)很好…..
那領(lǐng)導(dǎo)就要問了,這個(gè)“覺得”有什么依據(jù)么?怎樣衡量用戶喜歡這個(gè)新增的功能?怎樣判斷活動(dòng)效果好,多少人參與或是多少轉(zhuǎn)化?
這樣一提問,其實(shí)設(shè)計(jì)者們也云里霧里的,一臉懵逼,別問設(shè)計(jì)原因,問就是回答其它競(jìng)品也有這個(gè)功能,所以我們也做……
是不是覺得自己也中招了?
不過已經(jīng)有大批產(chǎn)品人員已經(jīng)意識(shí)到傳統(tǒng)的盲目設(shè)計(jì)、抄襲式設(shè)計(jì)時(shí)代已經(jīng)過去,數(shù)字化產(chǎn)品時(shí)代已到來的現(xiàn)狀,開始嘗試用數(shù)據(jù)指標(biāo)來輔助業(yè)務(wù)決策。于是開始進(jìn)入下一階段…
2. 此時(shí)數(shù)據(jù)指標(biāo)概念=0.5,有單點(diǎn)數(shù)據(jù)指標(biāo),但難以看出整體業(yè)務(wù)問題
這種情況下通常是想到什么業(yè)務(wù)指標(biāo),就用什么業(yè)務(wù)指標(biāo)。
比方說看到神策、友盟數(shù)據(jù)分析類廠商通常會(huì)用GMV、日活用戶、月活用戶、PV、UV、頁面停留時(shí)長(zhǎng)等數(shù)據(jù),于是產(chǎn)品設(shè)計(jì)人員先將其照搬進(jìn)來,再結(jié)合具體使用的時(shí)候,會(huì)想到一些指標(biāo),然后逐個(gè)往上加。
以網(wǎng)約車為例,今天的GMV降低50%,是什么原因?qū)е履兀?/strong>
分析人員回復(fù)說:受疫情影響,乘客下單量降低20%。
這是平臺(tái)當(dāng)前已有指標(biāo),那還有30%呢?是什么問題導(dǎo)致的?
于是分析人員一查數(shù),發(fā)現(xiàn)在線司機(jī)數(shù)、接單司機(jī)數(shù)降低30%,于是匆匆的又把臨時(shí)想到的這兩個(gè)指標(biāo),簡(jiǎn)單的描述了一下業(yè)務(wù)含義,經(jīng)過一系列的溝通協(xié)調(diào),讓研發(fā)臨時(shí)添加。
這種方式會(huì)存在什么問題呢?
- 指標(biāo)修改成本大。研發(fā)團(tuán)隊(duì)需要重新進(jìn)行數(shù)據(jù)采集、清洗、存儲(chǔ)工作。
- 取值定義不清晰,數(shù)據(jù)不準(zhǔn)確。
- 指標(biāo)缺乏定義規(guī)范,各部門理解難度大。會(huì)產(chǎn)生一些重復(fù)指標(biāo),如指標(biāo)名稱相同,含義不同,例如都叫注冊(cè)司機(jī),一種定義的是注冊(cè)手機(jī)號(hào)成功即為注冊(cè)司機(jī);一種定義的是加盟成功了的是注冊(cè)司機(jī)。
- 存儲(chǔ)、計(jì)算、研發(fā)成本高:沒有統(tǒng)一的規(guī)范管理,造成了重復(fù)計(jì)算的資源浪費(fèi);數(shù)據(jù)的層次和粒度不清晰,使得重復(fù)存儲(chǔ)嚴(yán)重。
二、理解OneData指標(biāo)規(guī)范
既然不提前設(shè)計(jì)指標(biāo)體系會(huì)出現(xiàn)諸多問題,那指標(biāo)體設(shè)計(jì)流程是什么?如何保證指標(biāo)體系的規(guī)范設(shè)計(jì)呢?
下面我們先來看看阿里是如何制定指標(biāo)規(guī)范的:
以維度建模作為理論基礎(chǔ),構(gòu)建總線矩陣,定義業(yè)務(wù)域、數(shù)據(jù)域、業(yè)務(wù)過程、度量/原子指標(biāo)、維度、維度屬性、修飾詞、修飾類型、時(shí)間周期、派生指標(biāo)等。
1. 業(yè)務(wù)域
比數(shù)據(jù)域更高維度的業(yè)務(wù)劃分方法,適用于特別龐大的業(yè)務(wù)系統(tǒng),且業(yè)務(wù)板塊之間的指標(biāo)或業(yè)務(wù)重疊性較小。例如用車業(yè)務(wù)板塊包含乘客端、司機(jī)端,電商業(yè)務(wù)板塊包含商城、返利模塊。
2. 業(yè)務(wù)過程
業(yè)務(wù)過程可以概括為一個(gè)個(gè)不可拆分的行為事件,如下單、支付、評(píng)價(jià)等業(yè)務(wù)過程/事件。
看到這一系列的名詞,很多人可能就開始懵逼了,業(yè)務(wù)域倒還能理解,簡(jiǎn)單來說就是對(duì)不同業(yè)務(wù)的分類;業(yè)務(wù)過程也容易理解,相當(dāng)于畫業(yè)務(wù)流程圖唄。
那數(shù)據(jù)域又是何方神圣?
3. 數(shù)據(jù)域
是聯(lián)系較為緊密的數(shù)據(jù)主題的集合,是對(duì)業(yè)務(wù)對(duì)象高度概括的概念層歸類,目的是便于數(shù)據(jù)管理與應(yīng)用。
簡(jiǎn)而言之,數(shù)據(jù)域就類似于我們電腦桌面要建立不同的文件夾來存儲(chǔ)數(shù)據(jù),這些個(gè)文件夾名就是數(shù)據(jù)域。
維度、維度屬性、修飾這些怎么理解?有什么用途?
4. 維度
是度量的環(huán)境,用來反映業(yè)務(wù)的一類屬性,這類屬性的集合構(gòu)成一個(gè)維度,可以從who-where-when-what層面來看。
5. 維度屬性
維度屬性隸屬于維度,相當(dāng)于維度的具體說明,如用戶維度中性別為男、女。
6. 修飾詞
指除了統(tǒng)計(jì)維度以外指標(biāo)的業(yè)務(wù)場(chǎng)景。
7. 修飾類型
對(duì)修飾詞的抽象劃分。
簡(jiǎn)而言之,維度和修飾都可以理解為原子指標(biāo)的一些限定條件,懂sql的會(huì)更好理解一些,一般是寫sql時(shí),放在where語句后邊的。
8. 度量/原子指標(biāo)
原子指標(biāo)和度量含義相同,某一業(yè)務(wù)行為事件下的度量,是業(yè)務(wù)定義中不可拆分的指標(biāo),如注冊(cè)數(shù)。
9. 時(shí)間周期
用來明確數(shù)據(jù)統(tǒng)計(jì)的時(shí)間范圍或是時(shí)間點(diǎn),如最近30天、自然周、截至當(dāng)日等。
10. 指標(biāo)類型
包含原子指標(biāo)、派生指標(biāo)。
- 原子指標(biāo) = 行為事件+度量
- 派生指標(biāo) = 一個(gè)原子指標(biāo)+多個(gè)修飾詞+時(shí)間周期
例如:原子指標(biāo)=完單量,派生指標(biāo)=近一周iOS乘客完單量,包含時(shí)間周期=近一周,修飾詞=iOS,維度=乘客,原子指標(biāo)=完單量。
三、制定自己的指標(biāo)體系規(guī)范
接下來參考阿里的onedata數(shù)據(jù)標(biāo)準(zhǔn),搭建網(wǎng)約車體系中的數(shù)據(jù)指標(biāo)。
- 業(yè)務(wù)背景:用車業(yè)務(wù)是網(wǎng)約車整體業(yè)務(wù)中的一個(gè)核心,處于多次循環(huán)迭代中,存在指標(biāo)定義不規(guī)范,業(yè)務(wù)方頻繁提出新增指標(biāo),技術(shù)修改難度大等問題,所以目前需要從業(yè)務(wù)整體角度重新構(gòu)建指標(biāo)體系。
- 業(yè)務(wù)目標(biāo):標(biāo)準(zhǔn)化指標(biāo)體系,提升指標(biāo)提取工作效率。
- 行動(dòng):在構(gòu)建指標(biāo)體系的過程中,首要?jiǎng)幼饕鞔_指標(biāo)分類和約束指標(biāo)命名方式,使各個(gè)指標(biāo)能夠做到見名知意、減少溝通成本,這里我們參照阿里對(duì)指標(biāo)的劃分,來規(guī)范建設(shè)指標(biāo)體系。
1. 調(diào)研業(yè)務(wù)需求與分析業(yè)務(wù)流程
1)調(diào)研業(yè)務(wù)需求
充分的業(yè)務(wù)調(diào)研是指標(biāo)體系構(gòu)建的基礎(chǔ),在數(shù)據(jù)指標(biāo)體系搭建項(xiàng)目啟動(dòng)前,需要與各業(yè)務(wù)方詳細(xì)了解具體業(yè)務(wù)、梳理清楚關(guān)鍵業(yè)務(wù)流程。
需求采集可分為定量、定性采集兩種類型,定量地發(fā)放調(diào)研問卷形式,廣泛采集業(yè)務(wù)需求;定性地進(jìn)行用戶訪談,深度挖掘業(yè)務(wù)應(yīng)用場(chǎng)景和核心需求。詳細(xì)的需求采集與分析方式之前《需求采集與需求分析》這篇文章有寫過,此處不再展開,可做參考。
2)分析業(yè)務(wù)流程
根據(jù)阿里巴巴onedata的最佳實(shí)踐,業(yè)務(wù)過程可以概括為一個(gè)個(gè)不可拆解的行為事件。為梳理數(shù)據(jù)之間的邏輯關(guān)系和流向,首先要理解用戶的業(yè)務(wù)過程,了解業(yè)務(wù)過程中涉及的數(shù)據(jù)系統(tǒng)。
下面以網(wǎng)約車體系為例,梳理司機(jī)端、乘客端的業(yè)務(wù)流程以及數(shù)據(jù)指標(biāo)。
乘客端流程可劃分為:注冊(cè)/登陸、下單、服務(wù)、支付、評(píng)價(jià)/客服投訴。
核心流程中所產(chǎn)生的業(yè)務(wù)指標(biāo):
- 注冊(cè)/登陸階段:新用戶數(shù)、用戶數(shù)、不同渠道用戶數(shù)
- 下單階段:下單量、新用戶下單量、老用戶下單量、不同城市下單量數(shù)據(jù)、不同車型下單量數(shù)據(jù)、下單成功用戶數(shù)
- 決策階段:議價(jià)訂單數(shù)、非議價(jià)訂單數(shù)、決策階段用戶主動(dòng)取消訂單數(shù)、決策階段超時(shí)取消數(shù)、數(shù)加價(jià)完成訂單數(shù)、減價(jià)完成訂單數(shù)
- 服務(wù)階段:下單成功用戶數(shù)、訂單時(shí)長(zhǎng)、下單成功率、完單量、完單率、完單用戶數(shù)
- 支付階段:訂單金額、訂單平均金額、訂單優(yōu)惠金額、計(jì)費(fèi)差額
- 評(píng)價(jià)階段:好評(píng)率、差評(píng)率
司機(jī)端業(yè)務(wù)流程可劃分為:
業(yè)務(wù)流程中產(chǎn)生的核心業(yè)務(wù)指標(biāo):
- 注冊(cè)/登陸階段:注冊(cè)用戶數(shù)、新增用戶數(shù)
- 加盟階段:提交審核用戶數(shù)、審核通過用戶數(shù)、新注冊(cè)司機(jī)、累計(jì)注冊(cè)量、老司機(jī)量、新司機(jī)量
- 接單階段:在線司機(jī)數(shù)、聽單司機(jī)數(shù)、有效聽單司機(jī)數(shù)、中標(biāo)司機(jī)數(shù)、中標(biāo)率、日均中標(biāo)司機(jī)數(shù)
- 決策階段:決策階段司機(jī)取消訂單數(shù)
- 服務(wù):服務(wù)平均距離、平均時(shí)長(zhǎng)、空駛平均距離、空駛平均時(shí)長(zhǎng)
- 評(píng)價(jià):司機(jī)好評(píng)率、司機(jī)差評(píng)率、平均星級(jí)
- 提現(xiàn):司機(jī)余額、提現(xiàn)次數(shù)、提現(xiàn)金額
在明確用戶的業(yè)務(wù)過程后,需要根據(jù)分析決策的業(yè)務(wù),劃分?jǐn)?shù)據(jù)域,并在相應(yīng)的數(shù)據(jù)域下拆解具體的業(yè)務(wù)過程。
2. 劃分?jǐn)?shù)據(jù)域
數(shù)據(jù)域:是聯(lián)系較為緊密的數(shù)據(jù)主題的集合,是對(duì)業(yè)務(wù)對(duì)象高度概括的概念層歸類,目的是便于數(shù)據(jù)管理與應(yīng)用。
這里相當(dāng)于對(duì)數(shù)據(jù)進(jìn)行分類,類似于我們電腦桌面要建立不同的文件夾來存儲(chǔ)數(shù)據(jù)。我們的數(shù)據(jù)是面向不同業(yè)務(wù)人員,比方說市場(chǎng)、運(yùn)營(yíng)、客服、風(fēng)控等人員,而其關(guān)注的業(yè)務(wù)模塊大不相同。
而我們技術(shù)人員還要給他們提供各種不同的數(shù)據(jù)指標(biāo),找起來工作效率低,服務(wù)器計(jì)算成本高(你想想在電腦搜索框查某一文件名時(shí),是不是很慢),業(yè)務(wù)人員也難以及時(shí)得到數(shù)據(jù)。沒辦法,那我就做個(gè)數(shù)據(jù)的分類吧,方便我們快速找數(shù)據(jù),以及未來橫向擴(kuò)展數(shù)據(jù)。
所以在劃分?jǐn)?shù)據(jù)域時(shí),我們也要注意:
- 能涵蓋當(dāng)前所有的業(yè)務(wù)需求
- 能拓展新業(yè)務(wù)進(jìn)入已有數(shù)據(jù)域,或者拓展新的數(shù)據(jù)域
這里就相當(dāng)于電腦上的文件夾命名,要包含當(dāng)前所有的文件(數(shù)據(jù)),產(chǎn)生新文件時(shí),能夠放到已有文件或者是方便新建一個(gè)文件。
可以根據(jù)對(duì)業(yè)務(wù)需求、各個(gè)模塊的業(yè)務(wù)流程進(jìn)行分析,進(jìn)行數(shù)據(jù)域的劃分。通常數(shù)據(jù)域劃分可以根據(jù)企業(yè)部門劃分,如客服、運(yùn)營(yíng)、市場(chǎng)等;也可以按照業(yè)務(wù)過程或者業(yè)務(wù)板塊的功能模塊劃分。
例如網(wǎng)約車體系中用車業(yè)務(wù)域可劃分為如下表所示的數(shù)據(jù)域,依據(jù)實(shí)際業(yè)務(wù)過程進(jìn)行歸納、抽象得出數(shù)據(jù)域。
3. 定義指標(biāo)規(guī)范——總線矩陣構(gòu)建
我們梳理了業(yè)務(wù)域、數(shù)據(jù)域、業(yè)務(wù)過程的整體框架,接下來針對(duì)指標(biāo)規(guī)范進(jìn)行設(shè)計(jì)。
簡(jiǎn)單點(diǎn)理解,相當(dāng)于我們?cè)O(shè)計(jì)了文件夾的一級(jí)、二級(jí)、三級(jí)目錄結(jié)構(gòu)規(guī)范,現(xiàn)在要對(duì)該文件命名結(jié)構(gòu)規(guī)范進(jìn)行設(shè)計(jì)。
常用的指標(biāo)基本是按照個(gè)人理解給予的命名,并沒有特別的規(guī)范,比如說日活/月活用戶量、近一個(gè)月下單量、完單金額等。但隨著數(shù)據(jù)指標(biāo)的增多,出現(xiàn)了很多限定條件下的指標(biāo),比如近7天北京快車下單量這樣的指標(biāo),這個(gè)指標(biāo)是如何設(shè)計(jì)得到的,有沒有一套指標(biāo)規(guī)范設(shè)計(jì)呢?
如上圖所示,設(shè)計(jì)指標(biāo)時(shí)需清晰定義業(yè)務(wù)域=用車業(yè)務(wù)、數(shù)據(jù)域=服務(wù)域、業(yè)務(wù)過程=下單、維度=城市、屬性=北京、時(shí)間周期=近7天、修飾詞=快車、度量/原子指標(biāo)=下單量。通過增加對(duì)原子指標(biāo)的約束條件,規(guī)范產(chǎn)生派生指標(biāo)=近7天北京快車下單量,提供一套通用的指標(biāo)定義標(biāo)準(zhǔn),方便不同業(yè)務(wù)部門的人理解指標(biāo)含義。
以網(wǎng)約車體系中的服務(wù)域?yàn)槔贫ㄈ缦驴偩€矩陣,劃分業(yè)務(wù)過程為下單、派單、決策、開始行程、完單。
總線矩陣是數(shù)倉架構(gòu)師會(huì)用的比較多,對(duì)于產(chǎn)品人員會(huì)比較難理解,其實(shí)就類似于數(shù)學(xué)中矩陣和排列組合,一個(gè)原子指標(biāo)的維度限制條件組合不同,可得到成千上萬個(gè)派生指標(biāo)。
總結(jié)
本文主要從數(shù)據(jù)產(chǎn)品角度介紹,如何基于阿里OneData進(jìn)行網(wǎng)約車指標(biāo)體系建設(shè)。通過對(duì)業(yè)務(wù)分析、數(shù)據(jù)域劃分及總線矩陣構(gòu)建,來建立一套指標(biāo)設(shè)計(jì)規(guī)范。通過建立指標(biāo)規(guī)范,可以提升研發(fā)和業(yè)務(wù)方的指標(biāo)獲取效率,為后續(xù)自助式分析打下基礎(chǔ)。
在設(shè)計(jì)指標(biāo)規(guī)范過程中發(fā)現(xiàn)會(huì)產(chǎn)生成千上萬個(gè)指標(biāo),那這些指標(biāo)哪些是真正給業(yè)務(wù)方提供指導(dǎo)意義的呢?
專欄作家
草帽小子,公眾號(hào):一個(gè)數(shù)據(jù)人的自留地,人人都是產(chǎn)品經(jīng)理專欄作家。《大數(shù)據(jù)實(shí)踐之路:數(shù)據(jù)中臺(tái)+數(shù)據(jù)分析+產(chǎn)品應(yīng)用》書籍作者,專注用戶畫像領(lǐng)域。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
寫的很好啊
大家期待已久的《數(shù)據(jù)產(chǎn)品經(jīng)理實(shí)戰(zhàn)訓(xùn)練營(yíng)》終于在起點(diǎn)學(xué)院(人人都是產(chǎn)品經(jīng)理旗下教育機(jī)構(gòu))上線啦!
本課程非常適合新手?jǐn)?shù)據(jù)產(chǎn)品經(jīng)理,或者想要轉(zhuǎn)崗的產(chǎn)品經(jīng)理、數(shù)據(jù)分析師、研發(fā)、產(chǎn)品運(yùn)營(yíng)等人群。
課程會(huì)從基礎(chǔ)概念,到核心技能,再通過典型數(shù)據(jù)分析平臺(tái)的實(shí)戰(zhàn),幫助大家構(gòu)建完整的知識(shí)體系,掌握數(shù)據(jù)產(chǎn)品經(jīng)理的基本功。
學(xué)完后你會(huì)掌握怎么建指標(biāo)體系、指標(biāo)字典,如何設(shè)計(jì)數(shù)據(jù)埋點(diǎn)、保證數(shù)據(jù)質(zhì)量,規(guī)劃大數(shù)據(jù)分析平臺(tái)等實(shí)際工作技能~
現(xiàn)在就添加空空老師(微信id:anne012520),咨詢課程詳情并領(lǐng)取福利優(yōu)惠吧!
請(qǐng)問,矩陣拿到后落地怎么執(zhí)行? 是根據(jù)矩陣建立多個(gè)表嗎? 按照多個(gè)維度分為多個(gè)表?