指標(biāo)管理提問:數(shù)倉分層后,原子指標(biāo)如何指定來源事實(shí)表

0 評論 1059 瀏覽 7 收藏 6 分鐘

在做指標(biāo)管理時(shí),我們需要保證數(shù)據(jù)的一致性,后續(xù)思考相關(guān)問題時(shí),我們也可以基于這一準(zhǔn)則做出解答。這篇文章里,作者就針對“數(shù)倉分層后,原子指標(biāo)如何指定來源事實(shí)表”這一問題做出解答,一起來看看吧。

開門見山,直接來個(gè)提問:

背景1:數(shù)倉已經(jīng)分層,現(xiàn)有兩張表,一張是天粒度的表dwd.order_d(放在了DWD層),一張是周粒度的表dws.order_w(放在了DWS層),兩張表里面都有指標(biāo)訂單金額。

背景2:你現(xiàn)在負(fù)責(zé)建設(shè)或管理指標(biāo)管理系統(tǒng),當(dāng)中有個(gè)模塊叫原子指標(biāo)管理。界面和功能類似下圖的華為產(chǎn)品(DataArts Studio_新建原子指標(biāo))

提問:新增「訂單金額」這個(gè)原子指標(biāo)的時(shí)候,應(yīng)該設(shè)置哪個(gè)表為原子指標(biāo)的來源表?指標(biāo)后續(xù)要統(tǒng)一從哪一層出呢?比如,要匯總月訂單指標(biāo)的時(shí)候,應(yīng)該從哪個(gè)表來匯總呢

來,思考3秒,3…2…1,給出你的答案。這個(gè)問題,很容易陷入當(dāng)中給出的兩個(gè)選項(xiàng):天粒度 or 周粒度?

我先提醒你牢記,做指標(biāo)管理有一個(gè)核心關(guān)注點(diǎn):保證數(shù)據(jù)的一致性。我的答案是:原子指標(biāo)要基于最原始、粒度最細(xì)的數(shù)據(jù)來定義,當(dāng)然,這是理想的做法。

對于訂單這個(gè)動(dòng)作來說,什么是最原始、粒度最細(xì)的數(shù)據(jù)呢?

下訂單就增加一條記錄的那張表,不管下單是最終成功還是失敗,系統(tǒng)都會記錄,這張表就是最細(xì)粒度的表。這個(gè)最原始的銷售訂單事實(shí)表里面通常包含每一筆訂單的詳細(xì)信息,如交易時(shí)間、金額、客戶信息等。而且基于這張表進(jìn)行多種聚合計(jì)算,如按天、周、月等不同時(shí)間粒度或者其他維度(如商品類別、地區(qū)等)來匯總數(shù)據(jù)。

而在實(shí)踐中,就如提問的背景說的那樣,你進(jìn)入某新公司,數(shù)倉已經(jīng)建好了,表也建好了,就等利用管理系統(tǒng)來科學(xué)管理指標(biāo)了,這時(shí)候,可能會根據(jù)使用場景的不同選擇不同的表來作為指標(biāo)計(jì)算的基礎(chǔ)。

場景:嚴(yán)格遵照定義管理

如果是為了保持最大的靈活性和精確度,你應(yīng)當(dāng)找到那張最細(xì)粒度的銷售訂單事實(shí)表去定義原子指標(biāo)。這保證了指標(biāo)的靈活性和準(zhǔn)確性,因?yàn)樵又笜?biāo)應(yīng)該代表最基礎(chǔ)的事實(shí),允許在此基礎(chǔ)上構(gòu)建更加復(fù)雜的計(jì)算和分析。

場景:從實(shí)際業(yè)務(wù)需求出發(fā)

如果業(yè)務(wù)需求明確主要關(guān)注天或周的銷售趨勢,分析場景里沒有比天更細(xì)的粒度,且這些聚合表是可靠的數(shù)據(jù)來源,可以直接使用這些聚合表作為指標(biāo)的數(shù)據(jù)來源。

  • 天粒度的表:是對原始事實(shí)表中的數(shù)據(jù)按照天來進(jìn)行預(yù)先聚合的結(jié)果。如果業(yè)務(wù)需求主要關(guān)注日常運(yùn)營分析,以天作為標(biāo)準(zhǔn)時(shí)間單位,則天粒度表能夠快速提供所需數(shù)據(jù)。
  • 周粒度的表:則更進(jìn)一步將數(shù)據(jù)聚合到周級別,適用于那些關(guān)注周趨勢的分析場景。

不管是哪種場景,我們的目標(biāo)重點(diǎn)是保持清晰的指標(biāo)定義和一致的取數(shù)口徑,即使在不同的聚合層級之間,銷售金額指標(biāo)的計(jì)算規(guī)則也應(yīng)該是一致的,比如都包括或排除退貨、折扣等因素。

寫在最后

無論是從事實(shí)表還是某個(gè)聚合表中取數(shù),結(jié)果都應(yīng)該是相互驗(yàn)證且一致的

之前寫了事實(shí)表里沒有原子指標(biāo),結(jié)果實(shí)際在系統(tǒng)里管理原子指標(biāo)的時(shí)候,又要指定它的來源表,這是咋回事呢?

原子指標(biāo)定義的是取數(shù)的邏輯和部分計(jì)算表達(dá)式(完全SQL取數(shù)里面的計(jì)算表達(dá)式部分),后續(xù)再來講講~

專欄作家

Lee,公眾號:數(shù)據(jù)產(chǎn)品小lee,人人都是產(chǎn)品經(jīng)理專欄作家。關(guān)注直播、短視頻和文娛領(lǐng)域、擅長數(shù)據(jù)架構(gòu)、CDP及數(shù)據(jù)治理相關(guān)工作。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!