數(shù)據(jù)模型,數(shù)字化轉(zhuǎn)型的核心能力

2 評(píng)論 11064 瀏覽 58 收藏 9 分鐘

業(yè)界數(shù)字化轉(zhuǎn)型已經(jīng)進(jìn)入深水區(qū),數(shù)據(jù)越來(lái)越受到大家重視,由于數(shù)據(jù)中臺(tái)等等概念的興起,大家越來(lái)越回到數(shù)據(jù)的根本問題“數(shù)據(jù)模型”。今天不談?wù)摳叽笊系臄?shù)據(jù)中臺(tái),我想回到數(shù)據(jù)的本源,談?wù)劷拥貧獾臄?shù)據(jù)模型。

一、什么是數(shù)據(jù)模型

我們可以先看一下生活中的模型的例子,房屋平面圖、地圖等都是很好的模型的示例。

對(duì)于下圖的房屋平面圖來(lái)說(shuō),我們基本看一眼就能知道這是一個(gè)三室兩廳兩衛(wèi)的房子,有一個(gè)玄關(guān)和一個(gè)陽(yáng)臺(tái),哪里是門,哪里是墻,哪里是窗戶,每個(gè)房間的平米數(shù)是多少,全部都用各種符號(hào)表示得一清二楚。

對(duì)于地圖來(lái)說(shuō),我們也知道綠色的部分一般都表示公園,藍(lán)色的部分表示湖,黃色的粗線表示高速公路……

圖 1生活中的“模型”(圖片來(lái)源與網(wǎng)絡(luò))

數(shù)據(jù)模型是用于描繪、溝通數(shù)據(jù)需求的一組簡(jiǎn)單易懂、標(biāo)準(zhǔn)的,并且便于計(jì)算機(jī)實(shí)現(xiàn)的標(biāo)準(zhǔn)符號(hào)的集合。

我們都知道數(shù)據(jù)庫(kù)很強(qiáng)大,但數(shù)據(jù)在其中的關(guān)系卻錯(cuò)綜復(fù)雜,成千上萬(wàn)個(gè)表通過各種關(guān)系或約 束互連以形成復(fù)雜的結(jié)構(gòu)。沒有數(shù)據(jù)模型,利益相關(guān)者很難看到現(xiàn)有數(shù)據(jù)庫(kù)的結(jié)構(gòu)、理解關(guān)鍵概念,當(dāng)需要描述數(shù)據(jù)需求的時(shí)候,也很難準(zhǔn)確地表達(dá)出來(lái),這也是數(shù)據(jù)模型很重要的一個(gè)最主要的原因。

下圖是一個(gè)簡(jiǎn)單數(shù)據(jù)模型的示例:

圖 2一個(gè)關(guān)于學(xué)生-出勤-課程的數(shù)據(jù)模型

(圖片來(lái)源:數(shù)據(jù)建模經(jīng)典教程,Steve Hoberman)

二、數(shù)據(jù)模型的幾個(gè)關(guān)鍵形容詞

1.?數(shù)據(jù)模型是一組符號(hào)集合

與實(shí)物模型不同,數(shù)據(jù)模型不是等比例模擬出來(lái)的真實(shí)事物,而是一組能表示數(shù)據(jù)需求、數(shù)據(jù)結(jié)構(gòu)的符號(hào)集合。

在房屋平面圖中,中間有條線的矩形表示窗戶,用直角扇形表示門。在數(shù)據(jù)模型中,用矩形框或圓角矩形表示實(shí)體;用線以及線上的符號(hào)表示實(shí)體之間的關(guān)系、基數(shù)或約束;用寫在線上的詞或詞組表示標(biāo)簽,所有的這些符號(hào)組成了各種各樣的數(shù)據(jù)模型。

2. 數(shù)據(jù)模型是用來(lái)描繪、溝通數(shù)據(jù)需求的

建筑設(shè)計(jì)師在蓋房之前通過房屋平面圖描繪建筑需求,建筑工人就可以看著這些平面圖來(lái)蓋房子。房子蓋完之后還可以把房屋平面圖展示給客戶,這樣即使客戶不去現(xiàn)場(chǎng)看實(shí)體房就可以大概了解房屋結(jié)構(gòu)。數(shù)據(jù)模型也是專門設(shè)計(jì)出來(lái)描繪數(shù)據(jù)需求,給技術(shù)實(shí)現(xiàn)人員來(lái)建造數(shù)據(jù)庫(kù),并且實(shí)現(xiàn)數(shù)據(jù)需求無(wú)障礙溝通的“圖紙”。

3.?數(shù)據(jù)模型是簡(jiǎn)單易懂、標(biāo)準(zhǔn)的

模型之所以可以讓人們實(shí)現(xiàn)快速溝通,是因?yàn)樽銐驑?biāo)準(zhǔn)并且簡(jiǎn)單易懂。

自古以來(lái),無(wú)論是蓋房子還是造火箭,都不可能事先把龐大復(fù)雜的實(shí)物拿過來(lái)給大家介紹,相反只需要通過一些簡(jiǎn)單標(biāo)準(zhǔn)的符號(hào),就可以表示清楚具體的意思。一旦讀者看到標(biāo)準(zhǔn)的模型語(yǔ)言,他們能馬上能開始討論這個(gè)模型是否準(zhǔn)確,而不需要浪費(fèi)任何額外的時(shí)間去探討建模用的符號(hào)是什么意思。

4. 數(shù)據(jù)模型是便于計(jì)算機(jī)實(shí)現(xiàn)的

數(shù)據(jù)模型從一個(gè)抽象層次描述了數(shù)據(jù)的靜態(tài)特征、動(dòng)態(tài)行為和約束條件,最終是要通過技術(shù)實(shí)現(xiàn)人員轉(zhuǎn)化成能被計(jì)算機(jī)理解的程序語(yǔ)言,并且在數(shù)據(jù)庫(kù)中實(shí)現(xiàn)出來(lái)的。所以在設(shè)計(jì)數(shù)據(jù)模型的時(shí)候,必須將便于計(jì)算機(jī)實(shí)現(xiàn)作為模型設(shè)計(jì)的原則之一。

三、為什么需要數(shù)據(jù)模型?

企業(yè)中經(jīng)常會(huì)出現(xiàn)以下問題:

1. 不同技術(shù)背景和業(yè)務(wù)經(jīng)驗(yàn)的各類人員在討論數(shù)據(jù)需求時(shí)缺少一種有效的溝通工具,在討論中經(jīng)常因?yàn)閷?duì)各種符號(hào)理解不一致,導(dǎo)致溝通效率低下,不同觀點(diǎn)之間很難協(xié)調(diào),達(dá)成共識(shí)。

2. 當(dāng)系統(tǒng)出現(xiàn)故障或發(fā)現(xiàn)數(shù)據(jù)問題時(shí),沒有可以觀察系統(tǒng)的整體視角,技術(shù)人員對(duì)當(dāng)前數(shù)據(jù)庫(kù)內(nèi)的狀況全然不知,導(dǎo)致系統(tǒng)問題排查困難,數(shù)據(jù)問題無(wú)從下手。

3. 不同部門對(duì)業(yè)務(wù)規(guī)則的理解不一致,關(guān)于“客戶”、“產(chǎn)品”等關(guān)鍵概念含義多種多樣,數(shù)據(jù)庫(kù)中同名不同義,同義不同名現(xiàn)象隨處可見,極大地影響了數(shù)據(jù)的識(shí)別和應(yīng)用。

4. ……

數(shù)據(jù)模型作為不同技術(shù)背景和業(yè)務(wù)經(jīng)驗(yàn)的各類人員有效溝通數(shù)據(jù)需求的重要媒介,可以幫助描述與溝通數(shù)據(jù)需求、增加數(shù)據(jù)的精確性與易用性、降低系統(tǒng)的維護(hù)成本并增加數(shù)據(jù)可重用性,極大地減少了以上問題出現(xiàn)的頻率。

1. 數(shù)據(jù)模型可以幫助不同人員描述與溝通數(shù)據(jù)需求

在企業(yè)中,來(lái)自不同部門、具有不同技術(shù)背景的業(yè)務(wù)人員、業(yè)務(wù)分析師、數(shù)據(jù)分析師、建模人員、架構(gòu)師、數(shù)據(jù)庫(kù)設(shè)計(jì)人員、開發(fā)人員等各類人員經(jīng)常需要共同討論數(shù)據(jù)問題與數(shù)據(jù)需求。數(shù)據(jù)模型作為一種理想的溝通工具,可以快速使相關(guān)人員達(dá)成共識(shí),跳過對(duì)符號(hào)的理解而直接討論深層需求。

2. 數(shù)據(jù)模型可以增加數(shù)據(jù)的精確性與易用性

數(shù)據(jù)模型中的精確定義為數(shù)據(jù)提供了一個(gè)規(guī)范的結(jié)構(gòu),數(shù)據(jù)建模過程本身是發(fā)現(xiàn)、分析、界定數(shù)據(jù)需求的過程,可以幫助解釋數(shù)據(jù)上下文的邊界,減少數(shù)據(jù)訪問和數(shù)據(jù)存儲(chǔ)時(shí)發(fā)生數(shù)據(jù)異常的可能性。通過說(shuō)明數(shù)據(jù)中的結(jié)構(gòu)和關(guān)系,數(shù)據(jù)模型使數(shù)據(jù)更易于使用。

3. 數(shù)據(jù)模型可以降低系統(tǒng)維護(hù)成本、提升資產(chǎn)可重用性

數(shù)據(jù)模型有助于我們從整體視角了解業(yè)務(wù)與數(shù)據(jù)現(xiàn)狀,并有助于人們分析目前可能存在的業(yè)務(wù)與數(shù)據(jù)問題、分析修改現(xiàn)有數(shù)據(jù)結(jié)構(gòu)是否可行和每次修改可能會(huì)帶來(lái)的影響,降低維護(hù)成本。

另外,數(shù)據(jù)模型以相對(duì)標(biāo)準(zhǔn)精確的形式保留了關(guān)于企業(yè)系統(tǒng)或項(xiàng)目的記憶,這些記憶可以作為可重用性資產(chǎn)供未來(lái)項(xiàng)目使用,從而降低構(gòu)建新應(yīng)用程序的成本。

三、總結(jié)

作為不同技術(shù)背景與業(yè)務(wù)經(jīng)驗(yàn)的各類人員有效溝通數(shù)據(jù)需求的重要媒介,數(shù)據(jù)模型越來(lái)越成為數(shù)字化轉(zhuǎn)型的核心能力。數(shù)據(jù)模型有助于人們描述與溝通數(shù)據(jù)需求、增加數(shù)據(jù)的精確性與易用性、降低系統(tǒng)的維護(hù)成本并增加可重用性。

參考

[1] DAMA International.DAMA-DMBOK: Data Management Body of Knowledge (2nd Edition)[M].Technics Publications:BASKING RIDGE, NEW JERSEY,2017:123.

[2] Steve Hoberman.Data Modeling Made Simple: A Practical Guide for Business and IT Professionals[M].Technics Publications:BASKING RIDGE, NEW JERSEY,2009

 

作者:龔菲,數(shù)據(jù)領(lǐng)域工作者

本文由 @得勿 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 辛苦

    回復(fù)
  2. mark

    回復(fù)