數據的來源以及數據是什么?

5 評論 10268 瀏覽 6 收藏 7 分鐘

編輯導語:隨著大數據時代的不斷升級,數據在我們的生活工作中顯得尤為重要,其實在很早之前人類就用數據來進行記錄,隨著社會的發(fā)展,網絡時代更需要數據的記錄以及支撐;本文作者分享了關于數據到底是什么的分析,我們一起來了解一下。

01 遠古時代的數據

「數據」本身是存在的,就像空氣,只有出現霧霾使它顯式地呈現在我們腦海里。在百萬年前,推及上億年前,在人類沒有出現在這個藍色星球之時,數據這個事物一直在那里,它等待著的是人類那靈光乍現的智慧賦予它正真的含義。

在沒有計算這個高端的家伙之前,人們?yōu)榱俗尅笖祿垢泳呦螅阌诮y(tǒng)計,進行了至今數萬的探索。在身邊堅硬的物體如石器、骨片以及樹干為載體,刻下紋理來代表對現實事物的表達,似乎成為了一個理所當然的開始。

1960年在非洲烏干達與扎伊爾交界處的伊尚戈漁村發(fā)掘的一根記數刻骨“Ishango Bone”(伊尚戈骨頭),這是距今一萬前伊尚戈人新石器時代早期的作品,是最早的刻符記數實物。遠古部落人民使用這些凹痕記錄日常的交易活動、物資儲備和大事小情,并用他們來進行基本的算術計算。

伊尚戈骨頭

02 現代化的數據

在今日計算機普及的社會里,數據更是顯得非常有存在感,身處于大數據時代的我們已然意識到數據的重要性。那么什么是數據呢?看起來簡單的問題,往往是最復雜的。

當下對數據更普遍的定義往往是從計算機原住民的視角。我們對客觀事物進行觀察、度量、猜測,按照統(tǒng)一或者不統(tǒng)一的尺度標準將結果予以記錄,這些記錄或多或少,都是數據。這些數據期望是未經加工的,它們能非常良好地代表原始事物本來的面貌和形態(tài)。

國際數據管理協會(DAMA)也認為,數據是以文本、數字、圖形、圖像、聲音和視頻等格式對事實進行表現。也就是說,數據要表現事實,受限于數據的采集技術以及數據解讀能力,這或許這是一種理想。

數據表征存在,存在是不以人的意志為轉移,包括物質的和精神的。物質方面有大自然中的風、雨、雷、電、人和動物等實體,這些是有明確感知的,非常方便數據化。在精神方面,人的歡樂、哀怨等情緒可以被大量多次主觀度量,最終也可以形成數據。

數據似乎往往應用于實體,實體是大多數據刻畫的對象。在刻畫實體時往往需要系統(tǒng)數據,單一的數據似乎不那么受歡迎。在擁有了大量的對一個實體的刻畫數據后,經常會從量變發(fā)生質變。

集結數據成為「信息」,加工信息成為「知識」,運用知識產生「智慧」,數據成為低層的驅動者;它們之間環(huán)環(huán)相扣、循序漸進,構成了「DIKW 金字塔」。

數據-信息-知識轉化模型

我們再來看看東方智慧。中文詞語「數據」暫且不論其詞源,容我們從字面窺探一二。

「數」有兩層含義,一個是數據往往用數字來記錄事實,如一個人的年齡,一座山的高度;另個一個層面是它用數學的方法來進行統(tǒng)計最終得到記錄結果,如一群人的平均年齡和群峰的平均高度,都應用了數學中的平均數概念。

再看「據」,我將據理解為日常生活中的票據,票據是證明,證明發(fā)生過此事,是人類大腦缺點的補充,是對時間的凝固,因此「據」是事實。所謂數據就是事實的數字化憑據。

03 展望未來

正如開頭所講的一樣,對于數字時代的我們,數據或許真的和空氣一樣,已經不需要我們再去思考其概念。

當我們每天生活有數字化加持的小區(qū)里,工作在繁華的智能辦公商業(yè)區(qū),享受著數字生活的便利時,這一切顯得是那么自然,而這也正是物聯網時代下新的數據生態(tài)。

物聯網時代下的數據

更多的思考,是為了更好地出發(fā)。在對數據概念的理解上我們還需要繼續(xù)探索,歡迎各位數據人在評論區(qū)留言,談一談你認為的數據是什么。

 

作者:李慶輝(新芭)數據產品專家,數據產品團隊負責人;擅長數據治理、數據分析、數據化運營;Python書籍《深入淺出Pandas》作者;

本文由@一個數據人的自留地 原創(chuàng)發(fā)布于人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 五官六感所能得都是數;
    五官六感所不能得(細胞、病毒等)也是數;
    所得的東西,經過證實記錄(寫成文,繪成畫等)都是據

    來自貴州 回復
  2. 五官所能得都是數;
    五官所不能得也是數(細胞、病毒)等也是數;
    所得的東西,經過證實記錄(寫成文,繪成畫等)都是據

    來自貴州 回復
  3. 我可以復制文本轉載文章嘛,樓主

    來自貴州 回復
  4. 好文章,感謝

    來自貴州 回復
  5. 辛苦

    回復