【讀書筆記】數(shù)據(jù)分析學(xué)習(xí)總結(jié)(三):磨刀不誤砍柴工——數(shù)據(jù)理解
在這一篇中你將了解數(shù)據(jù)中字段、記錄和數(shù)據(jù)類型等概念,以及制作數(shù)據(jù)表的六點要求,個人覺得對初接觸數(shù)據(jù)的菜鳥我來說比較重要。
?
一、理解數(shù)據(jù) ? ? 扎實的數(shù)據(jù)分析基本功不單是指揮使用數(shù)據(jù)分析工具,更重要的是對數(shù)據(jù)有深入認識和解讀,對數(shù)據(jù)的理解是數(shù)據(jù)分析的一個重要前提。 ? ??以一張學(xué)生們最熟悉不過的成績表為例,介紹下數(shù)據(jù)都長什么模樣。 1. 字段與記錄 ? ? 這樣的成績表從數(shù)據(jù)分析的角度來看,就是一個典型的數(shù)據(jù)庫。成績表最上面的“學(xué)號”“姓名”“性別”“總分”等被稱為字段,而每位同學(xué)的基本情況和成績就構(gòu)成了一條條的數(shù)據(jù)記錄。 ? ? 字段是事物或現(xiàn)象的某種特征,在統(tǒng)計學(xué)中稱為變量。 記錄是事物或現(xiàn)象某種特征的具體表現(xiàn),記錄也稱為數(shù)據(jù)或變量值。 2. 數(shù)據(jù)類型 ? ? 常見的數(shù)據(jù)類型主要有數(shù)字、文字、日期三類,其他的還有貨幣、時間等其他數(shù)據(jù)類型。 ? ? 如果你想知道到底有多少種數(shù)據(jù)類型,最簡單的方法就是在Excel中任意選擇一個單元格,單擊鼠標右鍵-設(shè)置單元格格式中可以查看所有數(shù)據(jù)類型,如圖所示: ? ? 這么多的數(shù)據(jù)類型,最終可以歸為兩大類:字符型數(shù)據(jù)和數(shù)值型數(shù)據(jù)。兩種類型顧名思義,區(qū)分的重要依據(jù)為后者可以直接用算術(shù)方法進行匯總和分析。 3. 數(shù)據(jù)表 ? ? 一張數(shù)據(jù)表的制作,可以側(cè)面反映出制作者的數(shù)據(jù)沉淀及應(yīng)用水平,數(shù)據(jù)表的設(shè)計是否合理,關(guān)系著后期數(shù)據(jù)分析的效率及深度。 ? ? 數(shù)據(jù)表設(shè)計的六點要求: 1)數(shù)據(jù)表由標題行和數(shù)據(jù)部分組成; 2)第一行是表的列標題(字段名),列標題不能重復(fù); 3)第二行起是數(shù)據(jù)部分,數(shù)據(jù)部分的每一行數(shù)據(jù)稱為一個記錄,并且數(shù)據(jù)部分不允許出現(xiàn)空白行和空白列; 4)數(shù)據(jù)表中不能有合并單元格存在; 5)數(shù)據(jù)表與其他數(shù)據(jù)之間應(yīng)該留出至少一個空白行和一個空白列; 6)數(shù)據(jù)表需要以一維的形式存儲,但是在實際操作中接觸的數(shù)據(jù)往往是以二維表格的形式存在的,此時應(yīng)將二維表轉(zhuǎn)化為一維表的形式存儲數(shù)據(jù); ? ? 對于以上數(shù)據(jù)表設(shè)計的幾點要求,本人有所體會,我做的數(shù)據(jù)報表里有不少的合并單元格,基本都是為了滿足一時之需,沒有為后續(xù)數(shù)據(jù)分析做長遠考慮和規(guī)劃,還有就是在數(shù)據(jù)部分不要有空白行和空別列,這些都不是規(guī)范的數(shù)據(jù)表。 ? ??肯定會有人問第六點中一維表和二維表是什么,先看下下面兩個表格應(yīng)該就能看出些區(qū)別,二維表如下圖所示: 我使用Excel的數(shù)據(jù)透視表功能將上面的二維表變?yōu)榱艘痪S表如下圖所示: ? ? 兩表的區(qū)別就在于,二維表的列標簽是數(shù)據(jù):2006年、2007年、2008年;而一維表的列標簽是字段:地點、年份、GDP,而且表中每個指標就對應(yīng)一個取值。 ? ? 至于轉(zhuǎn)換方法,可參見網(wǎng)上各種講解,使用數(shù)據(jù)透視表功能即可,這里不便于配圖講解,若有問題可聯(lián)系我。 ? ? 可能大家對于以上的數(shù)據(jù)表要求還很迷茫,不知道為什么要做到不能有合并單元格,不能有數(shù)據(jù)空白,要用一維表而非二維表存儲,相信在后面處理數(shù)據(jù)時我們會得到答案。 ? ? 就先說到這吧,其實沒說完,但這種枯燥無味看似專業(yè)性較濃的東西寫多了別人是看不下去的,等著用下微信平臺的數(shù)據(jù)分析新功能看看情況。 ? ? ?下一篇會講數(shù)據(jù)來源的內(nèi)容。 ?? ?本文系作者Junehi(微信公眾賬號:Junehi?)授權(quán)發(fā)布,轉(zhuǎn)載請注明來源于人人都是產(chǎn)品經(jīng)理,并保留本文鏈接。
- 目前還沒評論,等你發(fā)揮!