數(shù)據(jù)可視化的基本規(guī)范,15張圖打包一次講清楚
編輯導(dǎo)語:數(shù)據(jù)可視化是做數(shù)據(jù)分析時(shí),一直被強(qiáng)調(diào)的內(nèi)容之一。但是,數(shù)據(jù)可視圖你真的做明白了嗎?作者分享了15張圖,一次性給你講明白數(shù)據(jù)可視化的基本規(guī)范。
前天,小熊妹的同事發(fā)過來一張圖,問:“小熊小熊,你能從這個(gè)圖里看出啥問題嗎?”(如下圖)。
小熊妹當(dāng)時(shí)就震驚了!從這張圖,我們可以直觀、清晰、明確的看出:“這位同學(xué),你不會(huì)做數(shù)據(jù)圖呀!”兩個(gè)人比身高,不應(yīng)該背靠背嗎,為啥要疊羅漢呢……
那正確的圖該咋畫呢?今天小熊妹認(rèn)真科普一下哦。做數(shù)據(jù)圖只是個(gè)通俗說法,行業(yè)習(xí)慣叫:數(shù)據(jù)可視化。數(shù)據(jù)可視化,可以做出很多炫酷的圖表,但也不是亂做的,需要遵循一些基本規(guī)范。
一、什么時(shí)候該做可視化?
當(dāng)數(shù)據(jù)描述很簡單的時(shí)候,是不需要做可視化的。
比如:小熊妹12月份全月個(gè)人消費(fèi)了10000元。這時(shí)候只有1個(gè)對(duì)象,1個(gè)指標(biāo),1個(gè)時(shí)間,也沒有細(xì)分這10000元到底都花到哪里去了,這就屬于典型的簡單數(shù)據(jù),這時(shí)候不用做可視化,直接展示出來就好了,多清晰(如下圖)。
如果需要描述的數(shù)據(jù)變得復(fù)雜,就可以用圖表的形式,讓數(shù)據(jù)變得更容易看,更容易理解。評(píng)價(jià)數(shù)據(jù)是否復(fù)雜的,是對(duì)象,指標(biāo),時(shí)間,細(xì)分四個(gè)方面。下邊來一個(gè)個(gè)看看吧~
二、簡單的數(shù)據(jù)可視化
其他條件不變,當(dāng)對(duì)象從1個(gè)變成N個(gè),這時(shí)候可以用條形圖來展示。比如大家看到小熊妹一個(gè)月花了10000大洋!就會(huì)想:“哇塞,小熊妹是不是個(gè)敗家娘妹呢?”
這個(gè)只有1個(gè)人肯定看不出高低,是勤儉持家還是敗家,得和其他妹紙比一比(如下圖)。
條形圖很適合做多個(gè)對(duì)象之間的比較。
因?yàn)檫@種從上到下的陳列方式,很符合人們心中“皇榜”“賽馬圖”的格局,因此一看過去便知道高低,比直接陳列數(shù)字看的清楚。這就是數(shù)據(jù)可視化的第一個(gè)優(yōu)勢(shì):清晰。
只是,只是這么一對(duì)比,就顯得小熊妹真的很敗家了!才不是呢,哼!
其他條件不變,要考慮一個(gè)指標(biāo)的內(nèi)部結(jié)構(gòu),這時(shí)候可以用餅圖。比如光看小熊妹月消費(fèi)1萬,看起來很敗家,可到底花到哪里了呢?如果在北上深這種高消費(fèi)城市,日常生活都不止1萬吧。所以得看看這一萬塊的構(gòu)成,這就是內(nèi)部結(jié)構(gòu)了(如下圖)。
餅圖很適合看內(nèi)部結(jié)構(gòu)組成。
因?yàn)榍写箫灥姆椒ǎ苤庇^,能一眼看到占大頭的是哪里。這就是數(shù)據(jù)可視化的第二個(gè)優(yōu)勢(shì):直觀。
只是,只是這么一對(duì)比,小熊妹的敗家似乎更加實(shí)錘了!居然有那么大比例網(wǎng)購!肯定在12月剁手剁了不少,熊爪子估計(jì)都剁沒了!
其他條件不變,要考慮一個(gè)指標(biāo)的時(shí)間變化,這時(shí)候可以用條形圖。比如想知道小熊妹是一直這么敗家,還是偶爾剁剁手,光看一個(gè)月數(shù)據(jù)不行,還得多幾個(gè)月,這時(shí)候可以如下圖:
誒?這么一看,似乎為小熊妹洗白了一點(diǎn):人家只是雙十一,雙十二的時(shí)候才敗家嗎,平時(shí)吃土吃的可積極了!這就是數(shù)據(jù)可視化的第三個(gè)優(yōu)勢(shì):發(fā)現(xiàn)規(guī)律。數(shù)據(jù)走勢(shì)本身,能反應(yīng)很多問題。
如果把時(shí)間再放長一點(diǎn),條條數(shù)量更多,可能看不清楚,這時(shí)候可以用折線圖,比如看小熊妹過往2年的數(shù)據(jù),這樣至少有24個(gè)數(shù),用折線圖看的更清楚(如下圖)。
時(shí)間拉長,看趨勢(shì)會(huì)更清楚。這么看的話,小熊妹就被洗的更白了:人家只是618,雙十一,雙十二,過年的時(shí)候花的多嗎!平時(shí)是個(gè)積極的吃土小能手。
其他條件不變,要考慮多個(gè)指標(biāo)的內(nèi)部結(jié)構(gòu),這時(shí)候可以用雷達(dá)圖。
但要注意,如果不同指標(biāo)單位不一樣,直接做雷達(dá)圖會(huì)顯得很奇怪,比如收入的單位是元,身高單位是厘米,顏值只能內(nèi)心打分。這時(shí)候可以對(duì)每個(gè)指標(biāo),單獨(dú)做評(píng)分或者做標(biāo)準(zhǔn)化處理,處理成統(tǒng)一的評(píng)分或者指數(shù),再做雷達(dá)圖。
三、復(fù)雜的數(shù)據(jù)可視化
如果用數(shù)據(jù)描述復(fù)雜的問題,對(duì)象,指標(biāo),時(shí)間,細(xì)分四個(gè)方面,就有兩個(gè)方面及以上發(fā)生變化,做圖就會(huì)復(fù)雜。
比如,我們不單單想知道小熊妹過去1年內(nèi)每個(gè)月的消費(fèi),每個(gè)月的逛街次數(shù),這兩個(gè)孤立的數(shù)據(jù)。我們還想知道:是不是逛街越多,花錢就越多。這時(shí)候我們想發(fā)現(xiàn)的,是數(shù)據(jù)之間的相關(guān)關(guān)系,就可以做散點(diǎn)圖(如下圖所示)。
散點(diǎn)圖雖然不能嚴(yán)格論證相關(guān)關(guān)系,但是可以很直接的反應(yīng)出來,如果散點(diǎn)圖真的分布很散,就說明兩個(gè)指標(biāo)之間沒啥關(guān)系,如果散點(diǎn)圖出現(xiàn)一定的規(guī)律性,則表明有深入分析的機(jī)會(huì)點(diǎn)。
這是數(shù)據(jù)可視化的第四個(gè)好處:方便。做個(gè)圖可比做各種模型,算各種檢驗(yàn)值方便多了。
如果想觀察一個(gè)指標(biāo)在不同時(shí)間的結(jié)構(gòu)變化,可以用堆積圖(如下圖)。
堆積圖在分析問題的時(shí)候,非常有用!比如從上圖,能直接看出來,小熊妹消費(fèi)額變化,主要是網(wǎng)購份額變化導(dǎo)致的,真是網(wǎng)購小能手!
同樣的,如果想對(duì)比兩個(gè)對(duì)象的結(jié)構(gòu)變化,也用堆積圖比較合適。相比餅圖,堆積圖在反應(yīng)不同個(gè)體的差異的時(shí)候,看的更清楚。比如下圖,是不是一眼能看出來,萱萱是個(gè)吃貨呢。
如果想對(duì)比N個(gè)對(duì)象在不同時(shí)間的指標(biāo)變化,可以用折線圖。這種對(duì)比會(huì)衍生出一種方法:趨勢(shì)分析法,后續(xù)有機(jī)會(huì)再分享哦。如下圖所示:
如果想對(duì)比N個(gè)對(duì)象在N個(gè)指標(biāo)的差異,可以用雷達(dá)圖。如下圖所示:
四、小結(jié)
反映內(nèi)部結(jié)構(gòu):餅圖、堆積圖反映時(shí)間變化的:柱狀圖、折線圖。
- 反映排名順序的:條形圖
- 反映相關(guān)關(guān)系的:散點(diǎn)圖
- 反映多個(gè)指標(biāo)的:雷達(dá)圖
記住了沒?所以開頭的圖應(yīng)該咋畫?可以這樣畫,看的更清楚(如下圖)。
五、更復(fù)雜的數(shù)據(jù)可視化
可能大家看完,會(huì)問,如果是:N個(gè)對(duì)象、N個(gè)指標(biāo)、N個(gè)時(shí)間、還帶細(xì)分的,該怎么做可視化。
這個(gè)也難不倒小熊妹,因?yàn)檎嬗龅竭@個(gè)情況,就不是一張圖表能說清楚的了。大家感受下,這種N連擊問題,在實(shí)際中是啥效果。
這時(shí)候一定得先把問題整理成清晰的,一個(gè)一個(gè)獨(dú)立的,相對(duì)簡單的小問題,再一個(gè)個(gè)講哦。
至于咋整理,這是另一回事了。有機(jī)會(huì)小熊妹再分享。
作者:碼工小熊,微信公眾號(hào):碼工小熊
本文由 @碼工小熊 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議
小熊妹挖了這么多個(gè)坑,什么時(shí)候能填完
想看最后張三那個(gè)圖表怎么去處理
交給醫(yī)生鑒定哈哈