3個方面研究:圖與表展示
圖與表,是數(shù)據(jù)展示的兩種形式,它們分別適用于不同的場景。文章從三個方面研究,圖與表的展示,一起來文章中看看~
一、圖與表的優(yōu)劣勢和適用場景
圖的優(yōu)勢是直觀、易讀,往往讀者只需要簡單掃一眼,就可以對數(shù)據(jù)有一個基本的了解。圖的劣勢是數(shù)據(jù)承載能力差。由于圖的空間限制,往往不能承載大量的數(shù)據(jù)。
表和圖恰恰相反,表由于可以翻頁的特性,能夠承載大量的數(shù)據(jù)。但由于數(shù)據(jù)分布在不同的頁,信息結(jié)構(gòu)復(fù)雜,表的內(nèi)容并不能夠直觀地一眼讀完。
由于圖與表各自的優(yōu)劣勢,以及不同的使用場景的具體需求,我們在數(shù)據(jù)展示中往往會靈活地使用不同的方案。
1. 只用圖
在關(guān)注整體、趨勢,不在意細(xì)節(jié)的數(shù)據(jù)展示場景下,一般只用圖,如各種數(shù)據(jù)概覽或BI。該頁面內(nèi)會放置多個圖用來展示數(shù)據(jù),用戶在頁面使用瀏覽、掃閱的方式來獲取信息,關(guān)心整體勝過細(xì)節(jié)。
這種頁面里,使用表格會造成頁面空間的不必要占用,且表格的易讀性差,用戶不能快速獲取信息。
2. 只用表
需要展示的數(shù)據(jù)項特別多時,使用圖是不合適的。如廣告后臺的數(shù)據(jù)展示,往往會有數(shù)十個渠道的數(shù)據(jù)需要展示。如果使用圖,這數(shù)十個渠道是無法完整展示的。這樣的情況下,往往只使用表格來展示數(shù)據(jù)。
3. 圖表結(jié)合
大多數(shù)數(shù)據(jù)展示的主流場景下,用戶往往是先看圖,快速獲取信息后,再選擇要不要繼續(xù)通過表查看具體數(shù)據(jù)。這時,圖表結(jié)合就是最合適的方式。
二、數(shù)據(jù)展示的本質(zhì)
數(shù)據(jù)展示的數(shù)據(jù),是從數(shù)據(jù)庫來的,是通過sql語句從數(shù)據(jù)庫提取出來的。數(shù)據(jù)庫內(nèi)的主要內(nèi)容就是表。
下面是一個表的例子:
表的結(jié)構(gòu)
表由行和列構(gòu)成,每一行是一條數(shù)據(jù)記錄,列是每條記錄擁有的字段,表中的國家、省都是列字段。
我們將字段分為兩類:計數(shù)型字段和計算型字段。
- 計數(shù)型字段只能計數(shù),如表中的國家、省、市、性別;
- 計算型字段除計數(shù)外,還可以進(jìn)行求和、求平均等運算,如表中的人和就業(yè)率。
數(shù)據(jù)提取時,往往會有這樣的例子:按國家展示人口。即把國家相同的行的人口做一個匯總,得出的數(shù)據(jù)結(jié)果會是:
理解了這些基礎(chǔ)知識后,我們提出這樣一個觀點。數(shù)據(jù)展示的本質(zhì)是:按維度展示指標(biāo)。
按什么展示,什么就是維度;展示什么,什么就是指標(biāo)。如上文中的例子:按國家展示人口,國家就是維度,人口就是指標(biāo)。有懂SQL的同學(xué),對這部分會理解的更好一點。Sql語句里,select的就是指標(biāo),group by的就是維度。
然后,我們在引入一些概念:維度的數(shù)量、維度的實例數(shù)量、指標(biāo)的數(shù)量。
維度的數(shù)量:我們按維度查看時,是幾個維度?
如上文中按國家查看,維度的數(shù)量就是1,但按國家和性別查看,那么維度的數(shù)量就是2,如下圖:
維度的實例數(shù)量:我們按維度查看時,一個維度有幾個實例?
如上文中按國家查看,美國和中國就是國家的實例;按性別查看,男和女就是性別的實例。
指標(biāo)的數(shù)量:我們查看的指標(biāo)的數(shù)量。如上文中,我們只查看了人口這一個指標(biāo)。
三、為數(shù)據(jù)展示選取合適的圖表
折線圖、柱狀圖、餅圖…我們見過各種各樣的圖,不同的圖適用于不同的目的和場景。
我們會發(fā)現(xiàn),用圖來展示數(shù)據(jù),是有適不適合的分別的。讓你用餅圖來展示時間趨勢的數(shù)據(jù)變化,你會發(fā)現(xiàn)基本不可能。同樣,讓你用折線圖展示構(gòu)成,也是不合適的。那么,這些合不合適,有沒有什么內(nèi)在的關(guān)聯(lián)和根本的邏輯?
我們在上文的數(shù)據(jù)展示的本質(zhì)中說過:數(shù)據(jù)展示的本質(zhì)就是按維度查看指,維度的數(shù)量是1個或多個,維度的實例數(shù)量一般是多個,指標(biāo)的數(shù)量是1個或多個。
按維度展示時,每個維度都需要在圖中能夠區(qū)分。單個維度的多個實例,也是需要能夠區(qū)分的。同時展示多個指標(biāo)時,指標(biāo)之間是需要有區(qū)分的,例如通過顏色、形狀等來區(qū)分。
我還是以上文的例子來說明:
這個數(shù)據(jù)集有兩個維度:國家和性別。國家維度有兩個實例:美國和中國;性別維度有兩個實例:男和女。有兩個指標(biāo),人口和就業(yè)率。這樣的數(shù)據(jù)集,應(yīng)該以怎樣的圖來展示?
這個圖能夠完美地表現(xiàn)數(shù)據(jù)集中的數(shù)據(jù)。但我們會發(fā)現(xiàn):當(dāng)國家的實例不止一個,而是200個時,這樣的圖就不合適了。因為橫軸的空間是有限的,不可能容納這么多的國家。
由此我們可以說,圖的軸對數(shù)據(jù)集的維度的實例數(shù)量是有要求的,不能太多。其實這樣說,也不是特別嚴(yán)謹(jǐn)。你會發(fā)現(xiàn):如果橫軸是時間軸的話,好像放個幾百天的時間也不是問題,大不了中間的部分時間不顯示罷了。
在此,我們引入另外一個新的概念——維度的實例的離散和連續(xù)。例如:國家維度的實例就是離散的,你不能在顯示200個國家的時候,只顯示首尾幾個國家,就代表了所有國家。但是,日期維度的實例就是連續(xù)的,你要顯示100天,只需要顯示第一天和最后一天,別人自然會知道中間包括了這所有的天數(shù)。
所以,我們得出結(jié)論:圖的軸對展示的維度的實例數(shù)量是有要求的。離散型的維度,只能展示較少的維度實例;連續(xù)型的維度,可以展示較多的維度實例。
說完數(shù)據(jù)集,我們來說回圖表。數(shù)據(jù)集有維度,圖也有維度,我們把圖的維度叫做圖維。圖維是能夠區(qū)分圖的信息的方式的數(shù)量。如橫軸、縱軸、顏色、尺寸、樣式。
如下圖,這是一個三個圖維的圖:橫軸、縱軸、點的顏色。
下圖是一個4個圖維的圖:經(jīng)度、維度、氣泡尺寸、氣泡顏色。
相對于數(shù)據(jù)集維度的實例數(shù)量,圖維也是有實例數(shù)量的。如:顏色維度,一般只使用較少的顏色,較多的顏色會讓數(shù)據(jù)區(qū)分困難。
我們把數(shù)據(jù)集和圖結(jié)合起來看:數(shù)據(jù)集有維度、維度的實例數(shù)量、指標(biāo)數(shù)量;圖有圖維數(shù)量,圖維的實例數(shù)量。數(shù)據(jù)集展示成圖,就是講維度。指標(biāo)區(qū)分都對應(yīng)到了圖維上,維度的實例都對應(yīng)到了圖維的實例。
一個數(shù)據(jù)集能夠在圖中展示的前提條件時:圖維數(shù)量>=指標(biāo)數(shù)量+維度數(shù)量,圖維實例數(shù)量>=數(shù)據(jù)集維度實例數(shù)量。
一個典型的圖表頁面:
常規(guī)場景下的圖選擇:
本文由 @?流風(fēng) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
統(tǒng)計圖表一直是我的短板,受益匪淺
不錯