數(shù)據(jù)可視化(1):從認(rèn)知心理學(xué)角度的理解
同樣一組數(shù)據(jù),只是把數(shù)字羅列出來,和用簡(jiǎn)單的線圖表達(dá)數(shù)據(jù),這兩者的效果可能完全不同。本文作者從認(rèn)知心理學(xué)的角度,對(duì)數(shù)據(jù)可視化進(jìn)行了分析,一起來看一下吧。
一、為什么可視化?
下面是一組非常簡(jiǎn)單的數(shù)據(jù),Excel 里面 6 個(gè)月的分渠道銷售額。請(qǐng)問你能快速找出什么規(guī)律?
雖然只有 6 個(gè)月乘以 3 個(gè)渠道 18 個(gè)數(shù)字,迅速搞清楚也不沒那么容易,我們要把數(shù)字一個(gè)個(gè)進(jìn)行對(duì)比,甚至要刻意背下來一些信息才能發(fā)現(xiàn)規(guī)律。不然有時(shí)候看了幾個(gè)數(shù)字前面的就忘了。人類短期記憶只有 6-7 個(gè)單元。
那么用簡(jiǎn)單的線圖表達(dá)同一組數(shù)據(jù)呢?
我們可以看出,會(huì)展渠道在 6 月效果異常突出,而官網(wǎng)渠道從七月份起效果有明顯下降。而我們得到這個(gè)理解只需要一瞬間,和之前找規(guī)律的難度對(duì)比鮮明。
假設(shè)根據(jù)上面信息,我們得知 6 月份有個(gè)重要峰會(huì)導(dǎo)致業(yè)績(jī)上升,同時(shí)官網(wǎng)在 7 月份有改版,那我們甚至可以再加工一步,用不同的色相突出想表達(dá)的線圖(官網(wǎng)渠道),并用醒目的紅色標(biāo)出重要事件,更好的表達(dá)需要調(diào)查官網(wǎng)改版以及進(jìn)行修補(bǔ)。
但是也許有人會(huì)說,通過統(tǒng)計(jì)數(shù)據(jù),比如平均值,不也可能快速理解和掌握數(shù)據(jù)嗎?那我們看下面四組統(tǒng)計(jì):
這四組數(shù)據(jù)應(yīng)該一模一樣吧?
那我們?cè)倏聪?,這四組數(shù)據(jù),畫成圖表的樣子:
Source:https://en.wikipedia.org/wiki/Anscombe%27s_quartet
是不是明顯不一樣,要不是看到可視化,我們差點(diǎn)被統(tǒng)計(jì)騙了?這幾組數(shù)據(jù)由英國(guó)數(shù)學(xué)家 Anscombe 在 1973 年設(shè)計(jì),就是為了突出只有統(tǒng)計(jì)數(shù)據(jù)是不夠的,可視化至關(guān)重要。
數(shù)據(jù)可視化給我們帶來的是,幫助我們理解,洞察,和表達(dá)數(shù)據(jù),做更好的決策,以及影響他人。數(shù)據(jù)可視化一般分為兩類,explanatory 解釋性數(shù)據(jù)可視化,以及 exploratory 探索性數(shù)據(jù)可視化。實(shí)際應(yīng)用場(chǎng)景普遍為數(shù)據(jù)看板輔助決策和監(jiān)控,數(shù)據(jù)探索進(jìn)行數(shù)據(jù)分析,以及通過可視化講故事影響他人。
數(shù)據(jù)可視化帶來的價(jià)值巨大,本身市場(chǎng)也在快速增長(zhǎng),F(xiàn)ortune Business Insights 預(yù)估其年增長(zhǎng)率約為 10%,會(huì)在 2027 到達(dá)約 200 億美金。
二、認(rèn)知心理學(xué)角度
近幾年開始流行一個(gè)詞“中國(guó)式報(bào)表”,密密麻麻的一片數(shù)字放在 Excel 一樣表里,作為中國(guó)特色。甚至有人認(rèn)為,中國(guó)人不需要圖表,只需要看數(shù)字,報(bào)表不適合中國(guó)人。
其實(shí),歐美曾經(jīng)的報(bào)表也是那樣,比如 VisiCalc 和 Lotus 1-2-3 的年代:
Source: https://www.wired.com/2009/01/jan-26-1983-spreadsheet-as-easy-as-1-2-3-2/
之后數(shù)據(jù)可視化的逐漸勝出,是基于人類本性,基于人類無數(shù)年進(jìn)化獲取的視覺感知,認(rèn)知,及短期記憶特性。這些本質(zhì),讓可視化變成人類洞察和理解抽象信息的重要工具。
暫時(shí)回到一開始用過的例子:
其實(shí)一個(gè)認(rèn)真負(fù)責(zé)很專業(yè)的員工,在對(duì)以上數(shù)據(jù)非常熟悉的狀態(tài)下,完全掌握公司經(jīng)營(yíng)狀態(tài),只看這種表格也是可以的,而且數(shù)字密度高反而會(huì)有效率高的錯(cuò)覺。很多努力工作的小伙伴可能都在這種狀態(tài)。但是如果以上數(shù)字再乘以幾倍幾十倍幾百倍的復(fù)雜度呢?比如加上產(chǎn)品分類,產(chǎn)品分類細(xì)分,活動(dòng),活動(dòng)分類等。這時(shí)候有效找出規(guī)律和問題,就不得不需要正確的工具支持了。
接下來讓我們探索認(rèn)知心理學(xué),視覺感知中的先意識(shí)屬性,以及格式塔原則。
三、先意識(shí)屬性 Pre-Attentive Attributes
在下圖中,數(shù)出一共有幾個(gè)數(shù)字 9,需要多久?
把上圖稍微改下呢?
找出數(shù)字 9 變成了一瞬間的事情,再數(shù)一下就好了。
在大腦過濾和整理視覺信息并傳給意識(shí)之前,所有采集的視覺信息會(huì)先由潛意識(shí)進(jìn)行處理。即先意識(shí)處理 Pre-Attentive Processing,先意識(shí)屬性 Pre-Attentive Attributes 會(huì)被先意識(shí)處理快速提取出來。我們?cè)诘诙垐D能迅速找出數(shù)字 9 就是因?yàn)樯嗖钍窍纫庾R(shí)屬性之一。
先意識(shí)屬性與處理就像人類的神經(jīng)反應(yīng)一樣,如果不小心摸到滾燙的鍋,我們會(huì)在大腦反應(yīng)過來之前,迅速的自動(dòng)把手縮回去。
先意識(shí)屬性分為色相 Hue,形狀 Form,空間位置 Spatial Position,以及動(dòng)作 Motion。因篇幅限制這里一筆帶過(色彩尤其重要和值得研究,會(huì)在未來另一篇文章深入探討)。以下為一些常見例子:
下圖為一個(gè)運(yùn)用先意識(shí)屬性的例子,每月支出超出或低于預(yù)算狀況:
數(shù)據(jù)為 1-8 月份實(shí)際支出和預(yù)算的對(duì)比。目標(biāo)是每月支出都在預(yù)算 95% 以內(nèi),用灰色標(biāo)注線注明,支出超過預(yù)算 105% 視為嚴(yán)重超出預(yù)算,用紅色。每個(gè)條形的長(zhǎng)度為低于或超過目標(biāo)的量。
我們第一眼就能看到紅色部分,即 7 月份支出超過預(yù)算的 105%,第二會(huì)看到 4 月份和 7 月份超出預(yù)算但是還沒到 105% 的部分。因?yàn)榈竭_(dá)目標(biāo)的月份條形方向朝下,我們也可以一眼看出 1,2,5,6 月份達(dá)到了目標(biāo)。8 月份因?yàn)檫€在進(jìn)行中,條形是虛的。整個(gè) YTD 支出與預(yù)算對(duì)比一目了然。
四、格式塔原則 Gestalt Principles
格式塔在德語(yǔ)中意思為形狀或規(guī)律,代表人類如何把看到感知到的信號(hào),整理成信息并賦予理解。以下為六種大腦根據(jù)視覺信號(hào)創(chuàng)建感知的方法:
1)相近
我們的大腦會(huì)自動(dòng)把下面左圖按大概位置分成三組數(shù)據(jù),中間圖分成上中下三組數(shù)據(jù),右圖按左右分成五組數(shù)據(jù)。
2)相似
同理,我們會(huì)按照?qǐng)D形的相似度進(jìn)行分組。
3)圍繞
4)閉合
我們自動(dòng)的“腦補(bǔ)”了圖形,甚至文字的缺口。
5)持續(xù)
同樣是腦補(bǔ)缺口,但是效果為持續(xù)。
6)相連
通過連接,把不同的物件放到一起。
下面是一個(gè)運(yùn)營(yíng)格式塔原則的例子,下圖為某季度末,對(duì)兩個(gè)團(tuán)隊(duì)一共 10 個(gè)員工的評(píng)分,每個(gè)三角或者圓圈都是一個(gè)員工:
能力評(píng)分低于 3.5 同時(shí)業(yè)績(jī)?cè)u(píng)分低于 2.5 的同學(xué),可能會(huì)被畢業(yè)輸送給社會(huì),要重點(diǎn)關(guān)注,于是用淺紅色背景“圍繞”起來。能力和業(yè)績(jī)?cè)u(píng)分都很高的優(yōu)秀同學(xué)同理。
而同樣團(tuán)隊(duì)的員工們用同樣的圖形標(biāo)注,也能輕易看出團(tuán)隊(duì) A 的員工普遍能力更強(qiáng),但是團(tuán)隊(duì) B 的員工業(yè)績(jī)更好。
當(dāng)然,視覺感知的原理也是為什么我們能被自己的眼睛欺騙,比如下圖的直線,怎么看起來似乎歪歪扭扭的:
Source:https://en.wikipedia.org/wiki/Caf%C3%A9_wall_illusion
或者下面兩個(gè)橙色的點(diǎn)其實(shí)一樣大小,但是看起來感覺就是不一樣:
Source:https://en.wikipedia.org/wiki/Ebbinghaus_illusion
五、結(jié)語(yǔ)
我們?cè)谘菔净蛱剿鲾?shù)據(jù)的時(shí)候,無論是做 ppt,報(bào)告,BI 看板,設(shè)計(jì)產(chǎn)品,還是分析,若能有效使用可視化,可大幅度提高我們自己對(duì)數(shù)據(jù)的洞察,以及更好的傳達(dá)我們的主張。
這篇文章只是講了些基礎(chǔ)以及簡(jiǎn)單運(yùn)用方法。數(shù)據(jù)可視化是一個(gè)龐大的跨學(xué)科領(lǐng)域,包括設(shè)計(jì),人機(jī)交互,統(tǒng)計(jì)學(xué),計(jì)算機(jī)科學(xué),以及本文中觸及的視覺感知,認(rèn)知科學(xué)等。
而本文想強(qiáng)調(diào)的,是數(shù)據(jù)可視化的力量來源和直接效果,都是基于人類本身,輔助認(rèn)知,擴(kuò)大認(rèn)知。
Max(微信號(hào) invicti 公眾號(hào) SaaS 沉思錄)。硅谷海歸,Salesforce 和 Intuit 高級(jí)工程師。ThoughtSpot 初期員工。曾管理 ThoughtSpot 全公司市場(chǎng)運(yùn)營(yíng),銷售運(yùn)營(yíng),和數(shù)據(jù)分析。UC Berkeley 電子工程與計(jì)算機(jī)科學(xué)。
作者:Max,公眾號(hào):SaaS 沉思錄,微信: invicti
本文由 @Max 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
人類如何把看到感知到的信號(hào),整理誠(chéng)信息并賦予理解?!罢\(chéng)”是個(gè)錯(cuò)別字。
收到,非常感謝指出??!