數(shù)據(jù)之美 | 數(shù)據(jù)可視化三節(jié)課之一:可視化的意義

3 評(píng)論 6444 瀏覽 44 收藏 14 分鐘

編輯導(dǎo)讀:對(duì)于復(fù)雜難懂的數(shù)據(jù),用圖表的方式能夠更直觀地呈現(xiàn)數(shù)據(jù)背后的信息。好的可視化能夠幫助我們快速發(fā)現(xiàn)規(guī)律,找到原因;不好的可視化有可能會(huì)得出錯(cuò)誤的結(jié)論,產(chǎn)生誤導(dǎo)。想要做好數(shù)據(jù)可視化,先要明白,數(shù)據(jù)可視化是什么、能做什么。本文將從三個(gè)方面展開分析,希望對(duì)你有幫助。

“?推測未來將要發(fā)生什么的最好方式,就是記住過去曾經(jīng)發(fā)生了什么。?”—— 喬治·薩維爾

金錢永不眠,屠夫問候各位早安。

近期因?yàn)楣ぷ餍枰?,屠夫梳理了自己在投資和工作實(shí)踐中對(duì)「數(shù)據(jù)可視化」的經(jīng)驗(yàn)和思考。我將用三節(jié)課講述“數(shù)據(jù)可視化”的話題,希望給你一些啟發(fā)。

有句話叫“一圖勝千言”,對(duì)于看似復(fù)雜難懂的數(shù)據(jù)而言,尤其如是。數(shù)據(jù)可視化,是將數(shù)據(jù)轉(zhuǎn)換成圖或表進(jìn)行呈現(xiàn),以一種更直觀的方式展現(xiàn)數(shù)據(jù)。對(duì)于經(jīng)常需要用數(shù)據(jù)、做分析、理邏輯的投資者來說,數(shù)據(jù)可視化是一項(xiàng)利器。

許多人看過數(shù)據(jù)可視化,但未必都明白如何做好數(shù)據(jù)可視化。好的可視化,可以幫助我們快速發(fā)現(xiàn)規(guī)律、找到原因、作出判斷;不好的可視化,可能讓人作出似是而非的結(jié)論,甚至引向大錯(cuò)誤。

一、「數(shù)據(jù)」可以用來做什么?

在了解知識(shí)、技能或工具前,屠夫總喜歡先了解它的“作用”,或者說“它究竟能解決什么問題”。數(shù)據(jù)可視化和數(shù)據(jù)緊密相關(guān),更具體地說是和“數(shù)據(jù)分析”緊密相關(guān)。所以,對(duì)于任何一個(gè)想要了解可視化的人來說,弄懂“數(shù)據(jù)”和“分析”解決了什么問題應(yīng)當(dāng)排在首位。關(guān)于“數(shù)據(jù)究竟解決什么問題”,屠夫歸結(jié)為“FIVE”4個(gè)字母:

  • Forecast 預(yù)測
  • Insight 洞察
  • Validation 驗(yàn)證
  • Evaluation 評(píng)估

一年前寫的《數(shù)據(jù)的F.I.V.E.用法》里的“I”是“Inspiration 啟發(fā)”,如今覺得還是改為“Insight 洞察”更貼切預(yù)測,是數(shù)據(jù)應(yīng)用的最高級(jí)形態(tài)。

從數(shù)據(jù)獲得啟發(fā),以數(shù)據(jù)驗(yàn)證想法,用數(shù)據(jù)評(píng)估現(xiàn)狀,都服務(wù)于對(duì)未來的預(yù)測,最好能夠“運(yùn)籌帷幄之中,決勝千里之外”。作為最高級(jí)形態(tài),預(yù)測又是困難的。理想模型在落地時(shí)往往需要層層假設(shè),這些假設(shè)里任何一個(gè)參數(shù)的偏差,都有可能“失之毫厘謬以千里”。

正如《關(guān)于預(yù)測,你應(yīng)該明白的3個(gè)道理》所說,預(yù)測的尺度越小越精確,卻越不容易準(zhǔn)確。所以,在預(yù)測的精確性和準(zhǔn)確性之間,最終取得的妥協(xié)往往是“模糊的正確”。

洞察,是假設(shè)和靈感的來源。許多規(guī)律在得到嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)驗(yàn)證之前,都是先從歷史數(shù)據(jù)中獲得洞察。我們可以從標(biāo)普500和滬深300的部分歷史數(shù)據(jù)中得到“寬基指數(shù)長期上漲”的想法,這就是數(shù)據(jù)的“洞察”作用,而且往往是通過數(shù)據(jù)可視化實(shí)現(xiàn)的。至于這個(gè)想法到底對(duì)不對(duì),要用數(shù)據(jù)加以驗(yàn)證才知道。

驗(yàn)證,是數(shù)據(jù)驅(qū)動(dòng)決策的試金石。一些似是而非的假設(shè)和靈感可能將人帶入歧途,而用數(shù)據(jù)進(jìn)行驗(yàn)證,將大大減少這類情況發(fā)生。

驗(yàn)證的方式有許多:

在投資里,對(duì)量化策略進(jìn)行“回測”,是典型的驗(yàn)證;數(shù)據(jù)分析時(shí),構(gòu)造蒙特卡洛模擬進(jìn)行試驗(yàn),也是驗(yàn)證;互聯(lián)網(wǎng)行業(yè),采用A/B測試檢驗(yàn)策略有效性,同樣是驗(yàn)證。

驗(yàn)證的天花板是?“absence of evidence”?——“沒有證據(jù)證明您有癌癥”和“有證據(jù)證明您沒有癌癥”,不是一碼事。感興趣的同學(xué)可以看看《決策與判斷的誤區(qū)》中的詳細(xì)解釋。評(píng)估,是使用數(shù)據(jù)的基本立足點(diǎn)。數(shù)據(jù)的“評(píng)估”式用法,實(shí)際上是通過數(shù)據(jù)構(gòu)造出一個(gè)框架,然后將現(xiàn)狀與框架對(duì)比。

可以對(duì)同一對(duì)象,橫跨不同的時(shí)間段,縱向?qū)Ρ?;也可以?duì)多個(gè)對(duì)象,選取同樣的時(shí)間段,橫向?qū)Ρ取?/p>

屠夫曾以“地圖”和“六分儀”作比喻:

預(yù)測就好比使用地圖,而評(píng)估則是使用六分儀。

先以六分儀測量出經(jīng)緯度,確定“當(dāng)前在哪兒”,使用地圖時(shí)才會(huì)心中有數(shù);先用數(shù)據(jù)進(jìn)行評(píng)估,判別清楚當(dāng)前的狀況,你的預(yù)測才不會(huì)成為無源之水。

數(shù)據(jù)可以用來做什么?屠夫的看法是:【數(shù)據(jù)能用于預(yù)測】預(yù)測是數(shù)據(jù)應(yīng)用的圣杯,是啟發(fā)、驗(yàn)證和評(píng)估的最終目標(biāo)【數(shù)據(jù)能帶來洞察】在歷史數(shù)據(jù)的啟發(fā)下,我們可以形成新的靈感或假設(shè)【數(shù)據(jù)能驗(yàn)證假設(shè)】經(jīng)過驗(yàn)證的假設(shè)才有機(jī)會(huì)成為結(jié)論,反之只是一種猜想【數(shù)據(jù)能評(píng)估現(xiàn)狀】有數(shù)據(jù)支撐的現(xiàn)狀評(píng)估,讓預(yù)測和驗(yàn)證成為有根之木。

二、「分析」能解決哪些問題?

有了數(shù)據(jù),還需要分析才能解決問題。

“分析”究竟能解決哪些問題?屠夫歸結(jié)為4類:是什么、為什么、怎么辦和好不好。

回答“是什么”的問題,屬于描述統(tǒng)計(jì)。我們?nèi)粘R姷降内厔菡劬€圖、頻率分布直方圖,都是通過對(duì)數(shù)據(jù)特征進(jìn)行描述,一般稱之為描述統(tǒng)計(jì)。立足于歷史和現(xiàn)狀,側(cè)重在現(xiàn)象和特性的展示?!笆鞘裁础逼鋵?shí)并不算真正意義上的分析,許多數(shù)據(jù)看板和BI都能實(shí)現(xiàn),其威力大小取決于使用數(shù)據(jù)的人。然而這并不妨礙描述統(tǒng)計(jì)在分析領(lǐng)域的地位 —— 它是許多規(guī)律、假設(shè)和猜想的源頭。除此之外,如果回答的是“未來是什么”,這種描述又帶上了預(yù)測色彩了。

回答“為什么”的問題,屬于歸因分析。“歸因分析”一般指互聯(lián)網(wǎng)渠道運(yùn)營對(duì)不同渠道產(chǎn)生的價(jià)值貢獻(xiàn)進(jìn)行歸因。屠夫借這個(gè)詞推而廣之,將“尋求原因和解釋”一類的“為什么”問題,都算作歸因分析。人類是一種對(duì)“解釋”有著極度狂熱的動(dòng)物。當(dāng)我們通過描述性統(tǒng)計(jì)發(fā)現(xiàn)了一些現(xiàn)象時(shí),自然而然會(huì)想要知道現(xiàn)象背后的根源,以便復(fù)現(xiàn)、加強(qiáng)或者削弱這類現(xiàn)象。

回答“怎么辦”的問題,屬于策略分析?;ヂ?lián)網(wǎng)行業(yè)有不少數(shù)據(jù)分析崗位,但是 ——只解答“是什么”,充其量就是人肉取數(shù)工具;只解答“為什么”,不過是產(chǎn)出專題分析報(bào)告;只解答“好不好”,只能完成效果復(fù)盤和回測。

上述3者聽起來都不夠給力,是因?yàn)槟愕姆治?,沒有轉(zhuǎn)化成可操作的策略,分析結(jié)果距離落地太遠(yuǎn)了。

上面是互聯(lián)網(wǎng)領(lǐng)域的例子,對(duì)于投資領(lǐng)域來說更好理解:制定投資策略,通過分析確定約束規(guī)則,決定在什么條件該做什么事,就是策略分析。

回答“好不好”的問題,屬于效果檢驗(yàn)。投資領(lǐng)域提到的“歷史回測”,和職場工作里常常需要進(jìn)行“效果復(fù)盤”,都是在回答“好不好”的問題。仔細(xì)想想就會(huì)發(fā)現(xiàn),“好不好”其實(shí)和上面提到的“驗(yàn)證”關(guān)聯(lián)非常緊密。事實(shí)上,數(shù)據(jù)分析里有一部分工作就是用數(shù)據(jù)來驗(yàn)證效果,和預(yù)期作對(duì)比確定“好不好”。

分析能解決哪些問題?屠夫的看法是:【回答“是什么”】描述統(tǒng)計(jì),可以展示現(xiàn)象和特性,立足歷史和現(xiàn)狀,是規(guī)律和猜想的源頭?!净卮稹盀槭裁础薄繗w因分析,可以深挖現(xiàn)象背后的原因,通過回溯根源,最終利用這些現(xiàn)象。【回答“怎么辦”】策略分析,是為了將分析轉(zhuǎn)化成可操作、可落地的、實(shí)實(shí)在在的策略。【回答“好不好”】效果檢驗(yàn),是為了驗(yàn)證落地操作后的結(jié)果是否符合預(yù)期。

三、「可視化」的意義是什么?

說到這里,我們不妨把「數(shù)據(jù)」和「分析」的作用,做一個(gè)連線。回答“是什么”問題時(shí),需要借助數(shù)據(jù)產(chǎn)生「洞察」,在一定框架對(duì)比之下進(jìn)行「評(píng)估」,還可以對(duì)未來的情況進(jìn)行「預(yù)測」:

回答“為什么”問題時(shí),需要借助數(shù)據(jù)的「洞察」找規(guī)律,挖掘現(xiàn)象背后的原因,有條件的話最好有一定的「驗(yàn)證」:

回答“怎么辦”問題時(shí),需要從「洞察」和「評(píng)估」出發(fā),考慮可操作、可執(zhí)行的應(yīng)對(duì)策略,甚至?xí)脭?shù)據(jù)進(jìn)行一定程度的「預(yù)測」:

回答“好不好”問題時(shí),以「驗(yàn)證」效果是否符合預(yù)期為目的,結(jié)合「洞察」來使用數(shù)據(jù):

發(fā)現(xiàn)了嗎,洞察是被用的最多的,4大類分析問題都離不開「數(shù)據(jù)洞察」:

事實(shí)上,缺乏可視化的情況下幾乎不可能發(fā)揮出數(shù)據(jù)的「洞察」作用。洞察是最需要可視化輔助分析的數(shù)據(jù)用法,這個(gè)“輔助”體現(xiàn)在兩方面:

  1. 輔助分析過程的推理
  2. 輔助分析結(jié)果的表達(dá)

當(dāng)我們希望深入分析、挖掘有用結(jié)論時(shí),可視化可以幫助我們發(fā)現(xiàn)規(guī)律、理清思路。比如下面這張來自《經(jīng)濟(jì)學(xué)人》的網(wǎng)絡(luò)圖,把近20年美國國會(huì)的投票記錄進(jìn)行可視化。如果兩名參議員對(duì)一項(xiàng)法案投出相同一票,就會(huì)以線相連。從圖中不難看出,美國國會(huì)的黨派分歧越來越嚴(yán)重。

來源:經(jīng)濟(jì)學(xué)人

當(dāng)我們表達(dá)自己的分析結(jié)果時(shí),可視化提供了更簡單、直接、易懂的方式。比如下圖對(duì)150萬次公共跑步、散步和騎自行車活動(dòng)路線進(jìn)行可視化,亮度越亮表示路線越受歡迎。這份可視化結(jié)果的背后是枯燥難懂的數(shù)據(jù),但是以這種形式表達(dá),可以讓使用者一眼就發(fā)現(xiàn)熱門路線:

來源:語雀 · 墨者學(xué)院 · 墨者修齊

所以,對(duì)于“可視化的意義是什么”,屠夫的回答是:第一,在數(shù)據(jù)的4種用法里,「洞察」可以覆蓋“分析”的4大類問題第二,在分析過程中,「洞察」非常需要可視化的輔助,這個(gè)輔助體現(xiàn)在:

  • 可視化可以輔助分析過程的推理
  • 可視化可以輔助分析結(jié)果的表達(dá)

以上就是第一節(jié)課的內(nèi)容,下周將為大家?guī)淼诙?jié)課 —— “可視化的使用”,敬請(qǐng)期待!

 

作者:屠夫1868,微信公眾號(hào):基業(yè)長紅

本文由 @屠夫1868 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Pexels,基于CC0協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. nice

    來自韓國 回復(fù)
  2. 奈斯

    來自北京 回復(fù)
  3. ??

    來自上海 回復(fù)