以柱形圖為例,設(shè)計圖表需要調(diào)研這3個重點

2 評論 11368 瀏覽 11 收藏 13 分鐘

數(shù)據(jù)分析中,在選取某種圖表進(jìn)行分析之前,調(diào)研是非常重要的。文章結(jié)合實際案例對柱狀圖設(shè)計中需要調(diào)研的3個關(guān)鍵展開了梳理分析,希望能夠給你一些參考。

現(xiàn)在有一個簡單的產(chǎn)品方案:為了分析某店鋪客服團(tuán)隊中人工客服和機(jī)器人客服的接待量,提出用“柱形圖”來強(qiáng)化表達(dá)“接待人數(shù)”這個數(shù)據(jù)量,突出對比客服之間的數(shù)據(jù)差異包括人工客服對比、人工與機(jī)器人客服對比

這個產(chǎn)品方案有問題嗎?乍一看似乎沒有問題,用“柱形圖”來強(qiáng)化表達(dá)數(shù)據(jù)量,更好的突出差異對比,是對柱形圖的正確打開方式。

但是我們通過調(diào)研抽樣數(shù)據(jù)后可以發(fā)現(xiàn),機(jī)器人客服的接待能力遠(yuǎn)高于人工客服,“服務(wù)助手”的接待人數(shù)是單個人工客服的10倍左右,圖形化表達(dá)后得到的柱形圖由于機(jī)器人客服的數(shù)據(jù)量和人工客服的差異懸殊,導(dǎo)致沒有辦法從圖表中讀出人工客服之間的差異對比

通過這個設(shè)計方案,我意識到了我們在決策是否選取某種圖表前,需要進(jìn)行調(diào)研,用調(diào)研結(jié)果來驗證猜想,避免錯誤的產(chǎn)品設(shè)計方案。

想一想,如果上面的產(chǎn)品方案沒有在決策前進(jìn)行調(diào)研,直接引入了柱形圖,不僅一定程度上造成了研發(fā)資源的浪費,還會讓用戶產(chǎn)生懷疑“這個柱形圖想表達(dá)什么,又有什么作用”,甚至對產(chǎn)品產(chǎn)生了不信任感

既然調(diào)研如此重要,那么需要調(diào)研什么呢?想通過柱形圖為例,和大家一起討論需要調(diào)研什么的問題。

需要調(diào)研什么?

需要對數(shù)據(jù)組進(jìn)行調(diào)研,那我們調(diào)研的理論基礎(chǔ)是什么呢?既然以柱形圖為例,調(diào)研的理論基礎(chǔ)就是數(shù)據(jù)組能被柱形圖圖形化表達(dá),我們可以對柱形圖進(jìn)行拆解,看看組成“水平軸、垂直軸、單位刻度”分別需要哪些條件,之后去調(diào)研業(yè)務(wù)場景下的數(shù)據(jù)組是否滿足這些條件

1. 調(diào)研數(shù)據(jù)類別

柱形圖的水平軸是由兩個或兩個以上不同時間或不同條件的類別組成的,就需要我們?nèi)フ{(diào)研業(yè)務(wù)數(shù)據(jù)的類別情況,根據(jù)調(diào)研結(jié)果去判斷該業(yè)務(wù)場景下能不能形成柱形圖的水平軸。

業(yè)務(wù)數(shù)據(jù)類別情況?

情況1:業(yè)務(wù)數(shù)據(jù)中只有1個類別的數(shù)據(jù),這種情況下“柱形圖”表達(dá)出來的數(shù)據(jù)是孤立的,不具備對比性,在實際業(yè)務(wù)場景中沒有應(yīng)用價值

情況1實例

觀察某淘寶店鋪客服團(tuán)隊“近7日客服接待人數(shù)”,收集到了整個店鋪客服團(tuán)隊的“近7日客服接待人數(shù)”匯總數(shù)據(jù):2131。分析業(yè)務(wù)數(shù)據(jù)可以發(fā)現(xiàn)只有1個類別就是“客服”,形成的柱形圖也就只存在1個孤立的矩形,沒有數(shù)據(jù)分析和實際應(yīng)用的價值

情況2:業(yè)務(wù)數(shù)據(jù)中存在多個類別的數(shù)據(jù),類與類之間只存在唯一變量。這種情況滿足了組成“柱形圖水平軸”的條件,用柱形圖表達(dá)數(shù)據(jù)后,水平軸代表了業(yè)務(wù)數(shù)據(jù)中不同的類別,也能拿來對不同的類別進(jìn)行對比

情況2實例

這次收集到的業(yè)務(wù)數(shù)據(jù)是店鋪下每個客服“近7日接待人數(shù)”匯總數(shù)據(jù),分別是客服1是364、客服3是488、客服5是429、客服2是393、客服7是457。調(diào)研數(shù)據(jù)類別,存在多個類別具體表現(xiàn)為5個不同的客服名稱,同時5個不同的客服名稱只存在唯一變量名字不同。圖形化表達(dá)后,柱形圖水平軸的點代表了1個客服名稱,能用來觀察客服團(tuán)隊里不同客服的接待人數(shù)量,強(qiáng)化對比客服接待人數(shù)差異

情況3:業(yè)務(wù)數(shù)據(jù)中存在多個類別的數(shù)據(jù),類與類之間多個變量。雖然滿足了“兩個或兩個以上類別”的條件,但如果將存在多個變量的類別組成柱形圖的水平軸,圖形化表達(dá)后的柱形圖也是沒有應(yīng)用價值的,多個類別的變量導(dǎo)致無法進(jìn)行數(shù)據(jù)對比。所以當(dāng)多個類別存在多個變量時,我們需要將同一個變量的類別劃分成一組,再用柱形圖來表達(dá)

情況3實例

我們對業(yè)務(wù)數(shù)據(jù)進(jìn)行更深的數(shù)據(jù)收集,收集到了具體每個客服“近7日接待人數(shù)”的每一天的明細(xì)數(shù)據(jù)

近7日客服接待人數(shù)明細(xì):

  • 客服1:17、92、63、77、36、36、43,合計364
  • 客服2:50、97、13、57、10、88、78,合計393
  • 客服3:68、22、94、93、62、83、66,合計488
  • 客服5:29、58、93、68、65、80、36,合計429
  • 客服7:92、13、31、93、88、79、61,合計457

分析業(yè)務(wù)數(shù)據(jù)發(fā)現(xiàn)案例中的類別是存在2個變量的,變量1是客服的名字,變量2是近7日中的日期。如果我們把“今日客服1的接待人數(shù),昨日客服2的接待人數(shù),前日客服3的接待人數(shù)” 作為組成柱形圖的不同類別,就是犯了將“多個類別多個變量”的錯誤,“今日客服1”和“昨日客服2”兩者時間也不一致,客服個體也不一致,失去了不同類別之間的對比性,得到的柱形圖也就沒有應(yīng)用價值了

了解完3種數(shù)據(jù)類別情況后,可以得出一個結(jié)論,用“柱形圖”來表達(dá)業(yè)務(wù)數(shù)據(jù)時,數(shù)據(jù)組中類與類之間只能存在唯一的變量,當(dāng)存在多個變量時,就不適用于柱形圖來表達(dá)

2. 調(diào)研數(shù)據(jù)量范圍

垂直軸表達(dá)度量,是業(yè)務(wù)數(shù)據(jù)量在柱形圖上具體的參考數(shù)值,通過矩形參照垂直軸讀出的數(shù)值就是業(yè)務(wù)數(shù)據(jù)量的表達(dá)。業(yè)務(wù)數(shù)據(jù)量的范圍會影響垂直軸的邊界,所以需要我們調(diào)研業(yè)務(wù)數(shù)據(jù)量的范圍

業(yè)務(wù)數(shù)據(jù)量范圍情況

情況1: 數(shù)據(jù)量范圍很大,當(dāng)業(yè)務(wù)數(shù)據(jù)中存在某個極大值,柱形圖需要能展示下全部的量,影響了垂直軸的上邊界,上邊界的度量需要很大,導(dǎo)致圖形化表達(dá)只能觀察出代表“極大值”的矩形,無法觀察出其余矩形之間的差異。本文開頭產(chǎn)品方案中的調(diào)研,就是一個典型的案例,通過調(diào)研后發(fā)現(xiàn)受極大值影響柱形圖沒有實際應(yīng)用價值

情況2:數(shù)據(jù)量范圍很小,當(dāng)業(yè)務(wù)數(shù)據(jù)中所有數(shù)據(jù)都只在一個窄幅范圍內(nèi)波動,圖形化表達(dá)后的矩形高度差異值很小,這種情況下會影響垂直軸的下邊界,因為垂直軸下邊界的起始值從0出發(fā)的話,將會很難觀察到矩形的差異。所以需要通過調(diào)整柱形圖垂直軸下邊界的起始值,通過修正起始位置來增強(qiáng)差異值的表達(dá)

情況2實例

團(tuán)隊招了1個新的客服同學(xué):客服8,客服8接待能力非常穩(wěn)定,近7日的接待人數(shù)為82,80,78,84,82,81,79,現(xiàn)在想觀察客服8近7日的接待人數(shù)量和變化情況。

調(diào)研客服8接待人數(shù)這組數(shù)據(jù),發(fā)現(xiàn)接待人數(shù)在79到84這個窄幅內(nèi)波動,需要我們對度量起始單位進(jìn)行修正,從下面兩張圖的對比中很容易就能發(fā)現(xiàn),刻度不變的前提下,度量起始值從70開始,比從0開始更能反映出數(shù)據(jù)量的差異值的對比

了解完數(shù)據(jù)量范圍情況,可以得出一個結(jié)論,業(yè)務(wù)數(shù)據(jù)量范圍會影響垂直軸的邊界,數(shù)據(jù)量差異范圍很大時,極大值的數(shù)據(jù)量會影響柱形圖的上邊界;當(dāng)數(shù)據(jù)量差異范圍很小時,窄幅范圍內(nèi)的數(shù)據(jù)量波動,會影響柱形圖的下邊界的起始位置

3. 調(diào)研數(shù)據(jù)組距

單位刻度對柱形圖表達(dá)出來的差異程度有較大的影響,單位刻度1和單位刻度100的兩個柱形圖表達(dá)相同的數(shù)據(jù)量差異是不同的,明顯的,刻度1的柱形圖更能突出對比數(shù)據(jù)量與數(shù)據(jù)量之間的差異。

只考慮單位刻度的情況下,單位刻度越小,柱形圖表達(dá)出來的數(shù)據(jù)信息更細(xì)致,不同類別之間的數(shù)據(jù)量差異越明顯。但是現(xiàn)實情況下,頁面布局不是無限制的,不可能無限制的放大柱形圖,所以需要調(diào)研業(yè)務(wù)數(shù)據(jù)的組距。

組距經(jīng)驗公式是組距 = 全距 / 組數(shù),組距會收到全距和組數(shù)的影響,我們對組距的調(diào)研也就轉(zhuǎn)化成了對全距和組數(shù)關(guān)系的調(diào)研

首先我們可以通過一系列數(shù)學(xué)公式完成對數(shù)據(jù)組距調(diào)研

運用統(tǒng)計學(xué)上的Sturges經(jīng)驗公式,用來研究分組數(shù)k關(guān)于樣本量n的組距關(guān)系

  • k (組數(shù))= 1 + 3.322lg(n)
  • R(全距)= X(max) – X(min)
  • d(組距)= R(全距)/ k(組數(shù))

其次,將確定后的組距引入柱形圖中,判斷下是否會收到圖形固定大小的影響,根據(jù)結(jié)果人為對組距進(jìn)行調(diào)整,若引入組距后,圖形上邊屆無法顯示最大值,則需要增大組距;若引入組距后,圖形上邊界距離最大值還有很大距離,則需要縮小組距。

總結(jié)

通過以柱形圖為例對數(shù)據(jù)組的調(diào)研,可以知道,在設(shè)計圖表前需要對圖表構(gòu)成進(jìn)行拆分,將圖表每一個組成部分所需要滿足的條件作為調(diào)研的理論依據(jù),以此為基礎(chǔ)去調(diào)研業(yè)務(wù)數(shù)據(jù)是否滿足這些條件,從而避免錯誤的產(chǎn)品方案。

 

作者:晌午,微信公眾號:晌午自習(xí)室

本文由 @晌午 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 所以,“突出對比客服之間的數(shù)據(jù)差異包括人工客服對比、人工與機(jī)器人客服對比”這個需求最終的解決方案是???

    來自北京 回復(fù)
    1. 需要結(jié)合實際調(diào)研結(jié)果來判斷,人工和機(jī)器人數(shù)據(jù)差異極大,圖形化表達(dá)后的圖表無法同時觀察“人工和機(jī)器人”和“人工之間”,用兩個柱形圖來表達(dá)更合適;人工和機(jī)器人數(shù)據(jù)如果差異不大,1個圖表就能OK了

      來自浙江 回復(fù)