數(shù)據(jù)分析基礎(chǔ)思維之:對比思維

4 評論 13204 瀏覽 48 收藏 20 分鐘

對比是最基本的數(shù)據(jù)分析方法,要講數(shù)據(jù)分析思維,這個最基礎(chǔ)的方法是肯定繞不開的。不過現(xiàn)在的文章提到對比思維,很多都是淺嘗輒止,很少看到有人把對比思維講的更加深入,導(dǎo)致很多數(shù)據(jù)分析初學(xué)者對于對比思維的理解非常片面。本篇文章作者通過對穆勒五法的詳細(xì)闡述,帶大家深入了解了對比思維,一起來看看!

說到對比思維,基本就是以下這種狀態(tài):

本月目標(biāo)100萬,業(yè)務(wù)現(xiàn)狀是80萬,通過這兩者的對比得出目前沒有達(dá)到目標(biāo),距離目標(biāo)還有20萬,完成率80%。

好一點(diǎn)的再加一些同比環(huán)比的數(shù)據(jù),一個所謂的對比分析就算完成了。

如果對比思維是這么簡單的話,有必要存在數(shù)據(jù)分析師這個崗位嗎?估計現(xiàn)在的數(shù)據(jù)分析師都得失業(yè)了吧?

業(yè)務(wù)人員學(xué)會這種方法只需要5秒鐘,還有數(shù)據(jù)分析師什么事兒啊。

上述案例只能算是對比方法中最簡單的一種方法——比大小。所做的工作只是將數(shù)據(jù)轉(zhuǎn)化成結(jié)論,也就是從80萬這個數(shù)據(jù),變成“未達(dá)到目標(biāo)”這樣一個結(jié)論。

雖然相比數(shù)據(jù),結(jié)論要更容易被人記住和理解,但是“比大小”很難得出一些更深層次的信息。

那對比思維除了“比大小”,還有哪些更高級的方法?

我今天就帶大家探尋一下對比思維到底是怎么回事。

在模塊一底層思維的文章中,我介紹了邏輯思維。而邏輯思維最基礎(chǔ)的是歸納法。在之前的文章里,我只是簡單的介紹了一下歸納法,今天我們介紹一種更系統(tǒng)的歸納方法——穆勒五法。

穆勒五法是英國哲學(xué)家穆勒關(guān)于確定現(xiàn)象因果聯(lián)系的五種歸納方法,分別是求同法、求異法、共用法、共變法、剩余法。

如果能深入理解穆勒五法,基本上也就算熟練掌握對比思維了。

一、求同法,比相同

1960年,英國某農(nóng)場十萬只火雞和小鴨吃了發(fā)霉的花生,在幾個月內(nèi)得癌癥死了。

后來,用這種花生喂羊、貓、鴿子等動物,又發(fā)生了同樣的結(jié)果。1963年,有人又用發(fā)了霉的花生喂大白鼠、魚和雪貂,也都紛紛得癌而死,上述各種動物患癌癥的前提條件中,對象、時間、環(huán)境都不同,唯一相同的就是吃了發(fā)霉的花生。

于是,人們推斷:吃了發(fā)霉的花生可能是這些動物得癌死亡的原因。

后來通過化驗(yàn)證明,發(fā)霉的花生內(nèi)含黃曲霉素,黃曲霉素是致癌物質(zhì)。

以上分析方法就是“求同”。

求同法的思路是,如果各個不同場合除一個條件相同外,其他條件都不同,那么,這個相同條件就是某被研究現(xiàn)象的原因。

可用下列公式表示:

場合1, 相關(guān)情況A,B,C, 被研究對象,a;

場合2, 相關(guān)情況A,D,E, 被研究對象,a;

場合3, 相關(guān)情況A,F(xiàn),G, 被研究對象,a;

上述三種場合中,都出現(xiàn)了a現(xiàn)象。而不同場合下都有A條件,所以可以認(rèn)為A條件是a現(xiàn)象的原因。

廣告內(nèi)容分析經(jīng)常會用這種方法。運(yùn)營投放了那么多廣告,自然想知道那些效果比較好的廣告到底有什么特點(diǎn)。

我們可以從投放時間、廣告內(nèi)容、活動形式等等不同的角度去深入分析這些廣告情況。比如分析的情況是這樣的:

廣告1 早上投放 關(guān)鍵字:降價 活動形式:裂變拼團(tuán)

廣告2 下午投放 關(guān)鍵字:免費(fèi) 活動形式:裂變拼團(tuán)

廣告3 晚上投放 關(guān)鍵字:限時 活動形式:裂變拼團(tuán)

廣告4 下午投放 關(guān)鍵字:限時 活動形式:裂變拼團(tuán)

價格轉(zhuǎn)化率比較好的廣告,簡單分拆了三個條件,發(fā)現(xiàn)這幾個廣告的共同點(diǎn)是活動形式都是裂變拼團(tuán)。所以拼團(tuán)裂變的方式對于廣告轉(zhuǎn)化率有著比較好的提升效果,所以之后的營銷活動可以考慮多以裂變拼團(tuán)的方式進(jìn)行。

求異法,比不同

做化學(xué)試驗(yàn)的時候,人們發(fā)現(xiàn),氯酸鉀加熱會產(chǎn)生氧氣,但速度很慢。而一旦加入少量的二氧化錳,就會快速產(chǎn)生大量的氧氣。

這兩組試驗(yàn),唯一的區(qū)別在于是否放入少量二氧化錳。所以得出結(jié)論:二氧化錳是氧氣快速放出的原因。

這種找出差異的方法被稱為求異法。

求異法的思路是,比較某現(xiàn)象出現(xiàn)的場合和不出現(xiàn)的場合,如果這兩個場合除一點(diǎn)不同外,其他情況都相同,那么這個不同點(diǎn)就是這個現(xiàn)象的原因。

求異法可用下列公式表示:

場合1, 相關(guān)情況A,B,C, 出現(xiàn)被研究對象a

場合2, 相關(guān)情況 B,C, 不出現(xiàn)被研究對象a

所以,情況A與現(xiàn)象a之間具有因果關(guān)系。

上述兩種場合中,場合1出現(xiàn)了a現(xiàn)象,場合2沒有出現(xiàn)。觀察他們各自的條件,發(fā)現(xiàn),場合1有ABC三個條件,而場合2只有BC,所以可以認(rèn)為是A條件導(dǎo)致了a現(xiàn)象。

現(xiàn)實(shí)環(huán)境下,想要找到只有一個條件不同而其他條件完全相同的業(yè)務(wù)場景幾乎是不可能的。

因此求異法的應(yīng)用一般都要借助于AB測試。

AB測試可以控制對照組和實(shí)驗(yàn)組的條件,比如投放了兩組廣告,除了廣告文案不同,其他完全相同。如果一個用了“限時折扣”,另一個用了“專屬優(yōu)惠”,而最終轉(zhuǎn)化率如果存在明顯差異,那么廣告文案就是轉(zhuǎn)化率差異的原因。

共用法,先比相同,再比不同

曾有一位聯(lián)合國的官員被派駐越南,他的任務(wù)是提高越南兒童的營養(yǎng)健康水平。

下飛機(jī)后,他發(fā)現(xiàn)自己既沒有辦公室也沒有經(jīng)費(fèi),甚至連當(dāng)?shù)氐恼Z言都不懂,可謂沒有任何資源。

苦思冥想后,這位官員想到了一個辦法。

因?yàn)樯砀呤菭I養(yǎng)水平的一個重要標(biāo)志,除了特殊情況,一般個子高的孩子營養(yǎng)水平都會比個子矮的要好一些。

于是他先從越南各地各階層中通過測量身高挑選出了一批高個兒的孩子,然后排除其中家庭條件優(yōu)越的,僅留下了家庭條件一般、身高卻比同齡兒童高出的孩子,這些孩子作為正面樣本。

在家庭環(huán)境相當(dāng)?shù)那闆r下,他們的家庭是怎樣做到的呢?為了找出其中的原因,這位官員讓這些孩子帶他去觀察他們各自家庭的飲食情況。

經(jīng)過大量走訪,這位官員發(fā)現(xiàn)這些孩子的共同點(diǎn)是:每天都吃四頓飯,他們的家人經(jīng)常會抓一些小蝦米做菜,還會在米飯里加入紫薯葉熬出的汁液。這些都是當(dāng)?shù)乜梢岳玫淖匀毁Y源,并不會提高家庭的日常開支,且容易推廣復(fù)制。而那些個子比較矮的孩子則沒有這些特點(diǎn)。

這位官員總結(jié)出了這種飲食方式可以提高營養(yǎng)水平,于是,便將這種飲食方式推廣到越南全境。就這樣,他在沒有任何資源的情況下,將越南兒童的營養(yǎng)水平整體提升了整整20年。

這里用到的方法就是共用法,也稱求同求異共用法。

運(yùn)用共用法包括三個步驟:

第一步,把被考察現(xiàn)象出現(xiàn)的正面場合加以比較,發(fā)現(xiàn)只有一個共同的情況,由此根據(jù)求同法確定A和a有因果聯(lián)系;

第二步,把被研究現(xiàn)象不出現(xiàn)的反面場合加以比較,發(fā)現(xiàn)A情況不出現(xiàn)是唯一共同的,由此又根據(jù)求同法確定A的不存在與a的不存在有因果聯(lián)系;

第三步,比較正反兩組場合,發(fā)現(xiàn)有A就有a,無A就無a,由此根據(jù)求異法得出結(jié)論:A和a有因果聯(lián)系。

上述案例的邏輯過程是:

先用求法從高個兒孩子的飲食中尋找飲食的共同點(diǎn)。然后用求法發(fā)現(xiàn)矮個子孩子中沒有該飲食特點(diǎn)。

最后用求法對比兩組的情況。最后得出結(jié)論。

共用法的目的是找出因果關(guān)系,不過現(xiàn)實(shí)環(huán)境下找到因果關(guān)系比較困難,或者說容易找到的因果關(guān)系業(yè)務(wù)人員自己就可以找到。

所以分析到深層的結(jié)論我們一般都用相關(guān)關(guān)系替代因果關(guān)系。

只分析相關(guān)關(guān)系的話,共用法的步驟會適當(dāng)精簡。

不追求“有A就有a,無A就無a”的結(jié)果,只追求“有A則a更明顯,無A則a不明顯”。

比如之前提到的廣告分析案例,廣告由于因素太多,過于復(fù)雜,是很難找到因果關(guān)系的,一般找到與轉(zhuǎn)化率強(qiáng)相關(guān)的因素即可。

  • 如果用共用法來分析廣告,首先需要找出正例和反例,一般是用高轉(zhuǎn)化和低轉(zhuǎn)化的廣告做正負(fù)樣本。
  • 然后用求同法對正樣本進(jìn)行求同,找出普遍存在的一些因素,比如關(guān)鍵字帶有“限時”。
  • 再用求同法對負(fù)樣本進(jìn)行求同,找出負(fù)樣本是否普遍不存在“限時”的關(guān)鍵字。
  • 最后比較正負(fù)樣本,發(fā)現(xiàn)帶有“限時”關(guān)鍵字的轉(zhuǎn)化率普遍高,沒有“限時”關(guān)鍵字的廣告轉(zhuǎn)化率普遍低。因此得出結(jié)論:“限時”關(guān)鍵字對于廣告轉(zhuǎn)化率有提升作用。

共用法相比求同法和求異法,應(yīng)用范圍更廣,很多數(shù)據(jù)分析都會用到共用法。不過共用法只能說是在求同法、求異法的基礎(chǔ)上,進(jìn)一步提高了結(jié)論的可靠程度,共用法的結(jié)論未必完全正確。

使用時應(yīng)注意:當(dāng)正事例組和負(fù)事例組的組成場合越多,結(jié)論的可靠性程度越高;對于負(fù)事例組的各個場合,應(yīng)選擇與正事例組較為相似的來進(jìn)行比較(盡量做AB測試)。

另外要注意共用法的步驟包含兩次求同,一次求異。最后一步的求異過程大多數(shù)人會思考,但是在表達(dá)時候不說清楚,還是建議大家表述完整。

共變法,比變化

同樣的一塊地,其他情況都相同,只有肥料的數(shù)量增加了,結(jié)果發(fā)現(xiàn)水稻的產(chǎn)量也在不斷提高。由此我們可以得出多施肥是水稻增產(chǎn)的原因。

這種分析方法就是共變法。

共變法的思路是:在其他條件不變的情況下,如果某一現(xiàn)象發(fā)生變化另一現(xiàn)象也隨之發(fā)生相應(yīng)變化,那么,前一現(xiàn)象就是后一現(xiàn)象的原因。

共變法可用公式表示如下:

場合1, 相關(guān)情況A1,B,C, 出現(xiàn)被研究對象a1

場合2, 相關(guān)情況A2,B,C, 不出現(xiàn)被研究對象a2

場合3, 相關(guān)情況A3,B,C, 不出現(xiàn)被研究對象a3

所以 A是a的原因

數(shù)據(jù)分析方法中和共變法最像的是相關(guān)分析。

相關(guān)分析,簡單地說,就是衡量兩個數(shù)值型變量的相關(guān)性,以及計算相關(guān)程度的大小。

如果是肥料數(shù)量和水稻產(chǎn)量之間的關(guān)系,通過相關(guān)分析,可以得出他們之間存在強(qiáng)相關(guān)關(guān)系,以及相關(guān)系數(shù),估算出投入的肥料可以帶來多少水稻產(chǎn)量。

相關(guān)分析應(yīng)用在現(xiàn)實(shí)的業(yè)務(wù)場景里,就是廣告投放量與銷量之間的相關(guān)關(guān)系、核心功能使用率與留存率的相關(guān)關(guān)系等等諸如此類。

這需要一些相關(guān)分析的知識,比如回歸、相關(guān)系數(shù)、偏相關(guān)等概念,具體這里不做展開。

不過現(xiàn)實(shí)的業(yè)務(wù)場景下,很難做到只有一個因素發(fā)生不同程度的變化。想要增加結(jié)論的可靠性,要么增加樣本量,要么還是老老實(shí)實(shí)做AB測試吧。

剩余法,比剩余

有一次居里夫人和她的丈夫?yàn)榱伺逡慌鸀r青鈾礦樣品中是否含有值得提煉的鈾,對其含鈾量進(jìn)行了測定。

令他們驚訝的是,有幾塊樣品的放射性甚至比純鈾的還要大。這就意味著,在這些瀝青鈾礦中一定含有別的放射性元素。同時,這些未知的放射性元素只能是非常少量的,因?yàn)橛闷胀ǖ幕瘜W(xué)分析法不能測出它們來。

量小放射性又那樣強(qiáng),說明該元素的放射性要遠(yuǎn)遠(yuǎn)高于鈾。1898年7月,他們終于分離出放射性比鈾強(qiáng)400倍的釙。

該元素的發(fā)現(xiàn),應(yīng)用的就是剩余法。

剩余法的思路是:已知一個復(fù)合的被研究對象是由一個復(fù)合原因引起的,如果這個現(xiàn)象的一部分是復(fù)合原因中的一部分的結(jié)果,那么這個復(fù)合現(xiàn)象的剩余部分就是復(fù)合原因中剩余部分的結(jié)果。

剩余法的公式表示如下:

由a、b、c、d構(gòu)成的復(fù)合現(xiàn)象是復(fù)合原因(A、B、C、D)作用的結(jié)果,

現(xiàn)象a是原因A作用的結(jié)果,

現(xiàn)象b是原因B作用的結(jié)果,

現(xiàn)象c是原因C作用的結(jié)果;

所以,現(xiàn)象d是原因D作用的結(jié)果。

剩余法的要求非??量?,現(xiàn)象和原因的對應(yīng)關(guān)系必須是明確的。這一點(diǎn)在極度復(fù)雜的現(xiàn)實(shí)業(yè)務(wù)場景下很難做到,應(yīng)用范圍有限,這里就不多介紹了。

對比思維小結(jié)

數(shù)據(jù)分析方法,都值得重新研究一遍。

綜合以上的方法,我們發(fā)現(xiàn),對比分析除了最基礎(chǔ)的“比大小”之外,還有“比相同”,“比不同”,“比變化”等等不同的方法。

這些對比思維的方法還只是框架,在實(shí)際的數(shù)據(jù)分析過程中,有一些衍生方法。

第一個衍生方法是趨勢分析

趨勢分析的整個分析過程基本都是建立在對比思維的基礎(chǔ)上的。趨勢分析其實(shí)就是將一個業(yè)務(wù)指標(biāo),和自己在過去的情況做對比。

趨勢分析過程中還會用到一些對比方法,比如:

如果隨著時間的發(fā)展,指標(biāo)穩(wěn)步上升,那么基本就是共變法,指標(biāo)隨著時間上升,未來也會上升。

如果趨勢分析中有幾個點(diǎn)異常,特別高或特別低,那么找出這些異常點(diǎn)和其他點(diǎn)的區(qū)別,就是求異法。

如果找出幾個異常點(diǎn)的共同點(diǎn),那就是求同法。

第二個衍生方法是競品分析

競品分析也是一類幾乎完全建立在對比思維基礎(chǔ)上的分析方法,競品分析其實(shí)就是將自己的產(chǎn)品和競爭對手的產(chǎn)品在多個維度上進(jìn)行對比。

競品分析的分析過程中會用到一些對比方法,比如:

如果想找出競品近期快速增長的原因,用的就是共變法。某一時段做了某件事,之后快速增長。

如果想找出成功的APP的共同點(diǎn),就是求同法,等等。

其他的衍生方法還有比如相關(guān)分析、AB測試等等,之前都有提到,這里就不多說了。

最后說下,以上方法都是不完全歸納,也就是說即使論證過程沒問題,結(jié)果依然有可能是錯誤的。而且容易找到的因果關(guān)系已經(jīng)被大家挖掘的差不多了,這些因果關(guān)系我們可以直接拿來用,我們沒有必要自己重新造輪子。

所以如果分析處在初步摸索階段,我們可以用這些對比方法找出一些初步結(jié)論。

如果在找出解決方案的階段,我們可以直接拿那些已經(jīng)被驗(yàn)證的因果關(guān)系做演繹法的大前提,用演繹法做論證,這樣的結(jié)果更可靠而且高效。

對比分析是數(shù)據(jù)分析的基礎(chǔ)方法,幾乎所有的分析都需要做對比分析。

但是很多人覺得對比思維就是“比大小”,這未免也太小看了數(shù)據(jù)分析師的技能水平了。

很多人覺得數(shù)據(jù)分析很簡單,很多數(shù)據(jù)分析的技能看起來平平無奇。

實(shí)際上,我們不去說那些復(fù)雜的算法,即使是基礎(chǔ)的分析思路都是一門很大的學(xué)問。

我覺得,數(shù)據(jù)分析方法,都值得我們再重新研究一遍。

#專欄作家#

三元方差,公眾號:三元方差(sanyuanfangcha),人人都是產(chǎn)品經(jīng)理專欄作家。專注用數(shù)據(jù)驅(qū)動業(yè)務(wù)增長,擅長數(shù)據(jù)分析、用戶增長。喜歡閱讀、思考和創(chuàng)作。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 點(diǎn)贊

    回復(fù)
  2. 你跑出第一個問題之前,麻煩請先解決,不然后續(xù)再多理論,對于大部分決策者,至少是我,會覺得你浪費(fèi)時間。

    回復(fù)
    1. 1

      回復(fù)
  3. 講的很好,如果能把相關(guān)關(guān)系和因果關(guān)系 做個分析那就太棒了;因?yàn)槟壳昂芏嗳嗽诮鉀Q問題時,雖然收集了大量的數(shù)據(jù),甚至形成價值信息后,仍無法很好的解決問題,其主要原因就是搞不清楚相關(guān)關(guān)系和因果關(guān)系。

    來自天津 回復(fù)