3分鐘,看懂假設(shè)檢驗(yàn)

0 評論 9869 瀏覽 11 收藏 8 分鐘

編輯導(dǎo)語:假設(shè)檢驗(yàn)與區(qū)間估計(jì)存在著內(nèi)在的本質(zhì)聯(lián)系,它們二者都是用于總體參數(shù)推斷的統(tǒng)計(jì)方法。本篇作者就對假設(shè)檢驗(yàn)的概念和操作方法等進(jìn)行了總結(jié),一起來看一下。

大家好,我是愛學(xué)習(xí)的小xiong熊妹。

今天來說說假設(shè)檢驗(yàn)。這是個(gè)古老的方法,近年ABtest大行其道,使假設(shè)檢驗(yàn)方法迎來了新一波文藝復(fù)興,搞得很多小伙伴都在問:如何做假設(shè)檢驗(yàn)?那一堆似懂非懂的統(tǒng)計(jì)符號啥意思?

今天小熊妹幫大家整理了一個(gè)懶人攻略,大家抄起來用即可。可能有描述不準(zhǔn)確的地方,大神們勿噴哦。

一、假設(shè)檢驗(yàn)是干什么的?

假設(shè)檢驗(yàn)最常見的場景有兩個(gè):

3分鐘,看懂假設(shè)檢驗(yàn)

總之是吵架必備,懟人利器。

二、什么時(shí)候適合用假設(shè)檢驗(yàn)?

當(dāng)錯(cuò)誤很明顯的時(shí)候,不需要做假設(shè)檢驗(yàn)。

比如銷售、運(yùn)營的表現(xiàn)不好,可以直接取過往X天的銷售業(yè)績、運(yùn)營指標(biāo)來看。

如果銷售業(yè)績一直下滑,還有啥好說的,這時(shí)候不需要假設(shè)檢驗(yàn),直接開懟。

有些問題不那么明顯,比如上邊吐槽的產(chǎn)品壽命問題,除非產(chǎn)品用到爛,否則不知道壽命是多少。

而當(dāng)用戶遇到產(chǎn)品壽命很短的問題的時(shí)候,他們只會默默換牌子,也很少投訴“不耐用”,此時(shí)必須做抽樣檢測,就得用到假設(shè)檢驗(yàn)方法。

在論證新點(diǎn)子很好的時(shí)候,也需要先把新點(diǎn)子做出來,再做小范圍測試,此時(shí)也要用假設(shè)檢驗(yàn)方法。

總之,假設(shè)檢驗(yàn)方法適合于抽樣檢驗(yàn)/小范圍測試的場景。

三、假設(shè)檢驗(yàn)是怎么驗(yàn)的?

眾所周知:證偽比證真容易多了。證真要窮盡各種可能,證偽只要找到反例即可。

假設(shè)檢驗(yàn)的基本思路也是如此,它利用了“小概率事件,不可能在一次小范圍抽樣中發(fā)生”的樸素原理,先提一個(gè)假設(shè),之后看能否用小概率事件推翻它。

能推翻的,就說明假設(shè)不成立;不能推翻,就至少說明不能推翻(是否接受假設(shè),可以再驗(yàn)證)。

基于這個(gè)原理,我們一般把要懟翻的結(jié)論,作為原假設(shè),然后試著去懟翻它!(如下圖)

3分鐘,看懂假設(shè)檢驗(yàn)

很多小伙伴在這里犯迷糊:到底原假設(shè)是啥?

最簡單的判斷方法,就是:想懟翻什么,就把什么放原假設(shè)(記得帶等號的一定在原假設(shè))。

不過實(shí)踐的時(shí)候,還是經(jīng)常會寫錯(cuò),這里需要多加練習(xí)才行。

設(shè)定原假設(shè)以后,還要設(shè)定“小概率事件”到底有多小。

一般用顯著性水平α來表示。α是一個(gè)人工給定的數(shù),一般給0.10,0.05,0,01看起來夠小就行。

四、得到假設(shè)以后怎么操作?

得到假設(shè)后,需要選擇合適的檢驗(yàn)統(tǒng)計(jì)量,代入?yún)?shù),計(jì)算是否屬于小概率事件。

檢驗(yàn)統(tǒng)計(jì)量,和要檢驗(yàn)的假設(shè)有關(guān)系。

比如上述產(chǎn)品使用壽命問題,是一個(gè)典型的單總體(只有一個(gè)產(chǎn)品要檢驗(yàn))+均值(使用壽命,指的是待檢測產(chǎn)品的平均壽命)檢驗(yàn)問題,因此可以選用t檢驗(yàn)。

如果是比例檢驗(yàn)問題(比如檢驗(yàn)產(chǎn)品的合格率,合格率=問題樣本/全部抽檢樣本),則可以使用Z統(tǒng)計(jì)量(如下圖)

3分鐘,看懂假設(shè)檢驗(yàn)

有了統(tǒng)計(jì)量以后,可以檢驗(yàn)是否屬于小概率事件。不同的假設(shè),拒絕不同。

3分鐘,看懂假設(shè)檢驗(yàn)

關(guān)于拒絕區(qū)域,有個(gè)簡單的記憶方法,就是:

  • 如果假設(shè)是等號,拒絕區(qū)域就是左右兩側(cè)。潛臺詞就是:既然咱倆相等,那檢驗(yàn)值應(yīng)該不大不小才對。
  • 如果假設(shè)是小于號,拒絕區(qū)域就是右側(cè)。潛臺詞就是:既然你比我小,那檢驗(yàn)值肯定不太大呀。
  • 如果假設(shè)是大于號,拒絕區(qū)域就是左側(cè)。潛臺詞就是:既然你比我大,那檢驗(yàn)值肯定不能太小呀。

這樣就容易區(qū)分了。

當(dāng)然,有很多統(tǒng)計(jì)軟件/算法直接給了P值,大家記得:P值小于0.05就拒絕原假設(shè)即可。

五、看個(gè)簡單的例子

某產(chǎn)品經(jīng)理宣稱,目標(biāo)用戶80%都是年輕人(25歲以下),現(xiàn)隨機(jī)抽樣200人,發(fā)現(xiàn)146名年齡在25歲以下,問:我們能懟翻產(chǎn)品經(jīng)理的結(jié)論不?

解答過程如下:

3分鐘,看懂假設(shè)檢驗(yàn)

原假設(shè)被拒絕掉了,我們可以認(rèn)為產(chǎn)品經(jīng)理在吹逼,打完收工!

六、從假設(shè)檢驗(yàn)到ABtest

實(shí)際上,假設(shè)檢驗(yàn)的類型很豐富。

為了小伙伴們理解方便,上邊舉的是最簡單的單總體問題。

單總體問題,常見于已經(jīng)有了一個(gè)預(yù)設(shè)結(jié)論,之后推翻這個(gè)結(jié)論的情況。

比如證明新版本A比老版本的數(shù)據(jù)好看。

我們常說的ABtest,如果是真的是設(shè)計(jì)兩個(gè)版本A版和B版,之后再檢驗(yàn)AB版的區(qū)別,則涉及2個(gè)總體的均值/比例檢驗(yàn),需要用到不同的統(tǒng)計(jì)量。

以上檢驗(yàn)均值/比例的方法,統(tǒng)稱參數(shù)檢驗(yàn),還有非參數(shù)檢驗(yàn),比如檢驗(yàn)身高和體重之間是否有關(guān)系。

這些方法在實(shí)際工作中有不同的應(yīng)用場景,之后再慢慢介紹吧。

 

作者:碼工小熊,微信公眾號:碼工小熊

本文由 @碼工小熊 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!