A/B測(cè)試算法大揭秘 | 一切都從這個(gè)定理開始

2 評(píng)論 12935 瀏覽 61 收藏 5 分鐘

對(duì)于通過A/B測(cè)試來優(yōu)化產(chǎn)品的用戶而言,置信區(qū)間無疑是最關(guān)注的元素之一,它可以反映出試驗(yàn)版本與對(duì)照版本之間的真實(shí)提升范圍。但是置信區(qū)間背后的原理,以及具體的計(jì)算方法是怎樣的?從今日起,我們將為你逐步揭開置信區(qū)間的神秘面紗,解答你的疑惑。本文是第一章,一切先從奠基性的定理——中心極限定理說起。

關(guān)于正態(tài)分布

在正式介紹中心極限定理之前,需要先了解一下什么是“正態(tài)分布”。

以擲2顆骰子為例,對(duì)所擲的點(diǎn)數(shù)求和并將數(shù)值在坐標(biāo)軸上標(biāo)記出來,當(dāng)擲出次數(shù)增大到無限時(shí),坐標(biāo)軸上的散點(diǎn)就會(huì)呈現(xiàn)出“正態(tài)分布”的形式。

因其曲線形態(tài)呈現(xiàn)出兩頭低、中間高、左右對(duì)稱的樣式,正態(tài)分布又被稱為鐘形曲線。它是概率分布函數(shù)里最重要的一個(gè)分布類型,體現(xiàn)了隨機(jī)性的最基本規(guī)律。

在正態(tài)分布的表達(dá)式中,有幾個(gè)比較重要的參數(shù):樣本均值x、總體均值μ、方差σ??v軸表示概率密度,橫軸表現(xiàn)隨機(jī)變量的值,曲線與橫軸間構(gòu)成的面積求和為1,表示所有可能的取值加起來的概率是100%。

其實(shí),正態(tài)分布在生活中有著相當(dāng)廣泛的應(yīng)用:如根據(jù)考生成績的正態(tài)分布規(guī)律來判斷本次試卷的命題難度,憑借同質(zhì)群體的身體機(jī)能狀況來界定醫(yī)學(xué)參考值范圍等。

兩種青年對(duì)中心極限定理的兩種表達(dá)

那我們今天的主角——中心極限定理,與正態(tài)分布有什么聯(lián)系嗎?

關(guān)于中心極限定理的表達(dá)方式其實(shí)有很多種,在這里,我們選取了和A/B測(cè)試較為相關(guān)的兩種表達(dá),供大家參考:

普通青年:從總體中隨機(jī)抽取一個(gè)樣本量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從正態(tài)分布。

普通青年對(duì)于中心極限定理的理解較為直觀,但對(duì)于某些隨機(jī)變量來說,簡單的樣本均值分布并不滿足正態(tài)分布的形態(tài)。

針對(duì)隨機(jī)變量的具體分布情況,文藝青年有著更為科學(xué)的見解:

多個(gè)相互獨(dú)立的隨機(jī)變量,他的均值(和)的分布是以正態(tài)分布為極限,也就是逼近正態(tài)分布,與隨機(jī)變量的具體分布無關(guān)。

也就是說,無論現(xiàn)有的樣本數(shù)據(jù)是什么樣的分布,只要通過均值或者和的方式對(duì)變量數(shù)據(jù)進(jìn)行組合轉(zhuǎn)換,最終得到的具體分布類型肯定是正態(tài)分布狀態(tài)。所以我們?cè)谔幚硐嚓P(guān)數(shù)據(jù)時(shí),并不需要這個(gè)數(shù)據(jù)一定是正態(tài)分布的表現(xiàn)。

1656dc8e348025a380adf1b48b032b02_b

中心極限定理在A/B測(cè)試中的應(yīng)用

中心極限定理是概率論中最重要的一類定理,它支撐著和置信區(qū)間相關(guān)的T檢驗(yàn)和假設(shè)檢驗(yàn)的計(jì)算公式和相關(guān)理論。如果沒有這個(gè)定理,之后的推導(dǎo)公式都是不成立的。

事實(shí)上,以上對(duì)于中心極限定理的兩種解讀,在不同的場(chǎng)景下都可以對(duì)A/B測(cè)試的指標(biāo)置信區(qū)間判定起到一定作用。

對(duì)于屬于正態(tài)分布的指標(biāo)數(shù)據(jù),我們可以很快捷地對(duì)它進(jìn)行下一步假設(shè)檢驗(yàn),并推算出對(duì)應(yīng)的置信區(qū)間;而對(duì)于那些不屬于正態(tài)分布的數(shù)據(jù),根據(jù)中心極限定理,在樣本容量很大時(shí),總體參數(shù)的抽樣分布是趨向于正態(tài)分布的,最終都可以依據(jù)正態(tài)分布的檢驗(yàn)公式對(duì)它進(jìn)行下一步分析。

不過,了解了中心極限定理,只是完成了最基礎(chǔ)的部分。要想真正了解A/B測(cè)試和置信區(qū)間,還需要走很長一段路。第二章,我們將向你講述假設(shè)檢驗(yàn)。

 

作者:王曄,吆喝科技創(chuàng)始人兼 CEO

本文由 @王曄 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 測(cè)試用例

    來自河北 回復(fù)
  2. 好多統(tǒng)計(jì)學(xué)的知識(shí)~~~能不能寫分享一篇統(tǒng)計(jì)的理論呢? ?? ?? ??

    來自廣東 回復(fù)