假設(shè)檢驗(yàn)法在商用機(jī)器人業(yè)務(wù)中的實(shí)際應(yīng)用
編輯導(dǎo)讀:假設(shè)檢驗(yàn)是用來判斷樣本與樣本、樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計(jì)推斷方法,是統(tǒng)計(jì)學(xué)中非常重要的方法論之一,有非常廣泛的應(yīng)用。本文作者將以商業(yè)機(jī)器人行業(yè)為例,分析假設(shè)檢驗(yàn)法在商用機(jī)器人業(yè)務(wù)中的實(shí)際應(yīng)用,與你分享。
假設(shè)檢驗(yàn)是統(tǒng)計(jì)學(xué)中非常重要的方法論之一,在實(shí)際業(yè)務(wù)中的應(yīng)用也非常廣泛,生物,醫(yī)藥乃至互聯(lián)網(wǎng)行業(yè)內(nèi)著名的AB test,其本質(zhì)都是假設(shè)檢驗(yàn)。
基于筆者目前所在的商用機(jī)器人行業(yè),結(jié)合理論和實(shí)踐,設(shè)計(jì)了如下的實(shí)驗(yàn),其目的是去論證對于機(jī)器人的平均速度的影響因素(由于數(shù)據(jù)和結(jié)論的敏感性,不作披露,希望能夠拋磚引玉,將假設(shè)檢驗(yàn)的方法論應(yīng)用到更為廣泛的業(yè)務(wù)中)。
一、什么是假設(shè)檢驗(yàn)
假設(shè)檢驗(yàn)即小概率反證法,在假設(shè)的前提下,估算某事件發(fā)生的可能性,如果該事件是小概率事件,在一次研究中本來是不可能發(fā)生的,現(xiàn)在發(fā)生了,這時(shí)候就可以推翻之前的假設(shè),接受備擇假設(shè)。如果該事件不是小概率事件,我們就找不到理由來推翻之前的假設(shè),實(shí)際中可引申為接受所做的無效假設(shè)。
理論支撐:
- 樣本來推斷總體(需要保證樣本的隨機(jī)性)
- 中心極限定理可知,當(dāng)樣本數(shù)足夠時(shí)(n>30),樣本的抽樣分布可近似于正態(tài)分布。
著名的假設(shè)檢驗(yàn)方法有U(Z檢驗(yàn)),T檢驗(yàn),F(xiàn)檢驗(yàn),卡方檢驗(yàn)等。這里重點(diǎn)介紹有關(guān)平均值參數(shù)的假設(shè)檢驗(yàn)方法:
已知總體方差,用U(Z檢驗(yàn))
如果檢驗(yàn)一組樣本平均數(shù)(X)與已知的總體平均數(shù)(μ0)的差異是否顯著:
X是檢驗(yàn)樣本的均值;μ0是已知總體的平均數(shù);S是總體的標(biāo)準(zhǔn)差;n是樣本容量。
如果檢驗(yàn)來自兩個(gè)的兩組樣本平均數(shù)的差異性,從而判斷它們各自代表的總體的差異是否顯著:
未知總體方差,樣本含量較?。ɡ鏽<30)且服從正太分布,采用T檢驗(yàn)
如果要評斷一個(gè)總體中的小樣本平均數(shù)與總體平均值之間的差異程度:
如果要評斷兩組樣本平均數(shù)之間的差異程度,其統(tǒng)計(jì)量T值的計(jì)算公式為:
二、實(shí)驗(yàn)組
考慮到目前機(jī)器人運(yùn)行速度的整體分布狀態(tài)未知(簡單根據(jù)分布圖來看,并不能完全判斷是正態(tài)分布)。所以,現(xiàn)考慮設(shè)計(jì)以下三組實(shí)驗(yàn)記錄,再考慮使用Z檢驗(yàn)來判斷避障/調(diào)度是否影響了機(jī)器人的平均速度,且該影響是否顯著
- 第一組:同一機(jī)器人在完全不發(fā)生避障,調(diào)度等情況下的成功運(yùn)行記錄(33條)并計(jì)算出該33條記錄的平均速度u1
- 第二組:同一機(jī)器人在只發(fā)生避障情況下的成功運(yùn)行記錄(33條)并計(jì)算出該33條記錄的平均速度u2
- 第三組:同一機(jī)器人在只發(fā)生調(diào)度情況下的成功運(yùn)行記錄(33條)并計(jì)算出該33條記錄的平均速度u3
假設(shè)檢驗(yàn)一:
原假設(shè)(H0):u1 = u2 (即避障不會(huì)影響機(jī)器人的運(yùn)行速度)
備擇假設(shè)(H1):u1 != u2(即避障會(huì)影響機(jī)器人的運(yùn)行速度)
假設(shè)檢驗(yàn)二:
原假設(shè)(H0):u1 = u3 (即調(diào)度不會(huì)影響機(jī)器人的運(yùn)行速度)
備擇假設(shè)(H1):u1 != u3(即調(diào)度會(huì)影響機(jī)器人的運(yùn)行速度)
由于是雙獨(dú)立樣本,且未知分布,綜合考慮采用Z檢驗(yàn),采集數(shù)據(jù)后,選擇相應(yīng)的scipy函數(shù)(https://docs.scipy.org/doc/scipy/reference/stats.html),如果計(jì)算出z值遠(yuǎn)大于1.96,p值無限接近0,幾乎不可能發(fā)生,即拒絕了原假設(shè),接受了備選假設(shè);否則反之。
三、復(fù)盤
如果關(guān)于調(diào)度,避障之類的影響因素有現(xiàn)成的數(shù)據(jù)可以分析,其實(shí)大可不必線下人工去統(tǒng)計(jì),一是樣本量過小;二是人工統(tǒng)計(jì)時(shí)間,里程等因素費(fèi)時(shí)費(fèi)力;筆者已將開發(fā)這部分?jǐn)?shù)據(jù)的需求整理,提交至開發(fā)排期。
本文由 @南仔 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
- 目前還沒評論,等你發(fā)揮!