一文搞懂“預(yù)測(cè)模型”:原理、模型、流程
在數(shù)據(jù)分析和商業(yè)決策中,預(yù)測(cè)模型是不可或缺的工具,但如何構(gòu)建準(zhǔn)確且實(shí)用的預(yù)測(cè)模型一直是數(shù)據(jù)領(lǐng)域的難題。本文將深入探討預(yù)測(cè)模型的核心原理、常見(jiàn)模型類(lèi)型以及實(shí)際應(yīng)用中的關(guān)鍵流程。
“到底怎么預(yù)測(cè)才準(zhǔn)?”是數(shù)據(jù)領(lǐng)域終極難題。太多文章,在介紹預(yù)測(cè)方法本身,而具體到實(shí)際中:
1、可以用的數(shù)據(jù)非常少。
2、預(yù)測(cè)出來(lái)領(lǐng)導(dǎo)不滿(mǎn)意,讓再改改。
3、實(shí)際情況差距大,領(lǐng)導(dǎo)還是不滿(mǎn)意!
到底怎么辦?!今天一篇文章講清楚。
一、預(yù)測(cè)算法的本質(zhì)
從本質(zhì)上看,預(yù)測(cè)算法只有2大類(lèi):
1、基于時(shí)間序列的
- 平滑:用于相對(duì)平穩(wěn)的數(shù)據(jù)。
- 自回歸:用于趨勢(shì)性遞增、遞減的數(shù)據(jù)。
- 帶季節(jié)因素自回歸:用于有周期性波動(dòng)的數(shù)據(jù)。
基于時(shí)間序列的預(yù)測(cè),最大優(yōu)勢(shì)在于:不需要很多數(shù)據(jù)(如下圖)只需要一個(gè)指標(biāo)(比如收入/用戶(hù)數(shù)/訂貨數(shù)量)即可。
2、基于因果關(guān)系的
- 二分類(lèi)問(wèn)題:未來(lái)會(huì)/不會(huì)發(fā)生XX,典型如LR。
- 多分類(lèi)問(wèn)題:未來(lái)是ABC哪個(gè)情況,典型如決策樹(shù)。
- 連續(xù)型問(wèn)題:未來(lái)的數(shù)值是多少,典型如線性回歸。
因果關(guān)系類(lèi)模型,對(duì)于有投入產(chǎn)出的情況更管用,更能體現(xiàn):“一分錢(qián)一分貨”的關(guān)系。
不過(guò)現(xiàn)實(shí)中, 影響產(chǎn)出因素很多,往往很難收集到足夠多數(shù)據(jù),實(shí)操的預(yù)測(cè)誤差可能比時(shí)間序列還大(如下圖)。
這是兩種基礎(chǔ)思路,在實(shí)操中,還要解決更多問(wèn)題。
二、現(xiàn)實(shí)中難點(diǎn)
現(xiàn)實(shí)中,缺少數(shù)據(jù)是頭號(hào)問(wèn)題,很多時(shí)候,領(lǐng)導(dǎo)就是扔給你一個(gè)excel表+幾個(gè)數(shù)字,讓你預(yù)測(cè)……巧婦難為無(wú)米之炊,很多時(shí)候,時(shí)間序列法是唯一選擇,因?yàn)榫鸵粋€(gè)指標(biāo)+十幾個(gè)數(shù),沒(méi)得選……
現(xiàn)實(shí)中第二大麻煩,是怎么衡量預(yù)測(cè)準(zhǔn)確度。
比如預(yù)測(cè)銷(xiāo)量是1000萬(wàn):
業(yè)務(wù)做到900萬(wàn),會(huì)說(shuō):預(yù)測(cè)得一點(diǎn)都不準(zhǔn),搞得貨積壓了
業(yè)務(wù)做到1100萬(wàn),會(huì)說(shuō):預(yù)測(cè)得一點(diǎn)都不準(zhǔn),還是我厲害
總之,只要你不是100%精準(zhǔn),業(yè)務(wù)都有理由賴(lài)到你頭上。甚至可以反復(fù)橫跳。比如:“本來(lái)業(yè)務(wù)能達(dá)標(biāo)的,看到預(yù)測(cè)說(shuō)能達(dá)標(biāo),我們就省點(diǎn)投入,結(jié)果不達(dá)標(biāo)了,都怪預(yù)測(cè)干擾了業(yè)務(wù)判斷……”
因此,在實(shí)際工作中,不能孤零零只談模型,要和業(yè)務(wù)動(dòng)作結(jié)合起來(lái),綜合提升效果。
三、用業(yè)務(wù)手段,提升準(zhǔn)確度
所有的互聯(lián)網(wǎng)營(yíng)銷(xiāo)模式,從小米到天貓到拼多多,都在用業(yè)務(wù)手段,對(duì)抗預(yù)測(cè)的不足,比如:
場(chǎng)景1:“貨物本身不耐儲(chǔ)藏,多進(jìn)貨的話(huà)庫(kù)存損失率會(huì)很高,但銷(xiāo)售數(shù)量又很少,數(shù)據(jù)確實(shí)很多”——用團(tuán)購(gòu),成團(tuán)了才采購(gòu)
場(chǎng)景2:“銷(xiāo)售數(shù)據(jù)很少,少到無(wú)法計(jì)算價(jià)格彈性,業(yè)務(wù)方又想預(yù)測(cè)價(jià)格彈性,多賺錢(qián)”——用拍賣(mài),少量用戶(hù)競(jìng)價(jià),獲得更高價(jià)格
場(chǎng)景3:“新品是全新款,沒(méi)有數(shù)據(jù),咋預(yù)測(cè)?”——做新品預(yù)售/粉絲憑碼購(gòu)買(mǎi),測(cè)試用戶(hù)群體規(guī)模
場(chǎng)景4:“大促期間備貨量難預(yù)測(cè)?拿捏不準(zhǔn)用戶(hù)有多少需求?”——讓用戶(hù)先付10元定金,定金膨脹3倍,提前鎖定訂單
凡是有業(yè)務(wù)手段可以用的,優(yōu)先上業(yè)務(wù)手段,人家大廠都沒(méi)能力100%精準(zhǔn)預(yù)測(cè),小廠就更別逞能了
四、用基礎(chǔ)分析縮小預(yù)測(cè)范圍
在實(shí)際工作中,大部分業(yè)務(wù)場(chǎng)景不需要100%精確度,業(yè)務(wù)本身就有波動(dòng)。,業(yè)務(wù)怕的是突然暴增/暴跌的場(chǎng)景。預(yù)測(cè)目標(biāo)與其設(shè)定為:“100%精準(zhǔn)”,不如設(shè)定為:“是否暴增/暴跌超過(guò)業(yè)務(wù)消化能力”。
預(yù)測(cè)100%精準(zhǔn)基本無(wú)解,但是發(fā)現(xiàn)哪里可能暴漲/暴跌是很容易的。通過(guò)基礎(chǔ)分析,把不穩(wěn)定因素區(qū)分出來(lái),能大大縮減預(yù)測(cè)問(wèn)題的難度(如下圖)。
做好基礎(chǔ)分析,拆分不穩(wěn)定因素以后,也更方便挑選模型組合,解決問(wèn)題(如下圖)。
五、用滾動(dòng)式預(yù)測(cè)代替長(zhǎng)期預(yù)測(cè)
預(yù)測(cè)時(shí)間周期越長(zhǎng),自然偏差越打。用滾動(dòng)預(yù)測(cè)能很大程度彌補(bǔ)這個(gè)缺點(diǎn)。
通過(guò)日/周滾動(dòng)預(yù)測(cè),既能補(bǔ)充數(shù)據(jù)缺失,又能反映業(yè)務(wù)方臨時(shí)調(diào)整帶來(lái)的效果,一舉兩得(如下圖)。
六、用買(mǎi)定離手模式保護(hù)自己
一個(gè)好問(wèn)題+滾動(dòng)預(yù)測(cè),基本上能滿(mǎn)足實(shí)際工作需求。但作為做預(yù)測(cè)的人,得學(xué)會(huì)保護(hù)自己,避免業(yè)務(wù)方反復(fù)橫條,瞎胡甩鍋。
買(mǎi)定離手法是很好辦法。預(yù)測(cè)結(jié)果給出以后,買(mǎi)定離手,所有相關(guān)業(yè)務(wù)方不再質(zhì)疑預(yù)測(cè)結(jié)果,而是基于預(yù)測(cè)結(jié)果做疊加。
誰(shuí)覺(jué)得預(yù)測(cè)少了,誰(shuí)自己寫(xiě)請(qǐng)示申請(qǐng)額外貨物,并且留下書(shū)面證據(jù)。到時(shí)候是預(yù)測(cè)得不準(zhǔn),還是業(yè)務(wù)自己申請(qǐng)多了所以賣(mài)不動(dòng),看得一清二楚(如下圖)。
七、再深層地看預(yù)測(cè)問(wèn)題
從本質(zhì)上看,如果業(yè)務(wù)發(fā)展可控,自然沒(méi)人需要賭命:
1、了解業(yè)務(wù)規(guī)律,把握常規(guī)走勢(shì)
2、通過(guò)基礎(chǔ)分析,找到波動(dòng)來(lái)源
3、采取業(yè)務(wù)手段,規(guī)避波動(dòng)風(fēng)險(xiǎn)
這樣的組合拳,比盲目賭命管用的多。
本文由人人都是產(chǎn)品經(jīng)理作者【接地氣的陳老師】,微信公眾號(hào):【接地氣的陳老師】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!