Deepseek幫我生成了分析預(yù)測(cè)報(bào)告

0 評(píng)論 1735 瀏覽 2 收藏 12 分鐘
B端产品经理要负责对目标行业和市场进行深入的分析和调研,了解客户的需求、痛点、期望和行为,找到产品的价值主张 🔗

隨著人工智能技術(shù)的飛速發(fā)展,AI工具在數(shù)據(jù)分析和預(yù)測(cè)領(lǐng)域的應(yīng)用越來(lái)越廣泛。本文作者通過(guò)實(shí)際操作,展示了如何利用DeepSeek這一AI工具,僅用31天的假訂單量數(shù)據(jù),成功預(yù)測(cè)未來(lái)7天的訂單量。

Deepseek+數(shù)據(jù)分析師,這個(gè)組合有點(diǎn)王炸。

數(shù)據(jù)分析師、商業(yè)分析師常處理的經(jīng)營(yíng)情況分析、產(chǎn)品迭代分析、市場(chǎng)調(diào)研、規(guī)模預(yù)測(cè)等等這些工作,在deep seek的幫助下,一個(gè)人就是一個(gè)團(tuán)隊(duì),大大提高了效率。以下是一個(gè)數(shù)據(jù)分析場(chǎng)景:未來(lái)趨勢(shì)預(yù)測(cè)。

什么場(chǎng)景下會(huì)用到時(shí)間序列分析

  • 每年年末或年初,做預(yù)算規(guī)劃或目標(biāo)設(shè)定時(shí),會(huì)根據(jù)歷史基線、增長(zhǎng)速度等給下一年定個(gè)目標(biāo)值。
  • 或者需要根據(jù)季節(jié)性、周期性特點(diǎn),以及短期內(nèi)的銷(xiāo)售情況,對(duì)未來(lái)庫(kù)存進(jìn)行預(yù)估,更及時(shí)地進(jìn)行備貨調(diào)整。
  • 或者未來(lái)想開(kāi)拓一個(gè)新業(yè)務(wù),預(yù)估未來(lái)市場(chǎng)有多大潛力空間。
  • 又或者在推薦等模型優(yōu)化時(shí)將預(yù)測(cè)值作為輸入特征。

……

Deepseek生成的時(shí)間序列分析報(bào)告

抱著好奇心態(tài),看看到底deep seek能解放我雙手多少,我給了它31天的假訂單量數(shù)據(jù),讓它幫我預(yù)測(cè)未來(lái)7天的訂單量。經(jīng)過(guò)幾輪對(duì)話達(dá)到了基本要求,內(nèi)容如下:

時(shí)間序列模型原理

適用于中短期

1. 移動(dòng)平均

看公式很容易理解,間隔為n的時(shí)間窗口內(nèi)的平均值,該值可作為T(mén)+1的預(yù)估值,適用場(chǎng)景通常為趨勢(shì)穩(wěn)定的數(shù)據(jù),如果數(shù)據(jù)有周期性,會(huì)出現(xiàn)預(yù)測(cè)峰谷值同實(shí)際錯(cuò)位的情況。

2. 簡(jiǎn)單指數(shù)平滑

y^為預(yù)測(cè)值,y為實(shí)際值,α為平滑系數(shù),范圍(0,1),α越大近期更敏,感適合波動(dòng)較大的數(shù)據(jù),反之越平滑適合穩(wěn)定趨勢(shì)。T+1的預(yù)測(cè)值,為t天實(shí)際值和預(yù)測(cè)值的加權(quán)所得。

3. Holt-Winters

包含水平平滑、趨勢(shì)平滑、季節(jié)性平滑。

水平平滑

趨勢(shì)平滑

季節(jié)性平滑

幾個(gè)參數(shù):

  • St:當(dāng)前季節(jié)分
  • m:季節(jié)周期(如m=12為以月為周期,12個(gè)月為一個(gè)循環(huán))
  • α、β、γ分別為水平、趨勢(shì)、季節(jié)性平滑參數(shù),范圍(0,1)
  • h:步長(zhǎng),預(yù)測(cè)是跨幾個(gè)步長(zhǎng)進(jìn)行預(yù)測(cè),一般是1
  • k=[(h-1)/m]+1

有點(diǎn)抽象,舉個(gè)例子說(shuō)明,假如如下對(duì)應(yīng)每個(gè)季度的商品銷(xiāo)售量,現(xiàn)在想要預(yù)測(cè)2025Q1(t=9)的銷(xiāo)量

假設(shè)參數(shù)設(shè)定:α=0.3(水平) β=0.2(趨勢(shì)) γ=0.1(季節(jié)性),季節(jié)周期:m=4

初始化預(yù)測(cè)參數(shù):

  • l4=(100+120+140+160)/4=130,即前4個(gè)季度的平均值,
  • b4=平均季度增長(zhǎng)=[(120-100)+(140-120)+(160-140)]/3=6.67s1=100-130=-30,
  • s2=120-130=-10,s3=140-130=10,s4=160-130=30

預(yù)測(cè)2024Q1(t=5):y5預(yù)估=l4+b4+s5-4=130+6.67-30=106.67,實(shí)際y5=120更新預(yù)測(cè)參數(shù),即t=5對(duì)應(yīng)的預(yù)估值,

  • l5=0.3(120+30)+0.7(130+6.67)=140.67
  • b5=0.2(140.67-130)+0.8*6.67=7.47
  • s5=0.1(120-130-6.67)+0.9(-30)=-28.67

以此類(lèi)推,可得到y(tǒng)9預(yù)估值=l8+1*b8+s9-4*2=149.63

雖然手動(dòng)算麻煩一點(diǎn),但以上這兩種方式,確實(shí)可以通過(guò)計(jì)算看到數(shù)據(jù)和趨勢(shì)變化如何產(chǎn)生。

適用于中長(zhǎng)期

接下來(lái)要聊的兩種方法,就不足以通過(guò)手動(dòng)計(jì)算了。4. ARIMA(p,d,q)。時(shí)間序列預(yù)測(cè)很古典和著名的方法。

模型是由三部分組成:

1)自回歸部分AR

p為參數(shù),核心解決的是預(yù)測(cè)未來(lái)的數(shù)據(jù),應(yīng)該選歷史多少個(gè)時(shí)間點(diǎn)的數(shù)據(jù)更好,最遠(yuǎn)的時(shí)間是t-p,因此p為參數(shù)。

2)移動(dòng)平均部分MA

q為參數(shù),要解決的是y實(shí)際值和y預(yù)測(cè)值之間的差,選擇歷史上多少個(gè)時(shí)間點(diǎn)更好,最遠(yuǎn)時(shí)間為t-q,因此q為參數(shù)。

3)差分部分,d為參數(shù),要解決的是 yt-yt-1這樣做幾階差分更好,為的是把非平穩(wěn)的數(shù)據(jù)轉(zhuǎn)換為平穩(wěn)數(shù)據(jù)。先通過(guò)ADF檢驗(yàn)對(duì)d進(jìn)行差分檢驗(yàn)(與統(tǒng)計(jì)臨界值對(duì)比),在通過(guò)ACF(自相關(guān)函數(shù))和PACF(偏自相關(guān)函數(shù))分別對(duì)p和q進(jìn)行檢驗(yàn),通過(guò)AIC和BIC對(duì)模型復(fù)雜性評(píng)估后可得到更為合理的p、q值。

5. Prophet。時(shí)間序列進(jìn)化到Prophet,操作更友好了。

模型是由三個(gè)小模型組成:?t 為誤差項(xiàng)g(t):增長(zhǎng)和分段線性模型(線性或者邏輯回歸函數(shù))s(t):周期性和季節(jié)性模型(正弦和余弦組合函數(shù))h(t):節(jié)假日或特殊事件模型(線性函數(shù))該模型很好理解,且命中了趨勢(shì)預(yù)測(cè)里經(jīng)常要思考的幾個(gè)問(wèn)題:如果趨勢(shì)有上升和下降幾段趨勢(shì)怎么辦?周期性的數(shù)據(jù)并非完全自然周期怎么辦?遇上突發(fā)事件出現(xiàn)某個(gè)點(diǎn)異常怎么辦?過(guò)往的時(shí)間序列模型很難進(jìn)行擬合和描述,不過(guò)Prophet解決了這個(gè)問(wèn)題。這里對(duì)具體公式不詳細(xì)展開(kāi),感興趣可在參考資料里了解,這里主要介紹模型參數(shù)的作用,對(duì)實(shí)操會(huì)更有幫助。

  • growth(增長(zhǎng)函數(shù)類(lèi)型):linear(默認(rèn)):線性增長(zhǎng),適用于無(wú)明確上限的趨勢(shì)(如銷(xiāo)售額),logistic:邏輯回歸增長(zhǎng),適用于有增長(zhǎng)上限的場(chǎng)景(如用戶數(shù));
  • changepoint_prior_scale(變點(diǎn)靈敏度):0.001~0.5(默認(rèn) 0.05),若預(yù)測(cè)結(jié)果過(guò)于平滑(欠擬合)增大該值,若預(yù)測(cè)結(jié)果波動(dòng)劇烈(過(guò)擬合),減小該值;
  • n_changepoints(變點(diǎn)數(shù)量):25(均勻分布在時(shí)間序列前80%區(qū)間),越大將趨勢(shì)變化切分越多;
  • seasonality_prior_scale(季節(jié)性強(qiáng)度):0.01~10(默認(rèn)10),值越大季節(jié)性波動(dòng)越大;add_seasonality(傅里葉階數(shù)):name=’yearly’, period=365.25, fourier_order=12,fourier_order越大階數(shù)越高擬合越復(fù)雜,name對(duì)應(yīng)的是yearly,weekly,daily或者命名一個(gè),period寫(xiě)對(duì)應(yīng)周期;
  • holidays_prior_scale(節(jié)假日效應(yīng)強(qiáng)度):0.01~10(默認(rèn) 10),值越大節(jié)假日波動(dòng)越強(qiáng)。節(jié)假日窗口,比如雙11大促 :holidays_df = pd.DataFrame({‘holiday’: ‘promo’,’ds’: pd.to_datetime([‘2022-11-11’, ‘2023-11-11’, ‘2024-11-11′]),’lower_window’: -30, #雙11前30天’upper_window’: 2 #雙11后2天})

后邊也有新的升級(jí) Neural Prophet,如果感興趣也可以再查找了解。

如何評(píng)估模型效果

預(yù)測(cè)時(shí)數(shù)據(jù)會(huì)切分成兩部分,訓(xùn)練集和測(cè)試集,評(píng)估模型效果簡(jiǎn)單來(lái)講就是拿訓(xùn)練集得到模型,后再去預(yù)測(cè)測(cè)試集對(duì)應(yīng)的數(shù)值,把測(cè)試集的真實(shí)結(jié)果同預(yù)測(cè)結(jié)果比對(duì),差異越小說(shuō)明預(yù)測(cè)越準(zhǔn)確,但也要兼顧魯棒性,注意不要過(guò)擬合。

幾個(gè)線性模型評(píng)價(jià)模型準(zhǔn)確度的指標(biāo)和計(jì)算公式如下,比較簡(jiǎn)單就不做過(guò)多解釋了。MAE 平均絕對(duì)誤差

RMSE 均方根誤差

MAPE 平均絕對(duì)百分比誤差(使用時(shí)不能有0,且去量綱可比較不同數(shù)據(jù)集)

參考資料

知乎文章 《時(shí)間序列原理篇之Facebook Prophet算法》

知乎文章《時(shí)間序列模型(四):ARIMA模型》

作者:小王子和小企鵝,公眾號(hào):小王子和小企鵝 ?

@小王子和小企鵝 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!
专题
72033人已学习13篇文章
产品经理天天跟“需求”打交道,产品经理的核心价值就是处理“需求”的能力。
专题
14083人已学习12篇文章
“产品架构能力”是B2B产品经理中泛指设计产品系统架构的能力,这是产品经理非常重要的一个能力。本专题的文章分享了产品架构的设计指南。
专题
12302人已学习14篇文章
大多数产品经理都会经历职场晋升和转正述职的时刻,这个时候,你该怎么做准备?本专题的文章分享了述职报告撰写指南。
专题
16849人已学习14篇文章
RFM模型是与用户价值相关的常见模型之一。本专题的文章分享了什么是RFM模型?如何应用RFM模型?
专题
19820人已学习13篇文章
本专题的文章分享了TO G产品的入门指南,包括什么是G端产品、产品的特点...
专题
31701人已学习21篇文章
产品经理每月必须做的事情,10个用户调查,关注100个用户博客,收集1000个用户的反馈。