用數(shù)據(jù)優(yōu)化運(yùn)營(yíng):3個(gè)案例帶你用數(shù)據(jù)留住用戶(hù)

0 評(píng)論 8659 瀏覽 70 收藏 30 分鐘

通過(guò)產(chǎn)品數(shù)據(jù)的剖析,我們能夠洞察用戶(hù)行為、習(xí)慣以及他們對(duì)產(chǎn)品的使用反饋,并策劃出優(yōu)化后的產(chǎn)品策略。所以掌握數(shù)據(jù)挖掘與分析思維顯得格外重要,那么如何掌握這一思維方式呢?

立志要在互聯(lián)網(wǎng)闖蕩的運(yùn)營(yíng)新人們抓耳撓腮地在電腦面前看著運(yùn)營(yíng)課程,用戶(hù)量下滑,留存營(yíng)收莫名其妙地下降,老板指著一個(gè)月比一個(gè)月難看的數(shù)據(jù)說(shuō)你不適合這個(gè)崗位。

對(duì)于運(yùn)營(yíng)來(lái)說(shuō),這個(gè)崗位可以像地球一樣分三個(gè)層面:

  • 地核:用戶(hù)
  • 地幔:用戶(hù)在產(chǎn)品中的行為
  • 地殼:行為在產(chǎn)品中產(chǎn)出的數(shù)據(jù)

地殼部分的數(shù)據(jù)瞬息萬(wàn)變,各個(gè)新運(yùn)營(yíng)人們?cè)诋a(chǎn)品的新大陸上總是在措不及防之時(shí),就被身旁名為“次留”或者“流失”的活火山給弄得焦頭爛額。

這些變化似乎難以把控,“用戶(hù)”的本質(zhì)地核深藏在地殼下方,新人們只能在發(fā)現(xiàn)數(shù)據(jù)異常的時(shí)候趕緊收集,卻很難預(yù)知未來(lái)可能會(huì)發(fā)生的事情。

但一切數(shù)據(jù)的產(chǎn)生都是有其原因的。用戶(hù)是產(chǎn)品調(diào)性固定住的東西,產(chǎn)生出數(shù)據(jù)的用戶(hù)行為便是運(yùn)營(yíng)應(yīng)該牢牢抓住的東西。

抓住用戶(hù)行為的過(guò)程,便是我想要傳達(dá)給大家的思維——數(shù)據(jù)分析&挖掘。

下面我會(huì)通過(guò)概述和三個(gè)案例來(lái)闡述這種思維的方式:

  • 案例1:關(guān)鍵詞數(shù)據(jù)抓取優(yōu)化
  • 案例2:漏斗-對(duì)比優(yōu)化
  • 案例3:數(shù)據(jù)預(yù)測(cè)計(jì)算思路

01 數(shù)據(jù)分析&挖掘

數(shù)據(jù)分析并非信手拈來(lái)的,數(shù)據(jù)分析是有其一定的框架可遵循的。

數(shù)據(jù)分析的框架可以分為3個(gè)主要步驟:

  • 理解行業(yè)業(yè)務(wù)
  • 將數(shù)字轉(zhuǎn)化為結(jié)論
  • 結(jié)論的驗(yàn)證與實(shí)踐

1. 理解行業(yè)業(yè)務(wù)

對(duì)任何問(wèn)題的優(yōu)化,其前提都是對(duì)行業(yè)業(yè)務(wù)及崗位需求有著基本的理解。

數(shù)據(jù)只有依附在實(shí)際業(yè)務(wù)上,才能從概念轉(zhuǎn)化成具有實(shí)體意義的內(nèi)容。

2. 將數(shù)字轉(zhuǎn)化為結(jié)論

數(shù)據(jù)分析是一個(gè)分析+探索的過(guò)程。我們有時(shí)是帶著問(wèn)題和假設(shè)去分析、驗(yàn)證,有時(shí)是純粹地在數(shù)據(jù)中探索,但無(wú)論怎樣的形式,我們都需要數(shù)據(jù)將我們導(dǎo)向一個(gè)理性的結(jié)論。

獲得理性結(jié)論是一個(gè)非常關(guān)鍵的環(huán)節(jié)。當(dāng)我們跟一些同行交流下來(lái),大家在做數(shù)據(jù)分析的時(shí)候經(jīng)常得出一些看上去很正確的結(jié)果,但這些結(jié)果其實(shí)對(duì)業(yè)務(wù)指導(dǎo)的價(jià)值卻很小。

這樣的結(jié)果是因?yàn)榉治鲞€不夠深入,并且沒(méi)有把握住業(yè)務(wù)核心,才會(huì)導(dǎo)致看上去很正確的觀點(diǎn),在實(shí)際的指導(dǎo)中卻沒(méi)有很好的效果。

3. 結(jié)論的驗(yàn)證與實(shí)踐

獲取結(jié)論后,我們可以嘗試將理論投入實(shí)踐:

  • 演繹論證已有結(jié)論
  • 利用結(jié)論去優(yōu)化業(yè)務(wù)

對(duì)結(jié)論進(jìn)行演繹和論證,是從多維度證明我們的結(jié)論的可操作性。

通常我們可以用其他產(chǎn)品的已有數(shù)據(jù)去佐證這個(gè)結(jié)論,我們也可以在無(wú)數(shù)據(jù)的情況下,開(kāi)展產(chǎn)品的版本AB測(cè)試來(lái)收集數(shù)據(jù),去實(shí)驗(yàn)、驗(yàn)證結(jié)論的可行性。

無(wú)論是用什么樣的方法,都是為了證明數(shù)據(jù)獲得的理性結(jié)論,是能夠?qū)嶋H且有效地指導(dǎo)業(yè)務(wù)完成優(yōu)化。

02 數(shù)據(jù)分析三個(gè)通用思路

在梳理完數(shù)據(jù)分析框架后,我們轉(zhuǎn)向數(shù)據(jù)分析思路。數(shù)據(jù)分析思路并沒(méi)有優(yōu)劣之分,不同的分析場(chǎng)景需要不同的思路去應(yīng)對(duì),這里我列舉了三個(gè)通用的基本思路:

  • AARRR
  • RFM
  • 5W2H

1. AARRR——海盜模型

一個(gè)產(chǎn)品自上線(xiàn)開(kāi)始,AARRR模型便從用戶(hù)獲取、留存激活,再到營(yíng)收傳播等流程,貫穿了產(chǎn)品&用戶(hù)聯(lián)系的全鏈過(guò)程,整體用戶(hù)進(jìn)入產(chǎn)品后產(chǎn)生的每一板塊的數(shù)據(jù)都是分析點(diǎn)。

AARRR的思路比較適合分析產(chǎn)品的整體情況。特別是產(chǎn)品還處于早期測(cè)試階段的時(shí)候,我們就可以用這個(gè)思路去做產(chǎn)品的場(chǎng)景分析,從每一步的場(chǎng)景模擬去找到產(chǎn)品優(yōu)化改進(jìn)的點(diǎn)。

2. RFM——用戶(hù)價(jià)值分析體系

RFM是用戶(hù)價(jià)值的分層、評(píng)估體系。

我們?cè)趥鹘y(tǒng)的用戶(hù)分群模式中,將用戶(hù)直接分為:大R、中R、小R,按照累計(jì)的充值金額去粗暴地做用戶(hù)劃分,很難在這個(gè)基礎(chǔ)上做到更加精細(xì)化的策略應(yīng)對(duì)。

RFM就給出了比較全面、有規(guī)范的分層模式,可以把用戶(hù)分群為,例如高價(jià)值、中等價(jià)值、潛在價(jià)值等等層次。依據(jù)RFM給出不同層次的用戶(hù)需求,我們可以為不同的用戶(hù)策劃出更為精細(xì)化的運(yùn)營(yíng)策略。

3. 5W2H——分析的基層框架

5W2H是最為常見(jiàn)的事件分析思路。

我們?cè)谧鰯?shù)據(jù)分析的時(shí)候,其實(shí)大部分處理方式的底層思路,均可歸屬到5W2H的思路。

我們會(huì)去梳理:

  • 發(fā)生了事件?
  • 事件發(fā)生在哪里?
  • 什么時(shí)候發(fā)生的事情?
  • 事件的關(guān)聯(lián)群體?
  • 事情是發(fā)生的理由?

然后根據(jù)5W獲得事件處理方案:

  • 我們?cè)撊绾翁幚恚?/li>
  • 我們的事件處理程度?

這是一個(gè)比較寬泛,同時(shí)也是經(jīng)常用到的分析思路。

03 實(shí)際案例分析

1. 寶箱優(yōu)化——如何利用簡(jiǎn)單、顯眼的數(shù)據(jù)

這個(gè)棋牌產(chǎn)品正準(zhǔn)備第二次開(kāi)寶箱的活動(dòng),主要目的是希望通過(guò)寶箱活動(dòng)去實(shí)現(xiàn)玩家在線(xiàn)時(shí)間及ARPU的提升。

經(jīng)過(guò)第一次寶箱活動(dòng)后,該產(chǎn)品目前的數(shù)據(jù)是這樣的:

第一次活動(dòng)策劃的時(shí)候我們是沒(méi)有可對(duì)比的活動(dòng)數(shù)據(jù)作為參考的,我們選擇了“大于10局的用戶(hù)數(shù)占比45%”的結(jié)論去策劃活動(dòng)。

到了第二次活動(dòng)策劃,我們制定了活動(dòng)的策劃思路:

  • 進(jìn)一步增加活動(dòng)參與度
  • 控制游戲成本輸出(用戶(hù)金幣均獲取量)

根據(jù)這兩個(gè)思路,我們制定了第二期活動(dòng)的改進(jìn)方案。

這次改進(jìn)中,我們改進(jìn)了兩個(gè)活動(dòng)點(diǎn):

(1)降低參與門(mén)檻——提升活動(dòng)參與度

此次活動(dòng)最大的變動(dòng),便是從10局一次開(kāi)寶箱的機(jī)會(huì),改成了7次。這個(gè)調(diào)整的數(shù)據(jù)依據(jù)就是“大于7局的用戶(hù)數(shù)占比為50%”。

這個(gè)改進(jìn)依據(jù)是最容易發(fā)現(xiàn)的,同時(shí)也是最關(guān)鍵的。

(2)上調(diào)服務(wù)費(fèi)——控制成本

為了吸引更多用戶(hù)參與活動(dòng),我們降低了抽獎(jiǎng)門(mén)檻,并提升了獎(jiǎng)勵(lì)金額。但是為了控制成本輸出,我們上調(diào)了服務(wù)場(chǎng)的服務(wù)費(fèi)用,導(dǎo)致盡管玩家表面上更容易獲取資源,且資源數(shù)量不少,但實(shí)際獲取的金幣數(shù)量是低于第一次活動(dòng)的。

改動(dòng)之后,活動(dòng)的參與人數(shù)的數(shù)據(jù)變化如下圖:

從抽獎(jiǎng)次數(shù)來(lái)看,參活用戶(hù)平均抽獎(jiǎng)次數(shù)從3.8提升到了4.6。

這個(gè)數(shù)據(jù)說(shuō)明,門(mén)檻的降低促使更多的用戶(hù)參與抽獎(jiǎng),且抽獎(jiǎng)?lì)l率相較一期有了較為明顯的提升。

另外,活動(dòng)的最終目的是為了提升游戲留存,兩期活動(dòng)前后留存的情況是這樣的:

數(shù)據(jù)顯示,第一期活動(dòng)將產(chǎn)品留存率是從48%提升到了50%,提升了2個(gè)百分點(diǎn)。第二期的用戶(hù)留存從47%提升到了53%,提升了6個(gè)點(diǎn)。

這個(gè)數(shù)據(jù)結(jié)果就是非常好、有效的活動(dòng)效果。

而從整體用戶(hù)的次日留存提升來(lái)看,留存數(shù)值從0.3%提升到了1.2%。如果我們能夠?qū)a(chǎn)品的留存提升1%的話(huà),這個(gè)活動(dòng)對(duì)產(chǎn)品產(chǎn)生的價(jià)值是非常高的,留存數(shù)據(jù)也會(huì)進(jìn)一步影響到整個(gè)用戶(hù)的LTV。

通過(guò)這個(gè)活動(dòng)的分析,我們可以看到活動(dòng)策劃的一個(gè)源頭:關(guān)鍵的數(shù)據(jù)。

二期活動(dòng)利用一個(gè)非常簡(jiǎn)單的變量——10局到7局的改良,使得活動(dòng)效果獲得了大幅度的改進(jìn)。

很多時(shí)候我們會(huì)把數(shù)據(jù)分析想得過(guò)于復(fù)雜,但其實(shí)我們可以利用最簡(jiǎn)單且明顯的數(shù)據(jù)就能做到非常顯著的優(yōu)化效果,并且這樣的數(shù)據(jù)其實(shí)非常多。

這是我想通過(guò)這個(gè)例子向大家呈現(xiàn)的一個(gè)概念:抓住簡(jiǎn)單而又關(guān)鍵的數(shù)據(jù)。

2. MMORPG召回活動(dòng)

我們?cè)賮?lái)看看一款MMORPG產(chǎn)品的召回活動(dòng)。

和許多處于中后期運(yùn)營(yíng)階段的產(chǎn)品一樣,這款MMORPG的流失用戶(hù)會(huì)在這個(gè)階段去開(kāi)展召回流失玩家的活動(dòng),并策劃相應(yīng)的召回活動(dòng)去提升這些玩家的留存。

玩家的召回方式有很多,常見(jiàn)的有短信、郵件、客服等方法。短信信息召回是性?xún)r(jià)比最高的方法之一,這款案例產(chǎn)品的活動(dòng)也是通過(guò)短信來(lái)實(shí)現(xiàn)的。

但因?yàn)檎倩厝巳旱牟町?,短信?nèi)容也要發(fā)生變化。首先對(duì)流失可召回的玩家可以進(jìn)行幾個(gè)分層,如圖示內(nèi)容,核心用戶(hù)、高端用戶(hù)、次高端用戶(hù)、中端用戶(hù)、低端用戶(hù)123。

這是兩次召回活動(dòng)的數(shù)據(jù),數(shù)據(jù)包含了失敗、成功、目標(biāo)召回以及召回率。

如果從活動(dòng)召回率來(lái)說(shuō),第一次活動(dòng)總的召回率是15%,第二次是20%。召回率反映出第二次的效果是明顯比第一次好的。

但如果我們?cè)賮?lái)仔細(xì)看整個(gè)數(shù)據(jù)的召回率比例,我們會(huì)發(fā)現(xiàn)第二次召回的用戶(hù)中,之所以會(huì)比第一次的召回率高,數(shù)據(jù)的提升更多體現(xiàn)在低端用戶(hù)的召回上。

因次第二次活動(dòng)的召回效果是否真的好。我們需要看更多的數(shù)據(jù)和指標(biāo)來(lái)佐證,到底哪一次的活動(dòng)舉辦的比較成功。

因此,我們選擇以下幾個(gè)點(diǎn)進(jìn)行分析:

  • 回歸天數(shù)分布
  • 資源消耗對(duì)比
  • 分類(lèi)型用戶(hù)占比
  • 回歸后30天內(nèi)登陸不足20天的用戶(hù)

(1)回歸天數(shù)分布

對(duì)于回歸用戶(hù)登錄天數(shù)分布,就是回歸用戶(hù)在30天之內(nèi)活躍了多少天。下圖是第一次活動(dòng)和第二次活動(dòng)的用戶(hù)活躍天數(shù)分布。

第一次活動(dòng)形式主要是發(fā)短信讓老玩家回來(lái),利用每天簽到領(lǐng)獎(jiǎng)提高留存,并在第十天的時(shí)候用大獎(jiǎng)的形式提高用戶(hù)的長(zhǎng)線(xiàn)留存能力。

第二次的時(shí)候,召回活動(dòng)同樣也是每天都可以領(lǐng)獎(jiǎng),但是我們將大獎(jiǎng)的領(lǐng)取時(shí)間拉長(zhǎng),讓用戶(hù)在第十八天的時(shí)候才可以領(lǐng)取。領(lǐng)獎(jiǎng)時(shí)間的差異,導(dǎo)致數(shù)據(jù)上產(chǎn)生了差異。

根據(jù)這個(gè)表我們可以找出一些現(xiàn)象:

  • 大部分回歸用戶(hù)領(lǐng)了大獎(jiǎng)后就基本都流失了。30天為周期,用戶(hù)登陸數(shù)據(jù)基本都是在15天左右開(kāi)始下去。
  • 回歸的用戶(hù)在第八天的時(shí)候出現(xiàn)了一個(gè)流失的高峰。這是一個(gè)需要關(guān)注的點(diǎn)。因?yàn)樵诘谝淮位顒?dòng)的時(shí)候,第八天并沒(méi)有出現(xiàn)高流失的情況,因此,第八天的數(shù)據(jù)異常應(yīng)該可以挖掘出一個(gè)對(duì)活動(dòng)改進(jìn)的點(diǎn)。
  • 第二期活動(dòng)留下來(lái)的用戶(hù)要比第一期留下的要多

二期活動(dòng)回流用戶(hù)要比一期多25%左右,證明用戶(hù)雖然領(lǐng)了獎(jiǎng)品大多會(huì)流失。但是通過(guò)延長(zhǎng)活動(dòng)獎(jiǎng)品的領(lǐng)取時(shí)間,可以讓玩家有更多的時(shí)間去了解游戲的內(nèi)容。

很多MMORPG是通過(guò)社區(qū)互動(dòng)的方式,例如師徒系統(tǒng)、組隊(duì)副本等方式,提高了召回玩家的留存。

所以我們可以得到一個(gè)改進(jìn)結(jié)論:

就是針對(duì)第二期活動(dòng),召回玩家在第八天左右出現(xiàn)流失高風(fēng)現(xiàn)象,下一次召回活動(dòng)應(yīng)當(dāng)在第7第8天來(lái)適當(dāng)?shù)靥嵘?jiǎng)品獎(jiǎng)勵(lì),來(lái)提高用戶(hù)期望,從而促使玩家繼續(xù)留在游戲當(dāng)中。當(dāng)然,這個(gè)結(jié)論也需要從更多的維度去佐證是否成立。

我們對(duì)召回的玩家不僅要關(guān)注他們的召回率,我們還應(yīng)當(dāng)去關(guān)注他們的活躍度。

(2)資源消耗對(duì)比

召回的本質(zhì)還是想讓玩家留下來(lái),留下來(lái)之后開(kāi)始消費(fèi)的行為。

由圖可知,第二次召回的用戶(hù)的資源消耗(付費(fèi)能力)要高于第一期的用戶(hù),由日均1.8提升到1.9,提升了6%。同時(shí),結(jié)合游戲的付費(fèi)數(shù)據(jù),同期游戲日均首日分別為300和240,可以看到第二期活動(dòng)從營(yíng)收上的確是要高于第一期活動(dòng)的。

我們剛剛看到召回活躍度的對(duì)比,召回玩家的活躍度是第二期更好的,從充值和資源消耗來(lái)說(shuō),也是第二期更好一些。分析到這里的時(shí)候,我們其實(shí)基本可以下結(jié)論,第二期的召回活動(dòng)效果是優(yōu)于第二期召回活動(dòng)的。

分析到這里,其實(shí)我們還沒(méi)有得到更多建議,去優(yōu)化第三期的召回活動(dòng)。因次我們還需要去深挖用戶(hù)行為路徑,去發(fā)掘用戶(hù)的價(jià)值。

(3)分類(lèi)型用戶(hù)占比

首先,是分類(lèi)型用戶(hù)消耗占比的分析,我們本身在召回的時(shí)候把用戶(hù)分了不同的層級(jí),高端、次高端之類(lèi)的概念。這些用戶(hù)回歸游戲后,我們針對(duì)他們?cè)谟螒騼?nèi)分別消耗了多少資源做了一個(gè)對(duì)比的分布圖,這個(gè)時(shí)候我們可以明顯地發(fā)現(xiàn)一些特別有價(jià)值的結(jié)論:

回歸玩家消耗明顯集中在高端用戶(hù)和低端用戶(hù)1中。

在兩期的活動(dòng)中,低端用戶(hù)1分別占據(jù)了消耗占比的44%和36%,均遠(yuǎn)高于其他類(lèi)別的玩家的。

其實(shí)一期活動(dòng)策劃的時(shí)候,我們的活動(dòng)大部分都是希望去把高端+次高端用戶(hù)作為我們的活動(dòng)導(dǎo)向核心,因?yàn)檫@些都是大玩家的貢獻(xiàn)價(jià)值更大。

但實(shí)際上,這兩期活動(dòng)對(duì)低端用戶(hù)1和次高端用戶(hù)的影響最大,后面如果我們要再策劃類(lèi)似活動(dòng)的話(huà),我們就應(yīng)當(dāng)需要對(duì)低端用戶(hù)1做一個(gè)更為全面的分析,讓活動(dòng)可以進(jìn)一步挖掘這部分人群的消費(fèi)能力和體驗(yàn)導(dǎo)向。

同樣的,其他的用戶(hù)行為需求我們也需要進(jìn)一步的分析,對(duì)整個(gè)活動(dòng)進(jìn)行改良,以提高活動(dòng)對(duì)其他用戶(hù)的吸引力。

綜上所述,活動(dòng)對(duì)我們的核心用戶(hù)群——高端用戶(hù)&次高端用戶(hù),其實(shí)吸引力是不大的。

這里就可以獲得兩個(gè)結(jié)論:

  • 回歸玩家的消耗主要來(lái)?于次?端?戶(hù)和低端?戶(hù)1,尤其是低端?戶(hù)1,此類(lèi)玩家在兩期活動(dòng)的消耗中分別占到了44%和36%。作為召回活動(dòng)主要召回對(duì)象的核??戶(hù)和高端?戶(hù)反?沒(méi)有表現(xiàn)出較強(qiáng)的付費(fèi)能?。
  • 低端?戶(hù)3類(lèi)型消耗占?第?期有較?幅度提升,由3%提升到了12.7%,說(shuō)明雖然此類(lèi)?戶(hù)中有?量的?號(hào)、倉(cāng)庫(kù)號(hào),但其中真實(shí)?戶(hù)仍然能夠給游戲帶來(lái)?定價(jià)值。

由上述結(jié)論便可以導(dǎo)出對(duì)第三期活動(dòng)的改進(jìn)建議:

適當(dāng)提升次?端?戶(hù)和低端?戶(hù)1的獎(jiǎng)勵(lì)價(jià)值,因?yàn)檫@兩類(lèi)玩家具有更強(qiáng)的消費(fèi)能?和傾向,適當(dāng)提升獎(jiǎng)勵(lì)價(jià)值可以達(dá)到提升其消費(fèi)意愿的作?。

這是對(duì)用戶(hù)進(jìn)行分類(lèi)的對(duì)比,我們還可以看回歸之后30天之內(nèi),登陸不足20天的用戶(hù),從中再去發(fā)掘更多數(shù)據(jù)信息。

(4)回歸后30天內(nèi)登陸不足20天的用戶(hù)

這個(gè)用戶(hù)就是召回之后再次流失,他們回來(lái)之后為什么又走了,這里其實(shí)是需要結(jié)合整個(gè)游戲的玩法去分析了。

比如說(shuō)低端用戶(hù)3的等級(jí)分布,它的流失點(diǎn)分別為65級(jí)及70級(jí),這里要結(jié)合游戲的玩法去分析這兩個(gè)點(diǎn)存在什么樣的問(wèn)題導(dǎo)致玩家流失。

對(duì)于這個(gè)游戲來(lái)說(shuō),65級(jí)和70級(jí)的時(shí)候有一個(gè)要求較高的飛升系統(tǒng)。前期在召回玩家回來(lái)之后,我們會(huì)獎(jiǎng)勵(lì)玩家一些經(jīng)驗(yàn)值和獎(jiǎng)勵(lì)的禮包,但到了飛升的時(shí)候會(huì)卡在這里,這個(gè)點(diǎn)也會(huì)成為未來(lái)活動(dòng)優(yōu)化的方向。對(duì)于低端用戶(hù)2也可以同樣使用這樣的思路去分析優(yōu)化。

使用這種分析,我們可以得到一些結(jié)論。就是我們?cè)谧龌顒?dòng)結(jié)果的數(shù)據(jù)分析的時(shí)候,我們很容易只停留在活動(dòng)的數(shù)據(jù)表面,并沒(méi)有對(duì)下層行為做一個(gè)深鉆,如果我們從不同的角度去深挖數(shù)據(jù),我們就可以得到很多有價(jià)值的點(diǎn)。

04 數(shù)據(jù)挖掘

數(shù)據(jù)除了數(shù)據(jù)分析的價(jià)值,另一層價(jià)值就是數(shù)據(jù)挖掘的價(jià)值。

數(shù)據(jù)分析是依賴(lài)于人的經(jīng)驗(yàn)及人對(duì)業(yè)務(wù)的理解,依賴(lài)人的邏輯思維能力去找到整個(gè)業(yè)務(wù)相關(guān)的信息,去找到理性且可以指導(dǎo)我們產(chǎn)品優(yōu)化的點(diǎn)。

數(shù)據(jù)挖掘就是從另外一個(gè)維度去發(fā)掘數(shù)據(jù)的價(jià)值。

我們這里用一個(gè)比較簡(jiǎn)單常見(jiàn)的案例:產(chǎn)品的DAU預(yù)測(cè)。通過(guò)這個(gè)案例,我們可以看到數(shù)據(jù)挖掘的一個(gè)思路。

這里有三條曲線(xiàn),分別代表了三個(gè)產(chǎn)品的DAU,三個(gè)DAU走勢(shì)波動(dòng)比較厲害,而有一些的周期性比較明顯,沒(méi)有太多規(guī)律可言。

我們就需要一些比較科學(xué)的方法去預(yù)測(cè)DAU、分析產(chǎn)品的DAU、分析具體的場(chǎng)景去對(duì)我們的一些產(chǎn)品決策進(jìn)行輔助。

比如說(shuō)這個(gè)場(chǎng)景:

現(xiàn)在有一個(gè)產(chǎn)品公測(cè)沒(méi)多久,公司給的KPI指標(biāo)是產(chǎn)品投放后能夠達(dá)到50萬(wàn)的收益。事實(shí)上,在產(chǎn)品上線(xiàn)的兩周,產(chǎn)品的數(shù)據(jù)已經(jīng)很接近50萬(wàn),但是一直徘徊在45-47萬(wàn)。

這個(gè)產(chǎn)品本身沒(méi)有達(dá)到50萬(wàn)DAU的KPI,這個(gè)時(shí)候整個(gè)項(xiàng)目組還有一筆預(yù)算,需要去衡量這筆預(yù)算如果全部拿去買(mǎi)量的話(huà),能不能達(dá)成這樣的一個(gè)KPI。

這個(gè)時(shí)候我們需要找到一個(gè)可以科學(xué)決策的依據(jù),我們要分析整個(gè)DAU跟新增用戶(hù)的關(guān)系,去分析多少錢(qián)可以獲得大概多少的市場(chǎng)新增。

新增和DAU并不是一個(gè)直接的關(guān)系,中間通過(guò)留存做了一個(gè)橋接,所以我們需要分析新增和DAU之間的關(guān)系是什么,如果我們能夠得到一個(gè)公式去計(jì)算出來(lái)的話(huà),就能夠倒推我們需要花多少錢(qián)才能夠滿(mǎn)足50萬(wàn)的KPI。

為了預(yù)測(cè)這個(gè)DAU,首先我們需要對(duì)流程做一個(gè)拆解,我們首先需要定義它。每日登錄用戶(hù),就是DAU的定義,只要用戶(hù)做了登陸操作,我們就認(rèn)為他是一個(gè)活躍用戶(hù),每天DAU的曲線(xiàn)波動(dòng)非常大。

造成DAU波動(dòng)的因素由這幾個(gè)點(diǎn)構(gòu)成,通常我們把整個(gè)日活的用戶(hù)比喻成用戶(hù)池,每天都有流入的用戶(hù),每天都有出去的用戶(hù)。所以一個(gè)流入一個(gè)流出形成了數(shù)據(jù)的波動(dòng),對(duì)于流入的部分我們可以分為三個(gè)部分:昨日留存用戶(hù)+日回流用戶(hù)+日新進(jìn)用戶(hù)。

分解之后,我們就可以完成一張新進(jìn)用戶(hù)的留存表。

表格一共列舉了5天內(nèi)有多少人留下來(lái),在后續(xù)20天每天又有多少人留下來(lái)了。我們會(huì)發(fā)現(xiàn)里面的留存率,是根據(jù)下方示意圖的趨勢(shì)發(fā)展的,呈現(xiàn)的是衰減的趨勢(shì)。

然后我們找來(lái)兩個(gè)產(chǎn)品的留存曲線(xiàn)來(lái)擬合這個(gè)衰減現(xiàn)象。

大家可以看到這兩個(gè)曲線(xiàn)還是挺有規(guī)律的,相對(duì)來(lái)說(shuō)也是較為平滑的,這個(gè)時(shí)候我們需要選擇一個(gè)留存模型——冪率分布對(duì)它進(jìn)行預(yù)測(cè)。

其中:

  • a為常數(shù)(可簡(jiǎn)化)
  • b為新進(jìn)留存系數(shù)
  • x為產(chǎn)品運(yùn)行天數(shù)

如果b的值越大,留存情況就會(huì)越好,因?yàn)閎這個(gè)值決定了曲線(xiàn)的傾斜程度,比如A產(chǎn)品第一條綠線(xiàn)的b值就要大于紅線(xiàn)。

所以b值就可以反映出產(chǎn)品的用戶(hù)留存特征,我們就可以把b定義為新進(jìn)的留存系數(shù),留存系數(shù)可以通過(guò)三個(gè)點(diǎn)決定:

  • 產(chǎn)品的品質(zhì)
  • 用戶(hù)的質(zhì)量
  • 運(yùn)營(yíng)的活動(dòng)

在結(jié)合上述理論后,我們就可以從已經(jīng)運(yùn)營(yíng)一段時(shí)間的產(chǎn)品中抓取我們產(chǎn)品的b值,畫(huà)一個(gè)走勢(shì)圖。

這該產(chǎn)品b值一年來(lái)的走勢(shì)圖。從大的層面來(lái)看,b值的波動(dòng)不是非常的大,但是波峰和波谷都有相關(guān)運(yùn)營(yíng)活動(dòng)或者版本迭代的干預(yù),導(dǎo)致了這個(gè)值的改變。

圖上顯示,我們?yōu)榱送瓿赡承㎏PI去提高DAU值做的拉小號(hào)的活動(dòng),反而導(dǎo)致了b值的下降,就證明拉小號(hào)的活動(dòng)促進(jìn)了DAU的值上升,但用戶(hù)質(zhì)量卻下降了。產(chǎn)品本身的質(zhì)量其實(shí)是比較穩(wěn)定的,你可以衡量它的用戶(hù)質(zhì)量,用戶(hù)質(zhì)量其實(shí)就與運(yùn)營(yíng)活動(dòng)質(zhì)量有關(guān)。

有了這樣的模型之后,我們就可以計(jì)算出把DAU的公式列舉出來(lái)了。

大家可以把這個(gè)概念不停拆分下去,累加之后就可以形成DAU公式。我們可以把總的日活數(shù)據(jù)不停地拆,從第一天到第N天留存用戶(hù)數(shù),就可以得到今日的日活。然后我們?cè)倮眠@個(gè)公式,去做出我們產(chǎn)品的走勢(shì)圖。

根據(jù)這樣的情況,我們就可以很好地去預(yù)測(cè)DAU的走勢(shì),去對(duì)比實(shí)際日活和預(yù)測(cè)日活的一個(gè)匹配程度。雖然存在一些偏差,但是偏差值也是因?yàn)槭艿交顒?dòng)的影響才發(fā)生的。

獲取預(yù)測(cè)趨勢(shì)圖之后,我們?cè)偻度雽?shí)際的應(yīng)用中去評(píng)估。

我們回到評(píng)估DAU50萬(wàn)的目標(biāo)上。

從上圖可以看到上面這張圖是日活躍與日新進(jìn)的走勢(shì)關(guān)系,這些都是不限號(hào)之前的走勢(shì),不限號(hào)之前是比較穩(wěn)定的,核心玩家一直都是比較穩(wěn)定的,沒(méi)有什么比較大的變化。中間拐點(diǎn)開(kāi)始是不限號(hào)當(dāng)天出現(xiàn)的,日新增注冊(cè)用戶(hù)自拐點(diǎn)之后一直往下走。

我們代入那個(gè)日活公式后,下方圖的紫色部分就代表我們的預(yù)計(jì)的日活曲線(xiàn)。最后推算出來(lái)是,我們需要連續(xù)兩周每天都要有8萬(wàn)的新進(jìn),才能夠完成50萬(wàn)DAU的指標(biāo)。

這個(gè)數(shù)值所需要的費(fèi)用跟我們實(shí)際的預(yù)算相比差距太大,因此我們放棄了用50萬(wàn)去投放買(mǎi)量的計(jì)劃。如果差距不大的話(huà),我們才會(huì)選擇投放獲客。

這次的數(shù)據(jù)挖掘就給了我們此次決策的數(shù)據(jù)支撐,告訴了我們這個(gè)決策是不具備可行性的。后來(lái)為了完成目標(biāo),我們改用了拉小號(hào)的活動(dòng),將數(shù)據(jù)快速地推上去。

總結(jié)下來(lái),數(shù)據(jù)挖掘可以分為三步:

  • 利用歷史數(shù)據(jù)
  • 建立概念模型
  • 預(yù)測(cè)發(fā)展趨勢(shì)

 

本文由 @小莫@數(shù)數(shù)科技 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!