如何通過數(shù)據(jù)找到影響用戶留存的關(guān)鍵因素
編輯導(dǎo)語:伴隨著流量紅利見頂?shù)默F(xiàn)狀,除了做好拉新促活之外,品牌商家還需要思考怎么提升用戶留存率,做好精細(xì)化運(yùn)營(yíng)。而在進(jìn)行用戶留存分析時(shí),數(shù)據(jù)分析是一個(gè)有效手段。本篇文章里,作者結(jié)合自己的工作經(jīng)驗(yàn),總結(jié)了一些可借鑒的留存分析方法論,一起來看一下。
寫在前面
根據(jù)QuestMobile數(shù)據(jù)顯示,2021年中國(guó)移動(dòng)互聯(lián)網(wǎng)用戶規(guī)模保持在近11.6億,2021年5月同比增速竟首次出現(xiàn)負(fù)增長(zhǎng),這意味著流量紅利時(shí)代結(jié)束,進(jìn)入存量爭(zhēng)奪階段。而互聯(lián)網(wǎng)不同賽道的玩家,也不得不把突破增長(zhǎng)困局的關(guān)鍵點(diǎn),放在如何提升存量用戶的留存價(jià)值上。
在該背景下,作不甘淪為取數(shù)工具人的分析師,可以主動(dòng)深入業(yè)務(wù),通過海量數(shù)據(jù)挖掘出影響用戶留存的關(guān)鍵指標(biāo),并結(jié)合業(yè)務(wù)邏輯,給出合理可行的建議。
接下來筆者會(huì)分享自己在工作中沉淀的一些留存分析方法論,給大家奉獻(xiàn)滿滿的干貨,別走開,精彩馬上來~
分析框架:
- 確定流失和留存的具體口徑;
- 通過定性和定量等方法尋找與用戶留存相關(guān)的指標(biāo),并設(shè)計(jì)相應(yīng)策略;
- 設(shè)計(jì)AB實(shí)驗(yàn),檢驗(yàn)留存提升策略的有效性。
一、確定留存的具體口徑
首先要結(jié)合用戶行為數(shù)據(jù),或者基于業(yè)務(wù)常識(shí),和業(yè)務(wù)人員對(duì)流失或者留存用戶的口徑達(dá)成一致??趶降拇_認(rèn)點(diǎn)主要是:【多久(窗口期)】?jī)?nèi)沒有發(fā)生【什么關(guān)鍵行為】會(huì)被定位為流失。。
1)關(guān)鍵行為
不同業(yè)務(wù)模式下的用戶核心行為不同,比如對(duì)于交易平臺(tái),關(guān)鍵行為可能是下單;對(duì)于短視頻平臺(tái),關(guān)鍵行為可能是播放視頻;對(duì)于工具類APP,關(guān)鍵行為可能是啟動(dòng)APP。
2)窗口期
窗口期的長(zhǎng)短取決于,用戶關(guān)鍵行為的發(fā)生頻次高低。比如車主用戶一般每隔14天加油一次,因此14天可以作為窗口期。
可以基于用戶相鄰兩次關(guān)鍵行為天數(shù)間隔的75%分位數(shù)的方法確定窗口期的大小。比如,選取昨日發(fā)生過關(guān)鍵行為(比如下單、或啟動(dòng)APP)的用戶作為研究對(duì)象。分析這些用戶最近兩次關(guān)鍵行為發(fā)生的間隔天數(shù)。如果75%用戶的間隔天數(shù)都在 xx 天內(nèi),則 xx 天可以作為流失行為的窗口期。
二、影響用戶留存的相關(guān)性因素分析
1. 搭建影響用戶留存的指標(biāo)體系
可以選取用戶靜態(tài)畫像、活躍行為類指標(biāo)、付費(fèi)行為類指標(biāo)、以及其他核心行為類指標(biāo)作為指標(biāo)體系。也可以參考用研團(tuán)隊(duì)針對(duì)流失和留存用戶的調(diào)研結(jié)果,為指標(biāo)體系搭建提供新的思路。
一般的,用研團(tuán)隊(duì)對(duì)流失和留存用戶的調(diào)研提綱如下:
- 流失用戶:調(diào)研其年齡、性別、職業(yè)、城市、圈層等社會(huì)學(xué)畫像;深度挖掘其為什么流失的原因;回歸意愿如何;以及流失的去向是哪里;他們對(duì)競(jìng)品和本品的使用體驗(yàn)差異點(diǎn)在哪里。
- 留存用戶:社會(huì)學(xué)畫像; 留在本品的核心驅(qū)動(dòng)力;通過什么方式被吸引到本品;來源渠道。
巧婦難為無米之炊,數(shù)據(jù)是分析師必備的武器。用戶調(diào)研結(jié)束后,數(shù)據(jù)分析師要嘗試對(duì)調(diào)研結(jié)果中用戶強(qiáng)烈吐槽或者十分滿意的功能體驗(yàn),盡可能抽象成可觀測(cè)、可度量的數(shù)據(jù)指標(biāo)。
比如用戶吐槽刷到內(nèi)容平臺(tái) APP 廣告太頻繁,可以將廣告性質(zhì)內(nèi)容的曝光次數(shù)作為指標(biāo),納入下一階段的定量分析中;用戶認(rèn)為平臺(tái)最大的優(yōu)勢(shì)在于有金幣領(lǐng)取,可以將金幣等指標(biāo)體系納入定量分析中。
2. 影響留存的重要指標(biāo)篩選
影響用戶留存或者流失的因素非常多,需要從眾多指標(biāo)中篩選出重要度較高的幾個(gè)指標(biāo)。以下有兩種方法可以提供參考。
1)相關(guān)性分析
選出與留存率相關(guān)性系數(shù)較高的前幾個(gè)行為,作為關(guān)鍵行為候集;同時(shí)還要考慮發(fā)生該行為的用戶的滲透率高低、留存率提升幅度的高低,即要保證最終的留存人數(shù)處于較高的水平(留存人數(shù) = 人數(shù)*滲透率*留存率 )。
假設(shè)某個(gè)社交媒體平臺(tái) APP ,流失用戶被定義為近7日未啟動(dòng)APP的用戶。影響留存的指標(biāo)、各指標(biāo)與留存率間的相關(guān)系數(shù)、行為滲透率、留存率提升幅度見下表(具體數(shù)值均為模擬數(shù)據(jù),請(qǐng)勿參考)。
從上面的四象限圖可以發(fā)現(xiàn),播放短視頻、金幣頁面訪問等行為的滲透率較高,且留存率提升幅度也較高,因此可以作為影響留存的關(guān)鍵行為候選集。
2)基于各類樹模型
各類樹(決策樹、隨機(jī)森林、GBDT等)模型訓(xùn)練結(jié)束后,可以輸出模型所使用的特征的相對(duì)重要度,可以解釋哪些因素是對(duì)預(yù)測(cè)有關(guān)鍵影響,因此可以幫助我們快速找出對(duì)用戶留存影響度高的關(guān)鍵因素。
① 特征選擇
- 用戶畫像類特征(年齡、性別、城市、手機(jī)品牌、手機(jī)型號(hào)、平臺(tái)角色、是否安裝競(jìng)品、競(jìng)品APP安裝數(shù)量、新增渠道類型);
- 活躍類標(biāo)簽(近 7 天APP啟動(dòng)次數(shù)、近 7 天APP使用時(shí)長(zhǎng)、近 7 天活躍天數(shù)、首次活躍距今天數(shù)、末次活躍距今天數(shù));
- 消費(fèi)類行為標(biāo)簽(近 7 天內(nèi)容曝光次數(shù)、近 7 天內(nèi)容點(diǎn)擊次數(shù)、近 7 天內(nèi)容播放時(shí)長(zhǎng));
- 互動(dòng)類行為標(biāo)簽(近 7 天點(diǎn)贊次數(shù)、關(guān)注次數(shù)、評(píng)論次數(shù)、轉(zhuǎn)發(fā)次數(shù)、收藏次數(shù));
- 付費(fèi)類行為標(biāo)簽(近 7 天打賞主播次數(shù)、打賞金額、充值金額);
- 金幣激勵(lì)類標(biāo)簽(近 7 天金幣提現(xiàn)金額、簽到次數(shù)、得金幣數(shù)、訪問福利中心頁面次數(shù))。
② 正負(fù)樣本構(gòu)建:先鎖定特定日期范圍(比如 2021.07.01-2021.07.07)的活躍用戶,根據(jù)其是否在后續(xù)7天(2021.07.08~2021.07.14))活躍來劃分正負(fù)樣本。
- 正樣本:留存用戶,即前7-14日(2021.07.01-2021.07.07)啟動(dòng)過APP,近7日(2021.07.08~2021.07.14)啟動(dòng)過APP的用戶;
- 負(fù)樣本:留存用戶,即前7-14日(2021.07.01-2021.07.07)啟動(dòng)過APP,但近7日(2021.07.08~2021.07.14)未啟動(dòng)過APP的用戶。
③ 構(gòu)建模型時(shí)的注意點(diǎn)
- 正負(fù)樣本的樣本數(shù)盡量保持在1:1,避免正樣本數(shù)量過少導(dǎo)致學(xué)習(xí)不到正樣本的信息,或者負(fù)樣本數(shù)量過大影響訓(xùn)練速度;
- 模型預(yù)測(cè)效果不佳時(shí),可以嘗試使用多種模型,比如GBDT+LR、XBoost等;
- 區(qū)分不同類型用戶分別構(gòu)建模型,比如區(qū)分新老用戶、創(chuàng)作者用戶和消費(fèi)型用戶、高低中頻次用戶等。
根據(jù)上圖(具體數(shù)值均為模擬數(shù)據(jù),請(qǐng)勿參考)可以看出,近7日活躍天數(shù)、APP啟動(dòng)次數(shù)、訪問時(shí)長(zhǎng)、以及播放短視頻次數(shù)等行為指標(biāo)可以作為留存的關(guān)鍵指標(biāo)。
④ 特征間的相關(guān)性分析
通過對(duì)特征間的相關(guān)性系數(shù)分析發(fā)現(xiàn), APP 啟動(dòng)次數(shù)和 訪問 APP 時(shí)長(zhǎng)指標(biāo)之間存在很強(qiáng)的相關(guān)性,可以剔除其中一個(gè)指標(biāo)。
至此,我們可以選擇7天內(nèi)APP活躍天數(shù)、啟動(dòng)APP次數(shù)、播放短視頻次數(shù)作為影響留存的關(guān)鍵指標(biāo)。
根據(jù)這些指標(biāo),我們可以設(shè)計(jì)新人激勵(lì)體系,引導(dǎo)用戶盡可能地多完成關(guān)鍵行為。比如新用戶激活后登錄APP、播放視頻,會(huì)有積分或者金幣等形式的激勵(lì),該激勵(lì)活動(dòng)以 Push 或者站內(nèi)彈窗等形式傳遞到用戶。
但是激勵(lì)活動(dòng)的具體規(guī)則,比如播放視頻次數(shù)在7天達(dá)到多少,才能給到激勵(lì)呢?我們同樣可以基于數(shù)據(jù)給到建議。比如觀察第一個(gè)7天內(nèi)完成不同播放次數(shù)的用戶,在下一個(gè)周期的留存率,找到留存率變化的拐點(diǎn)(邊際提升幅度最小的點(diǎn))作為激勵(lì)規(guī)則的臨界值。
三、留存關(guān)鍵因素的因果性驗(yàn)證
相關(guān)性不等于因果性,因果性的檢驗(yàn)必需通過設(shè)計(jì)AB實(shí)驗(yàn)驗(yàn)證,并量化策略的增量效果。
比如對(duì)于金幣激勵(lì)策略,可以抽取50%新用戶作為對(duì)照組用戶,且對(duì)照組用戶無激勵(lì)活動(dòng)觸達(dá);50%新用戶的實(shí)驗(yàn)組,則通過push或者站內(nèi)彈窗觸達(dá)用戶。觀測(cè)對(duì)比兩組用戶在未來7天的留存率,并核算delta ROI(delta 活躍人數(shù)/金幣折算),以衡量策略的效果。
鑒于網(wǎng)上AB實(shí)驗(yàn)如何開展以及如何評(píng)估的文章較多,該部分不再具體展開敘述。
總結(jié)
本文介紹了用戶留存相關(guān)的通用分析方法,希望能夠給大家?guī)硪恍┬碌恼J(rèn)識(shí)。但限于筆者自身知識(shí)和能力水平限制,本文難免會(huì)有考慮不周全之處,如有不同見解,希望大家可以一起討論。
本文由 @郝笑笑 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于 CC0 協(xié)議
原封不動(dòng)的抄襲?
非常干貨,牛
get it ??