數(shù)據(jù)驅(qū)動業(yè)務(wù)增長:如何做轉(zhuǎn)化意愿預(yù)測?
編輯導(dǎo)語:在日常業(yè)務(wù)中,數(shù)據(jù)分析可以幫助我們挖掘業(yè)務(wù)增長點(diǎn),提升轉(zhuǎn)化效率,等等。那么,如何結(jié)合一款0代碼機(jī)器學(xué)習(xí)智能工具實(shí)現(xiàn)數(shù)據(jù)分析?本篇文章里,作者結(jié)合Amazon SageMaker Canvas這款工具進(jìn)行了轉(zhuǎn)化意愿預(yù)測,讓我們來看看他的體驗(yàn)評測吧。
引言
“數(shù)據(jù)驅(qū)動業(yè)務(wù)增長”是以業(yè)務(wù)線全鏈路海量數(shù)據(jù)的收集、存儲、可視化、分析、挖掘作為核心支撐的,需要協(xié)同上下游參與且目標(biāo)一致,最終將數(shù)據(jù)精準(zhǔn)化、精細(xì)化為實(shí)現(xiàn)商業(yè)目的。
一、業(yè)務(wù)背景
1. 業(yè)務(wù)介紹
本產(chǎn)品主要是挖掘孩子的綜合素質(zhì),覆蓋思維、英語、語文等能力,幫助孩子在認(rèn)識世界、探索世界的同時,打好全方位的能力基礎(chǔ),陪伴孩子共同成長。
2. 商業(yè)模式
通過低價課吸引用戶,經(jīng)過一些列課程培養(yǎng)和體驗(yàn)服務(wù),最終轉(zhuǎn)化成年課用戶。
3. 分析主題
轉(zhuǎn)化分析。
4. 現(xiàn)狀痛點(diǎn)
- 營銷運(yùn)營的目標(biāo)不夠清晰和聚焦,人效較低。
- 很難快速掌握用戶轉(zhuǎn)化的核心痛點(diǎn),轉(zhuǎn)化率不高。
5. 分析目標(biāo)
目前屬于發(fā)掘的新業(yè)務(wù),所以業(yè)務(wù)需要在招生分析的鏈路上,想要通過一系列的全面復(fù)盤和分析,核心提高轉(zhuǎn)化率。
二、分析思路
所有的分析思路都應(yīng)該以場景作為切入點(diǎn),以業(yè)務(wù)決策為終點(diǎn),因此本次項(xiàng)目梳理了五個步驟:
- 挖掘業(yè)務(wù)含義
- 梳理用戶行為路徑
- 拆分場景特征
- 構(gòu)建模型預(yù)測
- 推動數(shù)據(jù)決策
1. 挖掘業(yè)務(wù)含義
用戶旅程圖:從用戶角度出發(fā),以用戶調(diào)研和業(yè)務(wù)場景中發(fā)現(xiàn)用戶在整個使用過程中的痛點(diǎn)和滿意點(diǎn),思考產(chǎn)品的增長點(diǎn)。
2. 梳理用戶行為特征
1)路徑拆解
在用戶旅程的大框架下,通過對用戶行為數(shù)據(jù)的采集,監(jiān)測獲得的數(shù)據(jù)進(jìn)行分析可以讓更加詳細(xì)、清楚地了解用戶的行為習(xí)慣,將他們的目標(biāo)、需求與商業(yè)宗旨相匹配。
2)用戶行為
根據(jù)用戶旅程的體驗(yàn)中,可以把用戶分為三個階段,其中包含:獲客、留存、轉(zhuǎn)化,每個階段的衡量反應(yīng)出的分析目標(biāo)和邏輯則不同。
3. 拆分場景特征
1)相關(guān)性分析
主要用于研究用戶行為事件的發(fā)生對轉(zhuǎn)化的影響程度,針對這一行為特征進(jìn)行相關(guān)性分析,確認(rèn)導(dǎo)致該行為的影響因素和影響權(quán)重。
2)梳理特征(定義數(shù)據(jù)集)
涉及到原始的數(shù)據(jù)源,我們需要在亞馬遜中找到S3的存儲桶,將數(shù)據(jù)源文件傳輸至此。
數(shù)據(jù)源(行為特征):第一版本共梳理了70+特征因子,這一版本是通過產(chǎn)品和業(yè)務(wù)的直覺梳理和轉(zhuǎn)化有的相關(guān)性,通過模型在去做篩選和相關(guān)性分析。
S3存儲桶:亞馬遜的數(shù)據(jù)源需要借用S3存儲桶服務(wù)。
數(shù)據(jù)集:S3存儲桶中數(shù)據(jù)源可以直接同步至畫布的數(shù)據(jù)集,并且可以針對數(shù)據(jù)預(yù)覽數(shù)據(jù),這點(diǎn)兩個功能點(diǎn)很棒,因?yàn)檎筋A(yù)覽才發(fā)現(xiàn)數(shù)據(jù)源亂碼的問題。
三、構(gòu)建模型預(yù)測
1. 構(gòu)建模型
第一步:直接就選擇上傳的數(shù)據(jù)集就ok了,這一步非常的簡單。
第二步:選擇預(yù)測的指標(biāo)很好理解,關(guān)鍵點(diǎn)在于模型的選擇,轉(zhuǎn)化預(yù)測本質(zhì)是一個二分類的問題,預(yù)期是0-1的一個概率值,實(shí)戰(zhàn)中選擇的【xgboost】模型進(jìn)行預(yù)測,通過和轉(zhuǎn)化率強(qiáng)相關(guān)的因子和轉(zhuǎn)化預(yù)測分層進(jìn)行后續(xù)的營銷策略。
這里的模型選擇會根據(jù)我的數(shù)據(jù)集推薦模型,也會有一些內(nèi)容的引導(dǎo),不過other的模型有的不可選擇,所以默認(rèn)使用推薦的模型,看下初次效果。
還沒有建模時候可以簡單對目標(biāo)的相關(guān)性做個分析對比。
2. 模型表現(xiàn)
1)模型能力
處理速度:模型個處理速度在耗時3min左右,還是蠻快的,比較超出預(yù)期。
模型得分:模型分?jǐn)?shù)和預(yù)期(70-80)相比會較高一些,可能由于數(shù)據(jù)量級較小,造成數(shù)據(jù)得分偏高;自建模型訓(xùn)練環(huán)境中的F1=0.78、AUC=0.85。
特征分析:這個可以根據(jù)轉(zhuǎn)化意愿分值進(jìn)行查看指標(biāo)的影響和分布,這個功能是非常棒的,在數(shù)據(jù)產(chǎn)品視角對模型分析師偏概覽的,這個可以細(xì)致的挖掘更深層的理解。
2)特征相關(guān)性
根據(jù)初次篩選,得出一些和轉(zhuǎn)化有顯著相關(guān)性的指標(biāo)因子,并且可利用分布情況,分析背后原因。
顯著相關(guān)性概覽:根據(jù)是否顯著相關(guān)性整理一部分比較有趣,可以看出有一些認(rèn)為有影響因素的其實(shí)問題并不大,有的標(biāo)簽其實(shí)和轉(zhuǎn)化這個點(diǎn)關(guān)系并不強(qiáng)烈,但是可以作何核心的營銷因素。
3)相關(guān)性排行
根據(jù)相關(guān)性整理了分值排行,更能直觀看到哪些影響因子的重要程度。
3. 數(shù)據(jù)分析
1)分析理論
- 卡方檢驗(yàn):著重觀察值與理論值的偏離程度,選擇的考慮主要是基于特征的二分類問題和相互獨(dú)立事件居多。
- 斯皮爾曼相關(guān)性分析:核心針對兩個連續(xù)性變量且成線性關(guān)系,所以需驗(yàn)證其相關(guān)性。
2)地域分析
從地域人群量級和轉(zhuǎn)化率上來看,整體手中人群集中在二三線城市,所以在產(chǎn)品的投放和布局中,需針對等級進(jìn)行策略規(guī)劃。
3)競品分析
卡方校驗(yàn)非常顯著,從此指標(biāo)可以看出,用戶安裝了競品,直接可以篩選到核心的種子用戶,因?yàn)樵撚脩魧Υ擞袕?qiáng)烈的潛在需求。
4)留存分析
這里的留存主要指用戶來學(xué)習(xí)的次數(shù),分析圖標(biāo)看,用戶持續(xù)學(xué)習(xí)提現(xiàn)出對產(chǎn)品課程的認(rèn)可性,非常有利于后續(xù)營銷轉(zhuǎn)化。
4. 訓(xùn)練模型
1)持續(xù)訓(xùn)練
防止數(shù)據(jù)量稀疏和數(shù)據(jù)量較小(試用最大100w單元格),所以需要加大數(shù)據(jù)源的量級,加強(qiáng)預(yù)測能力,防止結(jié)果的偶然性。
2)模型調(diào)優(yōu)
- 調(diào)整不合理指標(biāo),防止特征穿越(比如瀏覽產(chǎn)品詳情頁,這種標(biāo)簽穿越特別嚴(yán)重,其實(shí)在模型中做預(yù)測是不太可取,反而可以成為營銷策略的用戶標(biāo)簽)。
- 對模型進(jìn)行合理的剪枝規(guī)則,增強(qiáng)模型可解釋性(針對特別明細(xì)標(biāo)簽,進(jìn)行歸因和聚合)。
3)預(yù)測模型
重新上傳一組數(shù)據(jù)對模型進(jìn)行預(yù)測,通過預(yù)測結(jié)果和本地訓(xùn)練集進(jìn)行比對,準(zhǔn)確率在70%左右,整體來說已經(jīng)不錯了,后續(xù)可以加大投入力度進(jìn)行驗(yàn)證和訓(xùn)練,尤其是雙向結(jié)合的方式,效率會大大提高。
四、推動數(shù)據(jù)策略
數(shù)據(jù)分析也好、數(shù)據(jù)挖掘也罷,只是實(shí)現(xiàn)商業(yè)目標(biāo)的手段,真正想賦能業(yè)務(wù)并且驅(qū)動業(yè)務(wù),一定要從實(shí)際場景觸發(fā),找到切入點(diǎn)。
策略一:提效
1)用戶分層
根據(jù)用戶的轉(zhuǎn)化意愿預(yù)測值,進(jìn)行用戶分層,形成營銷SOP清單,可以針對中高意愿以上的的用戶進(jìn)行精準(zhǔn)觸達(dá),對于大部分銷售人員可以減少人工判斷成本,優(yōu)先觸達(dá)轉(zhuǎn)化意向高的用戶,合理分配時間和觸達(dá)深度,并且可以制定標(biāo)準(zhǔn)的SOP動作,大大提高運(yùn)營效率。
2)價值收益
提高了80%的人效,人效主要針對單個銷售服務(wù)的用戶比值。
策略二:抓手
1)用戶標(biāo)簽
在營銷工具中實(shí)時更新用戶的高意向標(biāo)簽(溝通意愿強(qiáng)烈)或者策略標(biāo)簽(學(xué)習(xí)能力畫像:中),可聯(lián)動知識庫進(jìn)行組合式營銷,為用戶解決痛點(diǎn),提供優(yōu)質(zhì)的服務(wù)。
比如:用戶的能力畫像中“思維能力”薄弱,那么可以根據(jù)用戶在學(xué)習(xí)過程中哪些思維題做的不好,引導(dǎo)用戶如何針對性、系統(tǒng)化的提升,解決核心痛點(diǎn)。
2)價值收益
提高了15%的轉(zhuǎn)化率,轉(zhuǎn)化率=購買年課用戶/購買體驗(yàn)課用戶。
五、參賽總結(jié)
1. 產(chǎn)品體驗(yàn)
1)用戶體驗(yàn)
① 產(chǎn)品設(shè)計
樣式上紫色的主色調(diào)非常符合當(dāng)前互聯(lián)網(wǎng)人的視覺喜愛,紫色本來帶有一些神秘感覺,在加上機(jī)器學(xué)習(xí)的加持,整體樣式設(shè)計很足,而且紫白結(jié)合很干凈和簡潔。
② 產(chǎn)品交互
體驗(yàn)流程很順暢,用起來很方便,比如在模型全鏈條是以流式,從選擇數(shù)據(jù)集-構(gòu)建模型-模型分析-模型評估,整體有從無到有的感覺,使用深度逐漸加深,比較符合預(yù)期。
③ 產(chǎn)品友好
功能細(xì)節(jié)上做的比較出色,感觸較深的第一是數(shù)據(jù)集的預(yù)覽,這樣可以直接看見數(shù)據(jù)集的概覽和樣式,線上和本地會有數(shù)據(jù)解析的格式問題,第二個是模型的推薦,會根據(jù)內(nèi)容的選擇推薦相對應(yīng)的模型,有充足的解釋性引導(dǎo)和應(yīng)用示例。
2)產(chǎn)品功能
- 模型構(gòu)建:模型構(gòu)建速度較快,這個有點(diǎn)超出預(yù)期。
- 模型評價:模型分析可以直接查看到相關(guān)性已經(jīng)數(shù)據(jù)更強(qiáng)的透視能力,這個能力提升了很多效率。
3)優(yōu)化功能
- 數(shù)據(jù)集兼容能力:這個針對不同數(shù)據(jù)源可以在上傳做檢驗(yàn)和預(yù)覽,前置風(fēng)險暴露能力。
- 模型調(diào)優(yōu)能力:增強(qiáng)平臺對模型進(jìn)行調(diào)優(yōu)的能力,比如可以考慮多個特征因子的融合、指標(biāo)區(qū)間分析等。
- 數(shù)據(jù)源能力:可以把數(shù)據(jù)源的上傳和存儲考慮融合在產(chǎn)品內(nèi)部。
2. 心路歷程
- 參賽目標(biāo):首先想了解一下當(dāng)前亞馬遜的產(chǎn)品力;其次就是想在整個過程中梳理一下分析思路,復(fù)盤項(xiàng)目可以增加更多的思考。
- 參賽總結(jié):整體產(chǎn)品體驗(yàn)我覺得還不錯,有一點(diǎn)超出預(yù)期,后續(xù)會持續(xù)關(guān)注產(chǎn)品,也感謝人人都是產(chǎn)品經(jīng)理提供本次參賽的機(jī)會~
本文由 @芥末先生 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!