MarTech?-CDP實戰(zhàn)手冊:CDP交付階段-標簽規(guī)劃(十)
MarTech?-CDP實戰(zhàn)手冊是作者在平臺分享的一個系列文章,之前作者和我們分享了交付階段的相關內(nèi)容,這篇文章,一起來解析一下標簽部分怎么做。
標簽規(guī)劃
標簽規(guī)劃需要先了解標簽的分類,根據(jù)標簽的分類進行梳理,分類包含事實標簽、規(guī)則標簽、預測標簽。
1)事實標簽
屬性標簽是相對比較穩(wěn)定的標簽,主要以客戶的性別、年齡、地區(qū)等,在梳理屬性標簽時需要考慮相同屬性多源流入,如果有數(shù)據(jù)中臺則需要數(shù)據(jù)中臺進行融合,輸出唯一屬性,若無數(shù)據(jù)中臺則需在CDP中進行屬性的來源的優(yōu)先級調(diào)配,保證屬性標簽數(shù)據(jù)質(zhì)量。
2)規(guī)則標簽
沒有直接對應數(shù)據(jù),需要通過規(guī)則進行定義,規(guī)則包含屬性、行為、標簽的交并排進行配置產(chǎn)出,規(guī)則標簽初期往往不會特別多,因為屬于靈活可配置的標簽,事實標簽足夠全面,基本上可以覆蓋所有規(guī)則標簽。規(guī)則標簽構(gòu)建類型有商業(yè)價值標簽、用戶偏好標簽、生命周期標簽、營銷時機標簽。
3)預測標簽
參考已有事實數(shù)據(jù),來預測用戶的行為或偏好。比如用戶a的歷史購物行為與群體A相似,使用協(xié)同過濾算法,預測用戶a也會喜歡某件物品。
4)標簽規(guī)劃流程
業(yè)務場景梳理-標簽規(guī)劃-行為建模-口徑確認-數(shù)據(jù)加工-標簽驗證-規(guī)范運營。
5)業(yè)務場景梳理
業(yè)務場景確認:一般根據(jù)業(yè)務部門或生命周期進行梳理,規(guī)劃業(yè)務場景,并通過業(yè)務場景進行流程梳理,根據(jù)每個節(jié)點進行標簽規(guī)劃。
① 生命周期確定業(yè)務場景:
② 增長階段確定業(yè)務場景:
③ 業(yè)務需求確認業(yè)務場景:
1. 標簽規(guī)范
因格式問題無法直接展示表格,需要表格模板可留言溝通。
標簽規(guī)劃表:
標簽命名規(guī)范:
標簽舉例
2. 行為模型
行為模型需要進行行為數(shù)據(jù)源梳理,如果有第三方接入的話則直接對接第三方即可,業(yè)務內(nèi)部部分行為也需要進行梳理,構(gòu)建統(tǒng)一的行為模型,幫助CDP進行實時、離線的行為接入。
構(gòu)建并梳理建立用戶行為模型,先基于業(yè)務場景,構(gòu)建業(yè)務模型,通過統(tǒng)一的建模,統(tǒng)一業(yè)務口,根據(jù)數(shù)據(jù)實際情況,建立數(shù)據(jù)模型,并基于對齊的數(shù)據(jù)口徑上開發(fā)。
行為數(shù)據(jù)模型在車企行業(yè)通常包括“用戶行為主題”,“訂單主題”,“用戶權益主題”,通過多個業(yè)務主題可以比較容易的描述常見的用戶行為。
字段介紹:模型名稱:模型寬表名稱/ 行為名稱;單一行為名稱/ 模型;模型字段:可包括維度度量型字段;數(shù)據(jù)口徑:關聯(lián)哪些維度,事實表的哪些字段,進行建模。
3. 口徑確認
口徑確認其實分為兩步,在原有系統(tǒng)中肯定涉及到部分標簽,需要將之前標簽與新標簽進行映射,名稱未改則不需要確認,如果有偏差或者修改或者通過標簽調(diào)研發(fā)現(xiàn)多個業(yè)務標簽命名或規(guī)則不一致,則需要進行各個業(yè)務線口凈統(tǒng)一。
4. 數(shù)據(jù)加工
數(shù)據(jù)加工要考慮兩點,其一為數(shù)據(jù)加工清晰化流程,其二則為數(shù)據(jù)加工過程中的安全性。
數(shù)據(jù)加工流程圖:數(shù)據(jù)源-數(shù)據(jù)中臺(數(shù)倉)-CDP應用數(shù)據(jù)構(gòu)建,從ODS進行數(shù)據(jù)清洗后,進入到DWD層,再流入DWS層,其中DIM層可與DWD和DWS聯(lián)動應用,在進入DM層進行整合,最終流入CDP進行ADS構(gòu)建從而提供給上層進行應用。
數(shù)據(jù)安全:數(shù)據(jù)安全屬于在數(shù)據(jù)中臺的范圍內(nèi)要考慮的,但在標簽規(guī)劃時涉及到比較多的敏感數(shù)據(jù),因此需要在這個階段考慮到數(shù)據(jù)安全性的問題,給相應的數(shù)據(jù)中臺提出安全性需求,確保數(shù)據(jù)傳輸?shù)牡陌踩€(wěn)定。每個公司的安全范圍可顆粒度不同,而且數(shù)據(jù)安全是個大項這里不做額外拓展。
需要遵循以下原則:
5. 標簽驗證
數(shù)據(jù)源質(zhì)量驗證,對ODS、DM層進行數(shù)據(jù)質(zhì)量評估,真實性 > 60% 被認為較為可信。
八維評估數(shù)據(jù)源各數(shù)據(jù)項的質(zhì)量:
- 完整性:空值檢查;
- 規(guī)范性:引證數(shù)據(jù);
- 及時性:延時時長;
- 唯一性:重復性檢查;
- 一致性:數(shù)據(jù)比對;
- 關聯(lián)性:業(yè)務檢查;
- 有效性:字段是否符合格式;
- 真實性:與實際值比較。
標簽表計算準確度:繼承DM層的各數(shù)據(jù)項完整性、真實性,且要求基于此數(shù)據(jù)項的標簽計算準確度達到99.9%.
- 與DM層進行比較,確保數(shù)據(jù)一致。
- 邏輯錯誤驗證:如年齡是否超出正常駕齡范圍等。
- 取值單一性驗證:確保一個主體在一個標簽上只有一個值,如同一個客戶在性別標簽上,同一時間點不能既有“男”取值、又有“女”取值。
- MECE原則驗證:確保通過規(guī)則切片后,各標簽值對應的用戶量累加是全部用戶,不能少也不能多。
- 模型算法合理性驗證:模型算法的設計邏輯符合業(yè)務邏輯,測試集與訓練集樣本分配合理。
業(yè)務準確度:在業(yè)務過程中驗證,通過設計業(yè)務策略或AB測試,從業(yè)務角度評估標簽值的準確度。
- 業(yè)務反饋驗證:銷售顧問或其他業(yè)務人員可在標簽使用過程中給予反饋,并提交開發(fā)進行數(shù)據(jù)源數(shù)據(jù)項的修正。
- 通過設計問卷調(diào)研等相關活動收集數(shù)據(jù),增加數(shù)據(jù)源可信度。
- 模型算法準確率驗證:用AUC指標來衡量模型的準確率,一般AUC>0.8是比較好的表現(xiàn)。
- 通過使用相關標簽圈定客群做POC驗證,設置AB測試,根據(jù)觸達客群后的轉(zhuǎn)化效果對比對照組的表現(xiàn)來評估;若顯著低于對照組,則需要排查標簽準確度。
6. 規(guī)范運營
除了在標簽設計需要規(guī)范化設計外,在標簽實施過程也需要有標準化的流程進行把控,保證標簽有序的開發(fā)實施。
與此同時需要進行標簽的權限和審核流程的規(guī)劃,標簽權限體系需要細化和內(nèi)置到系統(tǒng)中,總得來說,有兩類權限可以會直接影響到業(yè)務流程和數(shù)據(jù)安全。
業(yè)務權限:通過將權限授權給固定角色,進而對于功能權限進行精細化管控;以下為舉例的角色打來,根據(jù)實際企業(yè)和業(yè)務會有更細分的范圍。
數(shù)據(jù)權限:通過將標簽可擁有,可查看的權限,授權給標簽的創(chuàng)建和使用者。
7. 經(jīng)驗總結(jié)
標簽規(guī)劃:
切記大而全:標簽隨著業(yè)務走,大而全的標簽會使標簽開發(fā)成本、運營成本、運維成本增加,標簽設計時應該場景化,開發(fā)采取少兒精、小步快跑的規(guī)劃思路,優(yōu)先實時數(shù)據(jù)質(zhì)量高、業(yè)務需求強的標簽。
標簽質(zhì)量:
ID打不通,會導致多端多平臺無法實現(xiàn)標簽一體化,往往會出現(xiàn)業(yè)務系統(tǒng)上標簽A,SCRM中也出現(xiàn)類似標簽A的標簽,導致標簽定義一致但為打通,因此應該從數(shù)據(jù)治理曾進行oneid體系的構(gòu)建,打通全域數(shù)據(jù),并將標簽統(tǒng)一化管理。
標簽無法驗證,如果前期未考慮標簽的驗證流程,會導致標簽構(gòu)建完成后無法對標簽進行驗證草草上線可能對運營造成偏差,因此在抱歉構(gòu)建時就需要考慮標簽數(shù)據(jù)驗證及業(yè)務驗證的雙重驗證,對不同類型的標簽進行標準化逐層驗證。
數(shù)據(jù)質(zhì)量太差,數(shù)據(jù)質(zhì)量差會導致標簽不完善甚至無法落地使用,對于這點在規(guī)劃階段是要進行數(shù)據(jù)勘察,確定哪些高優(yōu)標簽的數(shù)據(jù)出現(xiàn)缺失,優(yōu)先對于該數(shù)據(jù)員進行數(shù)據(jù)治理和數(shù)據(jù)補全,確保標簽可實施可落地。
本文由 @光波 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
感謝作者 請教一下個體標簽結(jié)果對外輸出 會有什么邊界和注意事項么?
請問一下樓主,數(shù)據(jù)中臺的數(shù)據(jù)進入到CDP平臺后,是在CDP平臺還會二次過濾嗎,過濾出自己想要的數(shù)據(jù),并打上相應的標簽, 還是所有的數(shù)據(jù)處理都在數(shù)據(jù)中臺過濾處理,有什么需求,就給數(shù)據(jù)中臺的數(shù)倉提了,他們開發(fā)完了,提供給上層的CDP平臺