如何解決數(shù)據(jù)指標(biāo)口徑不統(tǒng)一的問(wèn)題?

1 評(píng)論 4648 瀏覽 21 收藏 8 分鐘

在數(shù)據(jù)產(chǎn)品的面試過(guò)程中,數(shù)據(jù)對(duì)不上、指標(biāo)不一致是數(shù)據(jù)化運(yùn)營(yíng)過(guò)程繞不過(guò)的坎,這個(gè)問(wèn)題很容易考察候選人是否真的有實(shí)踐經(jīng)驗(yàn)了。具體如何解決?請(qǐng)看作者的分享。

數(shù)據(jù)產(chǎn)品面試時(shí),指標(biāo)體系、指標(biāo)口徑是一個(gè)非常高頻的問(wèn)題,主要是因?yàn)閿?shù)據(jù)指標(biāo)是數(shù)據(jù)驅(qū)動(dòng)分析的核心應(yīng)用場(chǎng)景,而數(shù)據(jù)對(duì)不上、指標(biāo)不一致是數(shù)據(jù)化運(yùn)營(yíng)過(guò)程繞不過(guò)的坎,這個(gè)問(wèn)題很容易考察候選人是否真的有實(shí)踐經(jīng)驗(yàn)了。

一、首先認(rèn)可指標(biāo)口徑不統(tǒng)一的客觀存在

數(shù)據(jù)在分析應(yīng)用的過(guò)程中,經(jīng)常會(huì)因?yàn)槊?guī)范、數(shù)據(jù)處理邏輯、業(yè)務(wù)定義、統(tǒng)計(jì)方法等各種原因?qū)е聰?shù)據(jù)對(duì)不上的情況,包括:

  • 同名不同義,指標(biāo)名稱相同,統(tǒng)計(jì)口徑不一致,缺少命名規(guī)范限制,不同業(yè)務(wù)僅從自己部門出發(fā),缺少全局視角,如財(cái)務(wù)口徑的營(yíng)收要嚴(yán)格按照嚴(yán)謹(jǐn)?shù)倪壿嬘?jì)算實(shí)收實(shí)付的每一分錢,而產(chǎn)品/運(yùn)營(yíng)端則更多考慮轉(zhuǎn)化效果,但在各自的KPI監(jiān)控報(bào)表中,都把指標(biāo)命名為營(yíng)收
  • 同義不同名,指標(biāo)統(tǒng)一邏輯一致,但不同產(chǎn)品命名不一致,不同階段、或不同業(yè)務(wù)方/產(chǎn)品經(jīng)理對(duì)指標(biāo)命名不同,導(dǎo)致在不同數(shù)據(jù)產(chǎn)品頁(yè)面,同一指標(biāo)不同名
  • 口徑不清晰,只是同義詞再?gòu)?fù)述一遍,如活躍用戶數(shù):訪問(wèn)用戶數(shù)
  • 命名難理解,表意不清模棱兩可,或過(guò)于專業(yè)化僅指標(biāo)創(chuàng)建人才可以懂。例如轉(zhuǎn)化率指標(biāo),有創(chuàng)單轉(zhuǎn)化率、成單轉(zhuǎn)化率,直接叫轉(zhuǎn)化率可讀性就非常差。
  • 邏輯不準(zhǔn)確,指標(biāo)口徑描述有誤,例如UV指標(biāo),口徑描述為“按照設(shè)備ID去重”,實(shí)際上不同平臺(tái)去重邏輯并不一致,如微信小程序按照UnionID去重、APP按照DeviceID去重,PC和H5按照l(shuí)oginkey去重。
  • 數(shù)據(jù)難追溯,數(shù)據(jù)產(chǎn)品指標(biāo)數(shù)據(jù)來(lái)源缺少直觀的鏈路追蹤能力,指標(biāo)數(shù)據(jù)異常問(wèn)題排查通過(guò)翻代碼去看數(shù)據(jù)來(lái)源,路徑長(zhǎng),耗時(shí)久,早上業(yè)務(wù)反饋指標(biāo)問(wèn)題,排查出結(jié)論后可能一上午就過(guò)去了。
  • 數(shù)據(jù)質(zhì)量差,指標(biāo)管理常見的問(wèn)題綜合在一起,往往會(huì)導(dǎo)致業(yè)務(wù)對(duì)數(shù)據(jù)指標(biāo)的信任度大打折扣,發(fā)現(xiàn)數(shù)據(jù)波動(dòng)后,第一反應(yīng)是先和數(shù)據(jù)部門確認(rèn)數(shù)據(jù)是不是有問(wèn)題,而不是去考慮業(yè)務(wù)上有何變動(dòng)。

二、分析問(wèn)題產(chǎn)生的原因

數(shù)據(jù)指標(biāo)口徑不統(tǒng)一的問(wèn)題主要源于以下幾個(gè)原因:

  • 組織結(jié)構(gòu)和職能分工:不同組織或部門可能有不同的職能和任務(wù),這導(dǎo)致它們對(duì)數(shù)據(jù)的需求和關(guān)注點(diǎn)有所不同,比如產(chǎn)品部門關(guān)注App下載、激活、轉(zhuǎn)化,運(yùn)營(yíng)部門關(guān)注用戶活躍度、交易量,市場(chǎng)部門關(guān)注廣告投放鏈路追蹤等,因此可能使用不同的指標(biāo)和定義來(lái)衡量績(jī)效。
  • 缺乏統(tǒng)一規(guī)范:每個(gè)部門都有自己的數(shù)據(jù)分析需求,如果缺少統(tǒng)一的數(shù)據(jù)歸口部門,各自為政,導(dǎo)致缺乏統(tǒng)一規(guī)范,經(jīng)常出現(xiàn)同名不同義或指標(biāo)口徑有二義性的現(xiàn)象,導(dǎo)致使用者錯(cuò)誤使用指標(biāo)。
  • 人為誤差:在數(shù)據(jù)處理和分析過(guò)程中,人為誤差也可能導(dǎo)致指標(biāo)口徑不一致,例如數(shù)據(jù)清洗和轉(zhuǎn)換過(guò)程中可能會(huì)出現(xiàn)錯(cuò)誤,統(tǒng)計(jì)方法的選擇可能存在偏差等,不同數(shù)據(jù)開發(fā)人員開發(fā)的指標(biāo)、不同階段進(jìn)行的邏輯變更都會(huì)導(dǎo)致數(shù)據(jù)對(duì)不上的情況。

三、解決問(wèn)題的思路和方法

指標(biāo)體系建設(shè)與管理:圍繞業(yè)務(wù)整體戰(zhàn)略目標(biāo)和經(jīng)營(yíng)計(jì)劃,逐步建立全面反映業(yè)務(wù)健康度的指標(biāo)體系,包括核心指標(biāo)、指標(biāo)統(tǒng)計(jì)邏輯等,確保所有業(yè)務(wù)線條都遵循相同的指標(biāo)定義和口徑,并建立指標(biāo)生產(chǎn)的SOP流程

數(shù)據(jù)標(biāo)準(zhǔn)建設(shè):明確業(yè)務(wù)認(rèn)可的指標(biāo)口徑,制定數(shù)據(jù)標(biāo)準(zhǔn)以描述企業(yè)需要遵守的屬性層數(shù)據(jù)的含義和業(yè)務(wù)規(guī)則,確保人們對(duì)同一數(shù)據(jù)的共同理解和遵守。

確認(rèn)數(shù)據(jù)來(lái)源和處理方式:在進(jìn)行數(shù)據(jù)處理和分析之前,需要確認(rèn)數(shù)據(jù)來(lái)源和處理方式是否一致。如果不一致,需要進(jìn)行相應(yīng)的調(diào)整和修正。

檢查數(shù)據(jù)口徑:在進(jìn)行數(shù)據(jù)處理和分析時(shí),需要檢查不同業(yè)務(wù)線條使用的數(shù)據(jù)口徑是否一致,確保指標(biāo)口徑的統(tǒng)一性。

指標(biāo)管理系統(tǒng)化:指標(biāo)化管理的概念很多年前就存在,各個(gè)互聯(lián)網(wǎng)公司都在建設(shè)自己的管理平臺(tái),學(xué)習(xí)了很多關(guān)于指標(biāo)管理系統(tǒng)建設(shè)的文章會(huì)發(fā)現(xiàn),做的事情大同小異。主要是圍繞指標(biāo)管理的痛點(diǎn)問(wèn)題,以阿里的OneData理論為方法論依據(jù),相同的事情只要做一遍,剩下的是提供產(chǎn)品化的解決方案,讓指標(biāo)建設(shè)、指標(biāo)復(fù)用更加的規(guī)范和高效。主要包括:

  • 建立指標(biāo)生產(chǎn)協(xié)同機(jī)制,指標(biāo)的誕生要經(jīng)過(guò)需求申請(qǐng)、審核、數(shù)據(jù)開發(fā)、上線應(yīng)用流程,收口指標(biāo)創(chuàng)建過(guò)程,避免指標(biāo)建設(shè)的隨意性帶來(lái)的“污染”
  • 制定指標(biāo)命名、口徑說(shuō)明規(guī)范,按照原子指標(biāo)+業(yè)務(wù)限定+統(tǒng)計(jì)維度的方式,將規(guī)則集成到平臺(tái)內(nèi),通過(guò)系統(tǒng)規(guī)則來(lái)把控指標(biāo)輸出
  • 指標(biāo)字典線上化,解決線下文檔(excel)管理指標(biāo)存在的共享難、更新不及時(shí)、權(quán)限管控缺失等問(wèn)題
  • 指標(biāo)數(shù)據(jù)邏輯綁定,即除了維護(hù)指標(biāo)的業(yè)務(wù)元數(shù)據(jù)外,還要建立指標(biāo)的技術(shù)元數(shù)據(jù),指標(biāo)數(shù)據(jù)從哪個(gè)模型、哪個(gè)字段、何種計(jì)算邏輯得到
  • 指標(biāo)輸出,指標(biāo)管理最大的價(jià)值還是為數(shù)據(jù)產(chǎn)品提供數(shù)據(jù)輸出,將Hive層模型同步到MySQL、Greenplumn、Kylin、CK等查詢性能更優(yōu)可以秒級(jí)響應(yīng)的查詢引擎,通過(guò)接口調(diào)用JDBC連接方式直接獲取數(shù)據(jù)。

培訓(xùn)和溝通:加強(qiáng)不同業(yè)務(wù)線條之間的溝通和培訓(xùn),確保大家對(duì)數(shù)據(jù)指標(biāo)口徑有共同的理解和認(rèn)識(shí),減少誤解和歧義。

本文由人人都是產(chǎn)品經(jīng)理作者【數(shù)據(jù)干飯人】,微信公眾號(hào):【數(shù)據(jù)干飯人】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 調(diào)研業(yè)務(wù)規(guī)則,明確不一致,建立映射,清洗數(shù)據(jù)

    來(lái)自江蘇 回復(fù)