以好奇心日報為業(yè)務(wù)原型,說說大數(shù)據(jù)平臺的數(shù)據(jù)建模過程
今天我們以好奇心日報為業(yè)務(wù)原型,探討下數(shù)據(jù)模型建設(shè)過程(本人非好奇心員工,好奇心老板看見如果覺得對數(shù)據(jù)化運營有所幫助記得給我加雞腿)。
數(shù)據(jù)模型是數(shù)據(jù)平臺的基石,是平臺搭建過程中最最基礎(chǔ)、也是最最重要的環(huán)節(jié),為后續(xù)數(shù)據(jù)清洗(ETL)、開發(fā)數(shù)據(jù)報表等工作保駕護航。數(shù)據(jù)建模做的好,后面工作也會更容易,模型做的不到位,一些報表做起來耗時耗力又吃資源,甚至無法實現(xiàn)。
數(shù)據(jù)建模一般要經(jīng)歷主題和主題域分析、概念模型、維度設(shè)計、指標(biāo)整理、邏輯模型、物理模型。
好奇心是內(nèi)容型產(chǎn)品,有NEWS、LABS兩個頻道,有不同新聞分類和獨立的欄目,商業(yè)模式以在線廣告為主。
為什么選好奇心日報?一方面它確實是目前魚龍混雜的內(nèi)容產(chǎn)業(yè)中的一股清流,新媒體的一個標(biāo)桿,以好奇心驅(qū)動堅持做有品質(zhì)的內(nèi)容、篩選最有價值信息、全球最新動態(tài); 更主要的是它的產(chǎn)品線全面,有APP、PC網(wǎng)站、移動網(wǎng)站、訂閱號、小程序,同時也運營著今日頭條、網(wǎng)易、微博等各大媒體公號,且成績有目共睹。產(chǎn)品線全面、業(yè)務(wù)規(guī)模適中,作為業(yè)務(wù)原型討論數(shù)據(jù)建模最合適不過了。
案例說明
了解數(shù)據(jù)倉庫的,都知道數(shù)據(jù)倉庫是面向主題,也就是其中的數(shù)據(jù)是按主題進(jìn)行組織的。
首先從分析主題入手,主題是在較高層次上對業(yè)務(wù)數(shù)據(jù)進(jìn)行梳理、歸類,一個主題基本對應(yīng)一個宏觀的分析面。
主題域是確定主題中包括的數(shù)據(jù)分析范圍及邊界,確定了主題及主題域,數(shù)據(jù)平臺對外輸出能力也基本確定了。
好奇心業(yè)務(wù)來說可以分為內(nèi)容生產(chǎn)運營、營銷、用戶、廣告收入四個方面;再對主題進(jìn)一步細(xì)化出子主題,例如廣告主題可以拆除訂單分析、營收分析、廣告位分析、品牌主分析、業(yè)績分析,子主題也就是主題的邊界。
下面我們分別展開說說四個主題的內(nèi)容:
用戶分析
分基本信息、行為分析、商業(yè)興趣三個子主題。
- 基本信息就是常見的人口屬性,包括性別、年齡、地域、職業(yè)、職務(wù)、月收入等;
- 行為分析包括用戶觸點(用戶訪問好奇心的入口,是App,還是訂閱號,還是同時使用多個)、習(xí)慣時段、訪問軌跡、評論、參與投票等互動行為;
- 商業(yè)興趣是指用戶對那些新聞分類、欄目、或者內(nèi)容主題的喜好程度,可以用于指導(dǎo)內(nèi)容生產(chǎn)和個性化推薦。
內(nèi)容運營
可以分為流量分析、內(nèi)容分析、作者分析、第三方平臺分析。
- 流量分析就是常規(guī)的網(wǎng)站、App的各頻道、欄目的PV、UV、日活數(shù)等等指標(biāo),同時還要按媒介來源細(xì)化到Organic、Syndication、Socail等不同維度和維層;
- 內(nèi)容分析可以從單篇文章、單個分類進(jìn)行分析。例如獲取某一篇文章在不同平臺的閱讀量、點贊數(shù)、互動數(shù),也可以分析某篇熱點文章從發(fā)布、預(yù)熱、引爆、衰退的過程;
- 作者分析是從生產(chǎn)者角度進(jìn)行匯總分析,作者的文章產(chǎn)量、文章閱讀數(shù)、互動數(shù)、用戶喜好程度等等分析,如果每個編輯記者都制定了KPI就可以很快捷的知道KPI達(dá)成情況。
- 第三方平臺分析是指分析分發(fā)到訂閱號、小程序、今日頭條號、網(wǎng)易號上的閱讀、互動、分析、回流情況。
營銷推廣
分為推廣分析、渠道分析、活動分析。
- 推廣分析是指付費廣告推廣,匯總投放目標(biāo)、曝光展示、點擊、下載激活,進(jìn)行推廣效果評估,獲客成本分析;
- 渠道分析是從渠道角度分析用戶留存、活躍、互動,以評估渠道質(zhì)量,渠道和推廣還是有區(qū)別的,例如在今日頭條這個媒體渠道,會做多次推廣。
- 活動分析一般是市場、運營組織的用戶參與的營銷活動分析、接觸人數(shù)、參與人數(shù)、轉(zhuǎn)化人數(shù)等等。
廣告收入
分為營收分析、廣告訂單分析、廣告位分析、品牌主分析。
從總收入、訂單、單個廣告位、品牌主、銷售經(jīng)理、銷售大區(qū)不同維度分析收入貢獻(xiàn),挖掘銷售潛力,降低廣告庫存,提高售賣率和廣告單價。
模型建立
概念模型
是主題的基礎(chǔ)上,識別出主題中的對象,以及建立對象之間的關(guān)系,列出對象的較核心的屬性。
例如我們?yōu)楹闷嫘娜請筇釤挸霎a(chǎn)品(App、PC網(wǎng)站、小程序等)、用戶、用戶行為、文章、編輯等對象,并描述了對象之間的關(guān)系以及表述對象的核心屬性。
邏輯模型
是將概念模型具象化,為對象增加必要的屬性。
下圖是使用一款在線工具ProcessOn畫的部分邏輯模型,還可以使用更專業(yè)的建模工具ERWin和PowerDesigner。
物理模型
是把上述邏輯模型的內(nèi)容,在具體的物理介質(zhì)上實現(xiàn)出來,確定字段類型、取值范圍、采用MySQL、Oracle等建立數(shù)據(jù)庫表,這里就不詳細(xì)展開介紹。
最后對業(yè)務(wù)涉及的維度和度量進(jìn)行梳理,維度越豐富,粒度越細(xì),做數(shù)據(jù)分析時就可以挖地越深入。
正如數(shù)據(jù)倉庫權(quán)威專家Kimball所說:數(shù)據(jù)倉庫的能力直接與維度屬性的質(zhì)量和深度成正比。比如時間維度可以分為季度、月、周、日四個層次,但周和日還可以還可以細(xì)化出周天、日時段兩個子維度,匯總一段時間內(nèi)的周一到周日的啟動次數(shù)(日然運營,排除推廣干擾),可以看出用戶從周一到周日的使用規(guī)律,同時還可以組合地域,看某一地方用戶周一到周日的使用規(guī)律,日時間段同理。當(dāng)然粒度越細(xì),對數(shù)據(jù)收集和處理的要求越高。
維度建模
維度建模有專門的方法論,需要根據(jù)業(yè)務(wù)規(guī)模、最終需求設(shè)計合理的維度模型。
下面是根據(jù)業(yè)務(wù)梳理的維度和度量指標(biāo),大家可以嘗試組合下,是否能夠滿足日常運營的需要,如果覺得不夠可以考慮下怎么擴展。
維度
用戶
- 基本信息:性別、年齡、職業(yè)、職務(wù)、月收入、教育、婚姻狀況、子女?dāng)?shù)、地域
- 興趣標(biāo)簽,標(biāo)簽可分大類、小類
時間
- 月、周、日、時
- 日時段
- 周天
地域
- 省
- 一級、二級、三級城市
- 北上廣深
流量來源
Syndication
- Toutiao、網(wǎng)易、一點等
Organic
- Search、Referral、Direct
Socail
- Weixin、Weibo、QQ
營銷渠道
應(yīng)用分發(fā)渠道
- 應(yīng)用市場(AppStore、應(yīng)用寶、華為市場等)、官方網(wǎng)站
廣告推廣
- 媒體品牌:騰訊、百度、網(wǎng)易……
廣告位名稱
廣告位類型
- 廣告位平臺:PC、移動
投放創(chuàng)意
Socail
- Weixin、Weibo、QQ
- SM
- Newsletter
活動
- Campain List
產(chǎn)品及版本
- iOS、Android、小程序、PC、Mobile、微信訂閱號、頭條號、網(wǎng)易號、微博頭條
- 4.1、4.2
設(shè)備
- 操作系統(tǒng)、設(shè)備品牌、服務(wù)提供商、聯(lián)網(wǎng)方式、屏幕分辨率
業(yè)務(wù)
- 內(nèi)容分類:頻道(News 、Labs)、新聞分類、欄目
- 作者、編輯
廣告
- 廣告平臺:移動平臺、PC平臺
- 廣告位名稱(App焦點圖、App信息流、PC)
- 廣告位類型(移動開屏、移動原生、移動banner、移動插屏、PC頂通、PC焦點圖)
- 創(chuàng)意形式(640×100單圖、240×180多圖、640×360視頻、14字文字鏈)
- 訂單
- 廣告主
- 廣告主所屬行業(yè)
指標(biāo)體系
用戶指標(biāo)
- 新增注冊數(shù)、活躍用戶數(shù)、流失用戶數(shù)、登錄用戶數(shù)、分發(fā)平臺粉絲數(shù)
流量指標(biāo)
- 累計下載量、新增下載量、激活量、日活數(shù)、啟動次數(shù)、屏幕瀏覽量、使用時長、留存率、計劃推送數(shù)、推送達(dá)到數(shù)、推送到達(dá)率、推送喚醒數(shù)、推送喚醒率
行為指標(biāo)
- 閱讀數(shù)、點贊數(shù)、分享數(shù)、評論數(shù)、訂閱數(shù)、參與投票數(shù)、發(fā)布我說、點擊廣告、推送點擊、推送打開率
廣告指標(biāo)
- 曝光量、點擊量、點擊率、銷售額、訂單數(shù)、訂單單價、庫存量
模型指標(biāo)
- 用戶構(gòu)成(用戶地域、年齡段)、商業(yè)興趣
題圖來自 Unsplash ,基于 CC0 協(xié)議
作者:百川,微信公眾號:修煉大數(shù)據(jù)(studybigdata)
本文由 @百川 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
講的很清晰,理解的很透徹
對建模感興趣的移步這里 http://mp.weixin.qq.com/s/bl01KvBGzl5TgbfvuuGO3Q
我
social 哥
維度被編輯改的有點亂哈
這就完了?
的確維度建模還有很多細(xì)節(jié),有時間再整理
雞腿