為數(shù)據(jù)分析發(fā)愁?5道測(cè)試題解決你的問(wèn)題
對(duì)于數(shù)據(jù)分析項(xiàng)目,很多人可能不知道如何下手,動(dòng)手做之后又總是效率不高、效果不好。本文作者針對(duì)這個(gè)問(wèn)題設(shè)置了5道測(cè)試題,來(lái)闡述如何做數(shù)據(jù)分析項(xiàng)目。
臨近年底,很多同學(xué)問(wèn):“如何做出優(yōu)秀的數(shù)據(jù)分析項(xiàng)目?不然年終總結(jié)都不知道咋寫”。
今天系統(tǒng)回答一下,想做好數(shù)據(jù)分析類項(xiàng)目,主要靠的是:樹立正確的觀念。
這里有5道測(cè)試題,一起來(lái)測(cè)一測(cè)自己有多大可能做出好項(xiàng)目。
五道測(cè)試題
題目一(單選題)
做數(shù)據(jù)分析,項(xiàng)目好壞的衡量指標(biāo)是什么?
- A. 時(shí)間、成本、質(zhì)量
- B. 算法難度、統(tǒng)計(jì)學(xué)知識(shí)、數(shù)學(xué)公式
這個(gè)題目是最重要的觀念,直接決定了一個(gè)數(shù)據(jù)分析師在當(dāng)前公司混的好壞。
數(shù)據(jù)分析工作有它的特殊性:
- 它不同于銷售,不能直接為公司創(chuàng)收;
- 它不同于運(yùn)營(yíng),不能直接拉升活躍\留存\付費(fèi)指標(biāo);
- 它不同于交易/網(wǎng)站/ERP系統(tǒng)的開發(fā),這些系統(tǒng)是業(yè)務(wù)必須的支撐;
- 它不同于DBA,沒(méi)有DBA的公司不存在,沒(méi)有專職分析師的公司大把
數(shù)據(jù)分析工作,本質(zhì)上是一個(gè)可替代程度很高的輔助崗位。在數(shù)據(jù)分析觀念普及前,很多公司都是找個(gè)會(huì)寫sql的程序員來(lái)頂找個(gè)崗位的。就像瞄準(zhǔn)鏡與槍的關(guān)系,沒(méi)有瞄準(zhǔn)鏡槍照打,有了瞄準(zhǔn)鏡,槍可以打得更準(zhǔn)。
因此,雖然數(shù)據(jù)分析背后有算法、統(tǒng)計(jì)學(xué)、數(shù)據(jù)做支撐,可企業(yè)關(guān)心的不是這些書本章節(jié),而是到底對(duì)業(yè)務(wù)有什么用?有多大用?
同企業(yè)里其他項(xiàng)目一樣,數(shù)據(jù)分析項(xiàng)目最重要的就是考察時(shí)間、成本、質(zhì)量。
如果脫離了這些,空洞地追求“我用的方法好復(fù)雜,我好厲害”。那還是在學(xué)校里做科研好了,科研才需要追求高精尖。
企業(yè)里追求的是:在達(dá)成目標(biāo)的情況下,成本越低越好,時(shí)間越短越好。
所以這個(gè)題一定選A。
很多剛畢業(yè)的、轉(zhuǎn)行的、新加入的數(shù)據(jù)分析師喜歡選B,選B也不代表沒(méi)前途。因?yàn)檫xB的同學(xué)會(huì)花很大精力死磕書本,這樣雖然在一個(gè)公司混不起來(lái),但是在跳槽的時(shí)候過(guò)面試的能力還是可以的,所以也能通過(guò)一年一跳槽來(lái)漲薪。但是想在一個(gè)公司做出成績(jī),還是選A的好。
這個(gè)題目最關(guān)鍵,明白了這個(gè)題目,后邊的問(wèn)題就迎刃而解了。
題目二(排序題)
以下人員,對(duì)數(shù)據(jù)分析項(xiàng)目質(zhì)量的話語(yǔ)權(quán)排序。
- A. 業(yè)務(wù)部門領(lǐng)導(dǎo)
- B. 數(shù)據(jù)部門領(lǐng)導(dǎo)
- C. 業(yè)務(wù)部門員工
- D. 數(shù)據(jù)部門員工(本人)
如果問(wèn)題一吃透了,這個(gè)題毫無(wú)難度,答案是A≥B≥C≥≥D。
領(lǐng)導(dǎo)意見(jiàn)大于員工意見(jiàn),如果業(yè)務(wù)部門領(lǐng)導(dǎo)首肯,數(shù)據(jù)部門領(lǐng)導(dǎo)就直接應(yīng)聲附和了。如果業(yè)務(wù)部門領(lǐng)導(dǎo)不發(fā)聲,那就看數(shù)據(jù)部門領(lǐng)導(dǎo)是不是認(rèn)可。
本人的:我覺(jué)得我做的很牛逼,毫無(wú)意義,切記切記。
請(qǐng)注意,有時(shí)會(huì)有業(yè)務(wù)領(lǐng)導(dǎo)和數(shù)據(jù)領(lǐng)導(dǎo)態(tài)度不一致的情況,這時(shí)候以自己直接領(lǐng)導(dǎo)的態(tài)度為準(zhǔn),外部門稍后考慮。在大部分企業(yè),直接領(lǐng)導(dǎo)是決定自己績(jī)效評(píng)分的那個(gè),所以一定不能得罪。
題目三(排序題)
請(qǐng)對(duì)以下幾種項(xiàng)目成果,按質(zhì)量高低排序。
- A. 可視化的數(shù)據(jù)產(chǎn)品
- B. 每月定期輸出的數(shù)據(jù)模型
- C. 部門級(jí)以上會(huì)議的匯報(bào)ppt
- D. 無(wú)群體匯報(bào)的ppt
- E. Excel數(shù)據(jù)表
- F. 無(wú)固定格式的數(shù)字
- G. 寫sql跑完數(shù)口頭告訴業(yè)務(wù)
這個(gè)題完全解釋需要一整篇文章,但同學(xué)們可以用望文生義的辦法,直接作出回答,答案是:A=B≥C≥D=E≥F≥≥G。
數(shù)據(jù)分析的成果很容易被人當(dāng)夜壺:用的時(shí)候很爽,用完了就忘了,平時(shí)還嫌你臟。
所以做數(shù)據(jù)分析項(xiàng)目,要爭(zhēng)取輸出定期使用的、產(chǎn)品化的、大家必須看的成果。
最好就是上一套BI,或者業(yè)務(wù)的用戶跟進(jìn)名單用模型進(jìn)行優(yōu)化排序,讓大家不得不用。不濟(jì)的話,寫個(gè)ppt,但爭(zhēng)取在會(huì)議上公開講。
最差最差就是跑了一堆臨時(shí)需求單,寫了2000行sql結(jié)果連個(gè)正式輸出物都沒(méi)有,年底寫績(jī)效報(bào)告都不知道寫啥。
題目四(單選題)
今天是11月11日中午12點(diǎn),你的領(lǐng)導(dǎo)說(shuō),下班前給一個(gè)預(yù)計(jì),預(yù)測(cè)一下雙十一我們業(yè)績(jī)能到多少,你怎么做?
- A. 立馬回去建模,時(shí)間序列、XGboost搞起
- B. 回去找運(yùn)營(yíng)要推廣費(fèi)用使用情況,算個(gè)投入產(chǎn)出比來(lái)拍
- C. 回去看下上午數(shù)據(jù),根據(jù)去年同期拍一個(gè)
這個(gè)題非常有迷惑性,特別是剛看完上一題,很多同學(xué)會(huì)慣性選A。
這個(gè)題的題眼不是“預(yù)測(cè)”而是“中午12點(diǎn)到下班”,數(shù)據(jù)分析可以建模、可以做BI、可以做可視化,但是統(tǒng)統(tǒng)需要時(shí)間。
而很多情況下,業(yè)務(wù)不等人,必須快速給出結(jié)果。這時(shí)候要優(yōu)先選簡(jiǎn)單直接的辦法,并結(jié)合數(shù)據(jù)提示風(fēng)險(xiǎn)。所以,建模要學(xué)、統(tǒng)計(jì)學(xué)要學(xué)、如何快速合理地拍腦袋也要學(xué)。
很多新人夯吃夯吃搞了一堆模型,結(jié)果被領(lǐng)導(dǎo)三言兩語(yǔ)推翻,還被批斗“你都干嘛去了這么磨嘰”,就是這個(gè)原因。
這個(gè)題選C,最好是10分鐘內(nèi)給答案。領(lǐng)導(dǎo)指示“這個(gè)問(wèn)題非常重要,要用更復(fù)雜、更科學(xué)的方法”以后,再考慮A和B。
題目五(多選題)
數(shù)據(jù)分析的工作成本由什么構(gòu)成?
- A. 數(shù)據(jù)庫(kù)成本
- B. 電腦成本
- C. 開發(fā)軟件成本
- D. BI產(chǎn)品成本
- E. 數(shù)據(jù)采集質(zhì)量
- F. 數(shù)據(jù)清洗質(zhì)量
- G. 程序員工作時(shí)間
這個(gè)題也非常非常有迷惑性,如果在陳老師問(wèn)之前,很多人都?jí)焊鶝](méi)想過(guò)做數(shù)據(jù)分析的成本。
數(shù)據(jù)分析肯定有成本,而且最大的成本是數(shù)據(jù)質(zhì)量,好數(shù)據(jù)才有好分析,垃圾數(shù)據(jù)垃圾分析。特別是數(shù)據(jù)采集,業(yè)務(wù)流程漏洞百出,業(yè)務(wù)管理不規(guī)范,埋點(diǎn)不做好就上線,基礎(chǔ)數(shù)據(jù)臟亂差,沒(méi)法進(jìn)行分析。
至于什么軟件成本,電腦成本都是毛毛雨,數(shù)據(jù)質(zhì)量是涉及公司根本的問(wèn)題。所以這一題的答案是ABCDEFG,如果排序的話,是E≥≥F≥G≥A≥D≥B≥C
很多同學(xué)會(huì)問(wèn),為啥有G,而且排序還那么高?
因?yàn)閿?shù)據(jù)分析師的工作時(shí)間是非常寶貴的。
學(xué)校里、論文里、專利里那些巨復(fù)雜的模型,都是耗費(fèi)無(wú)數(shù)時(shí)間燒出來(lái)的。普通企業(yè)的數(shù)據(jù)分析師每日應(yīng)付各種取數(shù)、匯報(bào)、excel都已經(jīng)折騰半死了,連找對(duì)象都不一定有時(shí)間,根本沒(méi)有時(shí)間弄高精尖模型。
所以,必須考慮工作時(shí)間。日常需求要排優(yōu)先級(jí),集中精力做有產(chǎn)出的東西,那些亂七八糟“我要個(gè)數(shù)”讓他排隊(duì)去。
以上,做完5個(gè)題目,理解了題目思路,如何做優(yōu)秀的數(shù)據(jù)分析項(xiàng)目就呼之欲出了。
如何做優(yōu)秀的數(shù)據(jù)分析項(xiàng)目
- 正式立項(xiàng),把業(yè)務(wù)痛點(diǎn)作為項(xiàng)目目標(biāo);
- 考慮時(shí)間緊迫性和數(shù)據(jù)質(zhì)量,設(shè)計(jì)恰當(dāng)方法;
- 輸出定期使用的、產(chǎn)品化的、大家必須看的成果;
- 需求排序,給自己留出時(shí)間干高品質(zhì)工作;
- 用快捷分析方法應(yīng)付簡(jiǎn)單需求,留出精力做復(fù)雜需求。
為了取得好的效果,這里用了5個(gè)最常犯錯(cuò)的題目。
下次,我們拿一些具體需求,看怎么做能出彩。
作者:接地氣的陳老師,微信公眾號(hào):接地氣學(xué)堂。十年資歷的數(shù)據(jù)分析師,擁有多個(gè)行業(yè)的CRM經(jīng)驗(yàn)。
本文由 @接地氣的陳老師 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
已學(xué)習(xí)
歸納下這5項(xiàng):1,3屬于項(xiàng)目管理里的產(chǎn)出管理;2,4,5屬于項(xiàng)目管理里的時(shí)間管理。
正式立項(xiàng),把業(yè)務(wù)痛點(diǎn)作為項(xiàng)目目標(biāo);
考慮時(shí)間緊迫性和數(shù)據(jù)質(zhì)量,設(shè)計(jì)恰當(dāng)方法;
輸出定期使用的、產(chǎn)品化的、大家必須看的成果;
需求排序,給自己留出時(shí)間干高品質(zhì)工作;
用快捷分析方法應(yīng)付簡(jiǎn)單需求,留出精力做復(fù)雜需求。
贊,很接地氣
經(jīng)常有個(gè)很奇葩的現(xiàn)象,一邊說(shuō)趕進(jìn)度把統(tǒng)計(jì)報(bào)表砍掉,一邊又在流水里給個(gè)總數(shù)。我問(wèn)為什么只看總數(shù),上級(jí)就說(shuō)老板想知道。。。。。。。。。。。。。我能怎么辦我也很絕望
數(shù)據(jù)可視化真是太重要了,最近在想著通過(guò)django搭建一個(gè)網(wǎng)站,定期抽取數(shù)據(jù),讓運(yùn)營(yíng)們自己看吧,陳老師覺(jué)得可行嗎?
以我過(guò)往經(jīng)驗(yàn),固定報(bào)表的打開率大概13%哈,感受下。所以得看這事目的,如果是響應(yīng)領(lǐng)導(dǎo)需求(或者自己是領(lǐng)導(dǎo),發(fā)起一個(gè)需求)就做。如果是想著有個(gè)平臺(tái)運(yùn)營(yíng)就自己看了,少提臨時(shí)取數(shù),不太現(xiàn)實(shí)哈。大部分人沒(méi)有自覺(jué)看數(shù)的積極性,都是事到臨頭打電話:喂,快給我個(gè)數(shù),老板要,急!在線等”