沒有數(shù)據驅動的流程和產品,你的大數(shù)據毫無價值
本文作者 John De 是面向開發(fā)者的平臺?Precog?的聯(lián)合創(chuàng)始人,可以在 Twitter 上關注他?@jdegoes。
這些日子,大數(shù)據并不少見。哪怕你只是一家小型創(chuàng)業(yè)公司,一天下來你可能就拿到了幾個 G 的數(shù)據,而 Instagram 一天產生的數(shù)據則高達 500 個 T。坐在不斷增加的數(shù)據上的你,撓著頭苦想:“大數(shù)據我是有了,要怎么利用它們?”
只是擁有數(shù)據自然用處不大,真正的贏家是像 Amazon 或 Netflix 這類公司,他們比競爭對手更好地利用了大數(shù)據而取得了競爭優(yōu)勢。如果不能數(shù)據變成收入,你的 Hadoop 集群和里面包含的大量的數(shù)據就沒什么意義了。
要是你能比對手更好地利用大數(shù)據,你甚至有機會躋身成為像 Amazon 和 Netflix 這樣的大數(shù)據資深玩家。
如何才能把數(shù)據變成錢呢?有兩種辦法:數(shù)據驅動的流程(data-driven processes)和數(shù)據驅動的產品(data-driven products)。
數(shù)據驅動的流程(data-driven processes)
商業(yè)分析師往 Excel 里輸入方程,在 SQL 數(shù)據庫里運行特定的查詢語句——在大數(shù)據時代這樣是不夠的。新時代需要更大膽、更無畏的數(shù)據探索者,無論是在小數(shù)據還是大數(shù)據的世界里,他都能熟練運用工具。
被稱作“數(shù)據科學家”的他,是下一代的數(shù)據極客,他充分了解傳統(tǒng)的 BI 工具、查詢語言、統(tǒng)計辦法和機器學習技術。
優(yōu)秀的數(shù)據科學家能在方方面面幫到你:弄清楚你產品的哪個地方行得通或是行不通(這是 Zynga 的數(shù)據科學家的角色);創(chuàng)造預測模型,讓你一窺未來,從而在眼前做出更好的決策(這是?@WalmartLabs?的做法)。
數(shù)據科學家能怎么幫到你?下面有幾個具體的例子:
如果你銷售的是一款 SaaS 應用,數(shù)據科學家可以幫你分析、找出帶來高營收的用戶的共性。比如,這類用戶可能會以特定路徑轉化成為付費帳戶,人群特點也可能相近(性別、收入、地域、年齡范圍等),也會以特定的辦法使用該產品。所有這些洞見有助于進一步打磨廣告、市場營銷以及產品,以提高營收。
數(shù)據科學家可以確定某個定價范圍或產品是否會擠占來自其它定價或是產品的銷量,由此,你可以優(yōu)化你的定價策略和產品線。
數(shù)據科學家可基于歷史數(shù)據創(chuàng)建預測模型,讓你做出相對更靠譜的預測。比如,你可以分辨哪一類顧客更有可能是懷孕的女性(Target 就曾做過這樣的事情),或是銷售漏斗里的哪類顧客最有可能在哪個水平上被轉化。
數(shù)據科學家能幫你弄清針對數(shù)據你要問些什么正確的問題。比如,數(shù)據科學家可能會建議你把營銷數(shù)據和網站日志數(shù)據以及交易數(shù)據都關聯(lián)起來,以確定市場推廣活動背后的 ROI(投資回報率)。
數(shù)據驅動的產品(data-driven products)
除了利用數(shù)據驅動業(yè)務流程以外,數(shù)據還可被用來增強產品的功能。有些公司會把數(shù)據打包到一款有用的產品里,再轉售給其它公司。
Twitter 自己并不是一款數(shù)據產品,但它把數(shù)據授權給了像 DataSift 這樣的數(shù)據服務公司,后者接著創(chuàng)造了一款數(shù)據產品,而別的公司痛快地接受了它所提供的分析結果。也有一些媒體公司會把觀眾收視率數(shù)據打包到產品里,再轉頭賣給頻道制作人和內容創(chuàng)造者。
然而,大多數(shù)創(chuàng)建數(shù)據驅動的產品的公司并不會簡單地創(chuàng)建數(shù)據產品再轉手賣掉。他們會利用數(shù)據把現(xiàn)有產品變得更加高效、更加智能,或是更具有洞察力,從而直接或間接地產生額外的收入。
下來我舉幾個例子:
廣告平臺可以針對不同的觀眾展示不同的廣告,以最大限度地提升點擊率、以及其它產生營收的用戶行為。
電商應用可智能地做產品推薦,以最大化增加消費者的購買率(包括原本就打算買的,以及許多購買計劃外的東西)。
Publisher 可通過智能分析和推薦,為每個用戶做出個性化的頁面,以最大化用戶在網站上的停留時間,并產生更多的廣告收入。
視頻平臺可捕捉所有的用戶交互行為,并向內容創(chuàng)作者提供詳盡的分析報告,幫助他們對重要的指標做出優(yōu)化(參與率、播放率、轉化率等)。這也是間接貨幣化的例子之一。通過添加一個由數(shù)據或分析支持的功能,平臺也有望對用戶產生更大的吸引力。
數(shù)據驅動,你也可以做到
下面是我的幾個建議:
集中地收集所有數(shù)據。在存儲成本直線下降的今天,廉價乃至免費的大數(shù)據存儲服務隨處可見,如果你沒有全方位地收集數(shù)據,你就大錯特錯了。我經常這樣告訴一些公司:就算你忽略你擁有的數(shù)據,但你卻絕不可能分析你沒有的數(shù)據。非結構化或是半結構化的數(shù)據存儲服務允許你把原始數(shù)據先存起來,等到需要的時候,再付費把結構化的數(shù)據提取出來。所以說,你是沒理由不把經過你手的數(shù)據給收集、存儲起來的(交易、交互、行為數(shù)據、傳感器數(shù)據、用戶生成的內容、日志文件等等)。
聘請一位數(shù)據科學家。如果你是一家創(chuàng)業(yè)公司,你團隊至少需要一位數(shù)據科學家,或是能夠兼任數(shù)據科學家角色的成員。假如你公司有了一定規(guī)模,就有必要準備 成團隊的數(shù)據科學家了。比起從外部聘請,內部培養(yǎng)會更容易些。優(yōu)秀的商業(yè)分析師,或是在 BI 和 SQL 有優(yōu)異背景的人,都有機會成為數(shù)據科學家。他們需要配備適當?shù)墓ぞ?,并獲許訪問全公司的數(shù)據,這樣,他們才可以回答特定的問題、進行探索性的數(shù)據挖掘、支持 BI 團隊、并協(xié)助數(shù)據產品化的工作。
把數(shù)據產品化。任何一家公司,但凡擁有專有的數(shù)據,都應該好好考慮把數(shù)據利用起來,打造新的產品,或是在現(xiàn)有產品上創(chuàng)建由數(shù)據驅動的功能。任何一家公司,只要它有桌面、移動、Web、或基于媒體的應用,它就有專有的數(shù)據(也就是說,在這個數(shù)據時代,絕大多數(shù)的公司都有專有數(shù)據?。?。各類公司,尤其是廣告和零售公司,已利用數(shù)據驅動智能化的功能,獲得了數(shù)以百萬乃至十億美元計的增量收入(incremental revenue)。
如果你是一家 B2B 的 SaaS 供應商,向你的客戶提供自助的報告服務,是你把數(shù)據變成產品的簡易辦法,也能間接產生額外營收。如果你是一個電商平臺,利用你手頭的數(shù)據做個性化推薦,可以帶來可觀的增量收入。如果你做的是一款面向消費者的應用,利用數(shù)據把應用變得更加聰明,也能提高易用性和用戶活躍度。走向數(shù)據產品化的第一步,就是讓團隊里的某個人開始思考利用你的數(shù)據資產可以做出些什么功能或是產品。但最終,你還需要專門的工程師資源,把數(shù)據變成功能和產品。
受數(shù)據驅動的你
大數(shù)據真正講的不是數(shù)據本身,而是要探討怎樣利用數(shù)據在公司內部驅動業(yè)務流程和產品功能。過去幾年迅速竄起的數(shù)據科學就是“數(shù)據已成為 21 世紀的貨幣”的有力證據。如果你置手頭的數(shù)據不顧,你就在競爭中處在了劣勢。
只需簡單的幾步,比如把所有接觸到的數(shù)據都收集起來,團隊擁有至少一位數(shù)據科學家,在數(shù)據產品化方向上用力,你就是在有效地“花錢”——花在你數(shù)據倉庫里不斷積累起來的“數(shù)據貨幣”。
文章來源:36氪
- 目前還沒評論,等你發(fā)揮!