在做用戶研究時(shí),大數(shù)據(jù)+小數(shù)據(jù)=?
在大數(shù)據(jù)時(shí)代,大數(shù)據(jù)能夠描繪出所有用戶的清晰輪廓,但是小數(shù)據(jù)依然有著自己的優(yōu)勢(shì)。那么,在調(diào)研時(shí)能將兩者結(jié)合起來,會(huì)產(chǎn)生怎樣的效果呢?
在崇尚大數(shù)據(jù)的時(shí)代,調(diào)研所代表的小數(shù)據(jù)研究似乎正被逐漸替代,曾經(jīng)拿著用戶調(diào)研報(bào)告以為洞悉了一切的人們,慢慢認(rèn)識(shí)到用戶所答并非所想,而少數(shù)用戶的聲音也很容易引出錯(cuò)誤的方向。
幸好有了大數(shù)據(jù),讓我們的視野更寬廣,我們構(gòu)想著一切可能,希望能用大數(shù)據(jù)描繪出所有用戶的清晰輪廓,那么事實(shí)又是怎樣?傳統(tǒng)調(diào)研真的一無是處了么?如果能將大數(shù)據(jù)和調(diào)研結(jié)合起來,又能碰撞出怎樣的火花?
大數(shù)據(jù)真的無所不能嗎?
1.?大數(shù)據(jù)所向披靡
千人千面、個(gè)性化推薦、用戶行為偏好、用戶生命周期跟蹤、購物預(yù)測(cè)、精準(zhǔn)廣告,暫且不提大數(shù)據(jù)在其他領(lǐng)域的應(yīng)用,僅僅就用戶的研究而言,大數(shù)據(jù)可謂所向披靡,只要用戶在平臺(tái)上有足夠多的動(dòng)作,就會(huì)產(chǎn)生足夠多的數(shù)據(jù),這些數(shù)據(jù)碎片通過各種拼湊組合,就能描繪出用戶各個(gè)維度的畫像,從而能夠支持到更多的應(yīng)用。
以個(gè)性化推薦為例,早期的豆瓣基于協(xié)同過濾的算法,通過用戶看過的電影數(shù)據(jù),為其推薦相似的電影(商品協(xié)同過濾),或者基于用戶多維度特征的相似性,為其推薦相似用戶看過的其他電影(用戶協(xié)同過濾)。
隨著機(jī)器學(xué)習(xí)技術(shù)的成熟,數(shù)據(jù)處理能力的發(fā)展,推薦系統(tǒng)也在不斷迭代,比如像今日頭條,可以基于內(nèi)容的切詞、內(nèi)容標(biāo)簽、圖片及視頻流編碼、用戶實(shí)時(shí)瀏覽行為等成千上萬種數(shù)據(jù)項(xiàng)作為特征,以龐大的用戶數(shù)據(jù)作為訓(xùn)練樣本,建立超大規(guī)模的模型,從而實(shí)現(xiàn)更精準(zhǔn)的推薦。
大數(shù)據(jù)的量級(jí)越來越大,似乎藏著挖不盡的寶藏,只要數(shù)據(jù)維度足夠豐富,數(shù)據(jù)處理能力夠強(qiáng),機(jī)器學(xué)習(xí)的技術(shù)足夠完善,未來大數(shù)據(jù)的應(yīng)用就會(huì)更加廣泛和成熟。
2.?大數(shù)據(jù)的無能為力
尤瓦爾·赫拉利在《今日簡(jiǎn)史》中預(yù)測(cè):2050年我們將迎來數(shù)據(jù)霸權(quán)的時(shí)代,無論是醫(yī)療領(lǐng)域、娛樂行業(yè)還是汽車領(lǐng)域,到處都是人工智能的身影,算法可以預(yù)測(cè)一切,算法可以自己迭代,算法可以替代我們進(jìn)行決策。
尤瓦爾·赫拉利的預(yù)測(cè)并非沒有道理,人工智能在逐漸黑盒化,機(jī)器在自主學(xué)習(xí),我們卻不知道它做出決策的原因,因此當(dāng)機(jī)器把一個(gè)結(jié)果攤在你面前時(shí),你是否會(huì)本能地懷疑。
于是,我們開始糾結(jié)另一個(gè)概念,叫“可解釋性”,無論是基于大數(shù)據(jù)統(tǒng)計(jì),還是基于機(jī)器學(xué)習(xí)算法,我們得到的都是一個(gè)結(jié)果,就算用戶行為路徑,也只是用戶的行為結(jié)果,通過大數(shù)據(jù)似乎無法解釋用戶的心理決策過程。
大數(shù)據(jù)仿佛是一個(gè)高維度的生物,機(jī)器學(xué)習(xí)是人類嘗試運(yùn)用其超能力的手段,站在大數(shù)據(jù)的視角來看,能解決你們的問題不就可以了。為什么還需要我來解釋,就算把我的能力投射到低維空間,你們也仍然無法理解,而人們內(nèi)心世界,恕我無能為力,我暫時(shí)也不能理解。
大數(shù)據(jù)擅長(zhǎng)的是理性分析,而人類的決策過程中往往摻雜著直覺與感性,所以當(dāng)涉及到用戶深層的感知與動(dòng)機(jī)時(shí),大數(shù)據(jù)便顯得有些捉襟見肘。目前,大數(shù)據(jù)的應(yīng)對(duì)方法是通過貼標(biāo)簽將用戶進(jìn)行標(biāo)識(shí),但僅有行為標(biāo)簽還遠(yuǎn)遠(yuǎn)不夠,如何提取出感性標(biāo)簽是一直困擾著大數(shù)據(jù)的難題。
用戶調(diào)研真的不靠譜嗎?
1.?調(diào)研的不靠譜事跡
說起調(diào)研失敗的案例,最有名的要數(shù)可口可樂當(dāng)年的口味測(cè)試。
20世紀(jì)70年代,受百事可樂的沖擊,一直位于霸主地位的可口可樂感到了極大的威脅,于是在十多個(gè)城市展開了消費(fèi)者調(diào)研,調(diào)研的目的主要是了解消費(fèi)者對(duì)于口味的感知,比如“如果可口可樂口味更甜一些,你是否會(huì)喜歡”,“如果可口可樂有新口味,你是否會(huì)嘗試”等等。
調(diào)研的結(jié)果一致證明,消費(fèi)者愿意嘗試更柔和,味道更甜的可口可樂,于是,決策層果斷進(jìn)行了口味更改,推出了全新的可口可樂。新口味上市前,可口可樂還進(jìn)行了一輪盲測(cè),盲測(cè)結(jié)果同樣顯示,消費(fèi)者更喜歡新口味的可口可樂。
這一調(diào)研結(jié)果提升了決策層的信心,新口味可口可樂全面上市,廣告鋪天蓋地而來。然而,結(jié)果卻大失所望,消費(fèi)者在嘗試完新口味之后,不但沒有繼續(xù)購買,反而憤怒地向可口可樂公司寄來投訴信,聲稱“放棄原配方是放棄了美國精神”。
最后,可口可樂公司不得不再次恢復(fù)沿用了100年的傳統(tǒng)配方,而這一次巨大的新品投入最終換來的卻是一場(chǎng)烏龍。
這次調(diào)研的失敗,某種程度上也是調(diào)研自身的缺陷,那就是調(diào)研只能研究一個(gè)點(diǎn),而無法看到面??煽诳蓸芬婚_始就研究錯(cuò)了方向,以致南轅北轍,因?yàn)榭煽诳蓸返南M(fèi)者最關(guān)注的是品牌文化,而并非口味。
除了研究方向的誤導(dǎo)性以外,調(diào)研還有著場(chǎng)景的局限性,在某個(gè)場(chǎng)景下調(diào)研得出的結(jié)論可能較為特殊,最終會(huì)引導(dǎo)出錯(cuò)誤的決策。
比如:在20世紀(jì)末,北華飲業(yè)就曾調(diào)研過消費(fèi)者對(duì)于涼茶的接受度,最終發(fā)現(xiàn),60%的中國消費(fèi)者不能接受涼茶。于是乎,公司腦補(bǔ)出消費(fèi)者不能接受涼茶的各種原因,比如:中國人可能更習(xí)慣于喝熱茶,或者是中國人不喝隔夜茶等等。
但事實(shí)是,當(dāng)時(shí)調(diào)研的時(shí)間正好是冬天,消費(fèi)者哈著氣走到調(diào)研的地方,用冰冷的雙手拿起涼茶一飲而盡,在這種場(chǎng)景下,消費(fèi)者的感受自然會(huì)受到極大的影響,而這錯(cuò)誤的研究結(jié)果最終也使得該公司錯(cuò)過了涼茶爆發(fā)的風(fēng)口。
2.?調(diào)研無法被代替
無數(shù)的公司都掉入過調(diào)研的陷阱,但不得不承認(rèn),也有很多公司通過調(diào)研挖掘出了用戶的真實(shí)需求,從而指導(dǎo)公司做出了正確的決策。
前面講到,大數(shù)據(jù)只能呈現(xiàn)出結(jié)果,而這一結(jié)果是如何產(chǎn)生的不得而知。調(diào)研在用戶深層特性和動(dòng)機(jī)的研究上仍有著一技之長(zhǎng),這能很好地對(duì)大數(shù)據(jù)的結(jié)果進(jìn)行補(bǔ)充解釋。
此外,對(duì)于新生事物而言,比如:一個(gè)新產(chǎn)品或是新概念,沒有任何歷史數(shù)據(jù)可追溯,大數(shù)據(jù)也只能站在相似的周邊數(shù)據(jù)上迂回前行,卻無法直擊要害,這個(gè)時(shí)候,調(diào)研就有了其用武之地。
傳統(tǒng)調(diào)研雖有其局限性,但調(diào)研方法本身其實(shí)沒有什么問題,最難的是如何有效地進(jìn)行調(diào)研,從而繞開各種陷阱。
以下列舉了幾個(gè)常見的調(diào)研雷區(qū),請(qǐng)務(wù)必避而遠(yuǎn)之:
- 題目具有暗示性,比如“這款產(chǎn)品很多人都喜歡,你喜歡嗎?”
- 題目具有主觀性,比如“你為什么不關(guān)注時(shí)事政治”,對(duì)于這類問題,用戶可能不會(huì)回答真實(shí)的想法。
- 題目難以理解,超出用戶的認(rèn)知,用戶可能會(huì)亂答。
- 題目太多,或是開篇的問題太難,用戶會(huì)失去耐心,除非是線下調(diào)查且獎(jiǎng)品非常豐厚。
- 只在一個(gè)地點(diǎn)或一個(gè)時(shí)間點(diǎn)進(jìn)行調(diào)研,可能會(huì)重蹈北華飲業(yè)涼茶調(diào)研的覆轍。
總而言之,不管是問卷還是深訪,調(diào)研的過程都要循序漸進(jìn),由淺入深,且盡量讓用戶回憶真實(shí)的場(chǎng)景,描述當(dāng)時(shí)的感受,而不是直接問他。
三、大數(shù)據(jù)+小數(shù)據(jù)=?
不難發(fā)現(xiàn),大數(shù)據(jù)和小數(shù)據(jù)各有所長(zhǎng),而且他們剛好能形成能力上的互補(bǔ),如果他們合力而為,是否會(huì)像賽亞人合體一樣,戰(zhàn)斗力報(bào)表?
1.?大數(shù)據(jù)讓小數(shù)據(jù)變大
大數(shù)據(jù)的優(yōu)勢(shì)在于數(shù)據(jù)量大,那么通過大數(shù)據(jù)可以提供大量的用戶樣本。不僅如此,還可以基于此次研究的目的,篩選出符合需求的用戶,實(shí)現(xiàn)精準(zhǔn)的用戶定向。
有了大數(shù)據(jù),再也不用擔(dān)心樣本量不夠,回復(fù)率太低了,而且最關(guān)鍵的是,成本可以得到有效的壓縮。
這是大數(shù)據(jù)與小數(shù)據(jù)結(jié)合的第一步,如果最終的目的是要實(shí)現(xiàn)大小數(shù)據(jù)協(xié)同,那么就有必要針對(duì)線上平臺(tái)的用戶進(jìn)行調(diào)研,這樣才能保證用戶線上大數(shù)據(jù)和調(diào)研小數(shù)據(jù)的一致性。
2.?大數(shù)據(jù)讓小數(shù)據(jù)變小
大數(shù)據(jù)的作用不僅限于找到用戶,其作用還在于初識(shí)用戶。
傳統(tǒng)調(diào)研在開始之前,都會(huì)先選定調(diào)研的城市,還有調(diào)研配額,比如:男女比例、用戶年齡比例等等,以保證研究的結(jié)果具有普適性,避免調(diào)研結(jié)果出現(xiàn)偏差。
不過不管是城市還是配額,一般都是研究人員拍腦袋定的,比如男女各半,一線二線各5個(gè)城市。而了解用戶的分布對(duì)大數(shù)據(jù)而言不是輕而易舉么?
因此我們可以先通過大數(shù)據(jù)了解一下平臺(tái)用戶的地域及年齡分布,然后再分層抽樣進(jìn)行調(diào)研。
除此以外,從前面可口可樂的教訓(xùn)中,我們知道了調(diào)研在方向上可能存在的誤導(dǎo)性。那么,大數(shù)據(jù)正好也能彌補(bǔ)這一點(diǎn),在調(diào)研之前,可以先通過大數(shù)據(jù)對(duì)用戶進(jìn)行初步的分析,了解用戶的行為偏好。
比如:可以通過用戶決策樹了解用戶在瀏覽或購買時(shí)最關(guān)注的產(chǎn)品屬性排序,如果用戶最關(guān)注可樂口味的話,我們?cè)籴槍?duì)口味進(jìn)行調(diào)研。
所以,除了能讓小數(shù)據(jù)量級(jí)變大以外,大數(shù)據(jù)還可以讓小數(shù)據(jù)的研究范圍變小,瞄準(zhǔn)正確的方向,聚焦于探尋大數(shù)據(jù)結(jié)果出現(xiàn)的原因。
3.?小數(shù)據(jù)讓大數(shù)據(jù)變小
調(diào)研的優(yōu)勢(shì)在于更深入、更細(xì)致,因此調(diào)研小數(shù)據(jù)可以讓大數(shù)據(jù)的研究顆粒度變得更小。
大數(shù)據(jù)對(duì)于用戶的研究可能僅限于部分?jǐn)?shù)據(jù)維度,而且這些數(shù)據(jù)維度一般比較粗,譬如:用戶的性別、年齡、可能從事的職業(yè)、購買力、內(nèi)容偏好等等,而調(diào)研所研究的范圍可以更小更細(xì),更深入地輔助大數(shù)據(jù)了解用戶。
而且,小數(shù)據(jù)聚焦于用戶個(gè)體,我們可以通過深訪了解用戶的生活場(chǎng)景、特征偏好,這有利于我們直觀地描繪出這個(gè)人的形象。
下次演示報(bào)告時(shí),我們可以說:“產(chǎn)品經(jīng)理小王一天的生活是,早上10點(diǎn)來到公司,先沖泡一杯咖啡,然后元?dú)鉂M滿地投入一天的工作…”而不僅僅是,“有30%的用戶會(huì)在早上上班的時(shí)候喝咖啡”。
對(duì)于聽眾而言,加上用戶自身的描述能更加清晰直觀,且比數(shù)字更富有感染力,這也算是利用“可得性偏見”的一種報(bào)告演示技巧。
此外,大數(shù)據(jù)中的用戶標(biāo)簽多是通過算法模型判斷得出的,不能保證100%的準(zhǔn)確性,而調(diào)研所獲取的小數(shù)據(jù)基本都是真實(shí)的。因此,小數(shù)據(jù)還能對(duì)大數(shù)據(jù)的標(biāo)簽進(jìn)行反向驗(yàn)證,使得標(biāo)簽的誤差變得更小。
4.?小數(shù)據(jù)讓大數(shù)據(jù)變大
在上述三種情況下,大小數(shù)據(jù)都是各司其職,分步協(xié)作,先由大數(shù)據(jù)進(jìn)行初步分析,再由小數(shù)據(jù)負(fù)責(zé)補(bǔ)充研究,似乎都沒有實(shí)現(xiàn)真正的“合體”。
那么如何才能由小數(shù)據(jù)最終落回到大數(shù)據(jù),形成閉環(huán),實(shí)現(xiàn)真正的“合體”呢?
下面為大家提供一個(gè)思考方向,目前通過爬蟲很難抓取到關(guān)于對(duì)品牌形象描述的詞,而市面上有很多負(fù)責(zé)品牌調(diào)研的公司,他們主要的工作就是研究品牌的價(jià)值、品牌形象和品牌健康度等等。那么,通過調(diào)研獲取的用戶對(duì)于品牌形象的認(rèn)知,是否可以應(yīng)用到大數(shù)據(jù)中呢?
例如:針對(duì)服飾而言,我們可以收集各個(gè)品牌的品牌形象詞,于是我們可以建立起一套品牌形象詞詞庫,之后我們對(duì)詞進(jìn)行歸類編碼或是通過因子分析進(jìn)行降維處理,從而得到了n個(gè)詞,比如:小資情調(diào)、成熟穩(wěn)重、青春活力等等。
接著,我們?cè)侔堰@n個(gè)詞作為標(biāo)簽打到各個(gè)品牌上,比如A品牌的標(biāo)簽有四個(gè),分別是:小資情調(diào)、成熟穩(wěn)重、青春活力、簡(jiǎn)約有設(shè)計(jì)感;B品牌可能有三個(gè)標(biāo)簽,分別是青春活力、酷炫有型、色彩繽紛,各個(gè)品牌標(biāo)簽都是并列關(guān)系,不分先后。
以此方法,每個(gè)品牌都有了自己的標(biāo)簽,那么通過用戶與各個(gè)品牌的交互行為(瀏覽、關(guān)注、購買等),我們可以建立一套算法將品牌標(biāo)簽打到用戶身上。這樣,我們便可以知道用戶對(duì)于服飾的品牌風(fēng)格偏好。
當(dāng)用戶有了標(biāo)簽之后,我們可以反過來再把用戶的標(biāo)簽打到品牌身上,這樣一來,我們可以識(shí)別出各個(gè)品牌下,不同形象詞標(biāo)簽的重要性,同時(shí)還可能會(huì)有新的形象詞標(biāo)簽被打到品牌上。
此外,我們還可以通過對(duì)某個(gè)產(chǎn)品的用戶標(biāo)簽進(jìn)行計(jì)算,從而將用戶的標(biāo)簽打到每一個(gè)產(chǎn)品上,實(shí)現(xiàn)標(biāo)簽的細(xì)化。
由于涉及部分機(jī)密,在此不做詳述??傊?,通過類似的方法,小數(shù)據(jù)的結(jié)果也可以被應(yīng)用到大數(shù)據(jù)中,將大數(shù)據(jù)的標(biāo)簽庫擴(kuò)大,實(shí)現(xiàn)標(biāo)簽的拓展。
四、結(jié)語
大數(shù)據(jù)時(shí)代的到來,并不意味著小數(shù)據(jù)時(shí)代的結(jié)束,大數(shù)據(jù)與小數(shù)據(jù)是對(duì)立的,但終將也是統(tǒng)一的。
- 對(duì)于小數(shù)據(jù)而言,大數(shù)據(jù)帶來的是一場(chǎng)革命,是一次否定之否定的曲折式上升機(jī)會(huì),唯有借其真氣,才能沖開任督。
- 對(duì)于大數(shù)據(jù)而言,小數(shù)據(jù)提供的是內(nèi)力的積淀,吸其精華,方能九天攬?jiān)隆?/li>
作者:Mr.墨嘰,公眾號(hào):墨嘰說數(shù)據(jù)產(chǎn)品
本文由 @Mr.墨嘰? 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
有啟發(fā)
謝謝??,一起交流學(xué)習(xí)~