復(fù)盤:購買數(shù)據(jù)的案例分享

0 評論 6781 瀏覽 20 收藏 14 分鐘

編輯導(dǎo)語:數(shù)據(jù),對于任何平臺或者企業(yè)來說,都很重要。無論是想要做出一些營銷決策還是調(diào)整新產(chǎn)品的發(fā)布策略,數(shù)據(jù)的收集和分析都是必經(jīng)的一環(huán)。對于醫(yī)藥O2O電商平臺來說,得到權(quán)威而又準(zhǔn)確的數(shù)據(jù),尤其是藥品和病癥之間的關(guān)系數(shù)據(jù)源,顯得尤為重要。

本文復(fù)盤一次藥學(xué)服務(wù)數(shù)據(jù)購買的案例,呈現(xiàn)當(dāng)時的處理方式和遇到的問題。

該“買數(shù)據(jù)”案例,發(fā)生在做醫(yī)藥O2O電商平臺,藥品這一特殊的電商商品,其“健康屬性”,可以作為附加值提供的載體。如,賣藥的同時附加提供健康服務(wù),以藥學(xué)服務(wù)拉近“人貨場”的溫度,打造線上線下產(chǎn)業(yè)化新零售生態(tài)。

藥學(xué)附加服務(wù),無論是用藥指導(dǎo)、尋醫(yī)問藥,還是患者畫像之類的,前提都是要有藥品-病癥之間的關(guān)系數(shù)據(jù)源。

這個數(shù)據(jù)即要權(quán)威準(zhǔn)確,又要通俗易懂,兼顧科學(xué)化和網(wǎng)絡(luò)大眾化。市場上單純的醫(yī)藥數(shù)據(jù),或單純的藥品商品數(shù)據(jù),都不難獲得。難獲得的是,針對醫(yī)藥電商人群和故事場景下的醫(yī)藥健康的資料。

本案例涉及到的內(nèi)容清單:案例 ║ 購買數(shù)據(jù)的案例分享

一、前期需求分析

1. 分析需求

基于項目規(guī)劃,將本次藥學(xué)服務(wù)的需求場景,歸納如下:

案例 ║ 購買數(shù)據(jù)的案例分享

這就要求,數(shù)據(jù)中起碼涉及這些字段:用法用量、功能主治、適用人群、禁忌不良反應(yīng)、服藥周期、治療的疾病、疾病的癥狀、疾病說明等。結(jié)合業(yè)務(wù)場景,可以勾勒出這樣的簡單的關(guān)系圖:

案例 ║ 購買數(shù)據(jù)的案例分享

2. 確定核心要素

根據(jù)以上需求,我們可以得知 “藥”、“病”、“癥” 三者最為核心,關(guān)系如下:

案例 ║ 購買數(shù)據(jù)的案例分享

且三者為多對多關(guān)系,如下:

案例 ║ 購買數(shù)據(jù)的案例分享

3. 評估數(shù)據(jù)量級

常規(guī)藥品的數(shù)量,達(dá)到6萬種(SKU)。

藥品基本都是單規(guī)格的(不同含量視為不同規(guī)格,不同含量不同的申報,業(yè)內(nèi)視為不同的商品),因此大約要準(zhǔn)備接近這個數(shù)字的藥品資料,才能保證覆蓋面。

總結(jié):至此,從需求要素、核心內(nèi)容、需求數(shù)據(jù)量范圍,描繪了擬獲取數(shù)據(jù)的輪廓,作為尋找數(shù)據(jù)源的驗收標(biāo)準(zhǔn)或參考。

二、調(diào)研獲取數(shù)據(jù)的途徑

我們的目標(biāo)數(shù)據(jù),是客觀標(biāo)準(zhǔn)的基礎(chǔ)數(shù)據(jù),不是運營產(chǎn)生的數(shù)據(jù)。因此權(quán)威性、客觀性最重要,那么如何獲取呢?

1. 假如自己維護?

請專人、找到藥盒、翻閱藥品說明書、錄入、再翻閱醫(yī)藥詞典類數(shù)據(jù)、對應(yīng)整理疾病信息……平均一天一人最多搞定100條,算下來6萬就要很久。

顯然來不及且成本不菲,并且沒有驗證的數(shù)據(jù)也不敢用,這條途徑pass。

2. 爬別人的數(shù)據(jù)

藥品信息在藥監(jiān)局官網(wǎng)比較權(quán)威,但是上面沒有疾病方面的,甚至連條形碼都找不到(備注:條形碼,國內(nèi)就是69碼,唯一標(biāo)識商品,13位、12位或8位數(shù)字組成)。

案例 ║ 購買數(shù)據(jù)的案例分享

爬取其他網(wǎng)站,也曾嘗試的,結(jié)果不是不準(zhǔn)確、不齊全,就是不成功,這條路也走不通。

3. 購買數(shù)據(jù)

購買數(shù)據(jù)比起爬數(shù)據(jù)要正規(guī)些,咨詢了京東阿里和騰訊丁香,人家都不賣。這些公司是要自己做數(shù)據(jù)服務(wù)的,也不差這點錢。

咨詢了藥房網(wǎng)、135網(wǎng),沒疾病方便的可靠數(shù)據(jù),這時候業(yè)內(nèi)人事推薦了一個叫“YA”的公司,在做藥學(xué)服務(wù),就決定深入商談。

三、拿到樣本數(shù)據(jù)

經(jīng)過洽談,對方提供的是一批EXCEL格式的樣本數(shù)據(jù)。大概的表有14個表格,數(shù)據(jù)拿到之后,進(jìn)行初步驗收。

1. 比對E-R模型

他們的數(shù)據(jù)是mongdb存儲的,首次抽離出來數(shù)據(jù)來賣,所以數(shù)據(jù)在表結(jié)構(gòu)和表數(shù)量上有冗余。通過其表結(jié)構(gòu),繪制出E-R圖,基本與需求符合。

2. 競品橫向?qū)Ρ?/h3>

在檢查樣本數(shù)據(jù)的過程中,也在做替代方案的對比。

制定檢驗要點是:單表數(shù)據(jù)的錯誤率、聯(lián)表查詢的匹配率、市場數(shù)據(jù)的覆蓋率、錯誤修復(fù)時效等。從網(wǎng)站或App尋找同類產(chǎn)品,但都有各種問題,最終還是舍棄了其他選項。

3. 遠(yuǎn)程全量檢查數(shù)據(jù)

在未付款情況下,對方不提供全量數(shù)據(jù)。

由于樣本有限,為了進(jìn)一步了解數(shù)據(jù),協(xié)商采取遠(yuǎn)程查數(shù)據(jù)庫。對方在數(shù)據(jù)庫中進(jìn)行了單表驗證和聯(lián)表查詢操作,我方遠(yuǎn)程觀看,并記錄檢查結(jié)果。

遠(yuǎn)程的操作畢竟是不便,只交叉抽樣驗證了部分?jǐn)?shù)據(jù),當(dāng)時估計出的準(zhǔn)確率是93%——這也是決定繼續(xù)洽談的主要參數(shù)。

四、付首款并拿到全量數(shù)據(jù)

接下來的流程是談價格,價格談好就可以打包出售數(shù)據(jù)。

我方壓價的論點主要是:疾病方面的數(shù)據(jù)不到一萬條,買回后仍需補充的人工成本;非獨家買斷,可以復(fù)制銷售,賣家邊際成本很低,內(nèi)容質(zhì)量不高。

口頭說的是由執(zhí)業(yè)藥師團隊和藥師專業(yè)、中國非處方藥物協(xié)會藥師進(jìn)行審核。但是并拿不出證據(jù),最終得到了折扣,擬定了全量數(shù)據(jù)驗收的合同。

當(dāng)時的合同內(nèi)容比較簡單,草稿截圖如下:

案例 ║ 購買數(shù)據(jù)的案例分享

合同簽署后,拿到了全量數(shù)據(jù)。

雙方約定一周的時間進(jìn)行數(shù)據(jù)驗收,驗收無誤則支付尾款。因為數(shù)據(jù)的敏感性,由專人以郵件壓縮包文檔的方式接收。然后存入堡壘機中,其他參與驗收人員通過堡壘機進(jìn)行檢驗。

1. 研究數(shù)據(jù)的質(zhì)量

檢查數(shù)據(jù)的合理性:也就是數(shù)據(jù)在邏輯機構(gòu)上的是否有缺陷。

案例 ║ 購買數(shù)據(jù)的案例分享

數(shù)據(jù)的關(guān)聯(lián)度:采取的是手動在EXCEL上比對,并導(dǎo)入數(shù)據(jù)庫后程序員SQL查詢相結(jié)合的方式?;趯A(chǔ)數(shù)據(jù)的了解,制定了檢查方案,局部如下圖:

案例 ║ 購買數(shù)據(jù)的案例分享

2. 檢查數(shù)據(jù)的權(quán)威性

這一點需要專業(yè)藥師或藥學(xué)人員參與,我們采用的是抽樣調(diào)查的辦法,比對的標(biāo)桿是藥典的權(quán)威資料,考察的對象比如“阿苯達(dá)唑”的服用時間、用藥禁忌等。

3. 數(shù)據(jù)的覆蓋率

采用的辦法是,指定20個常用藥物(比如對乙酰氨基酚),看是會否能查到全套的資料,得到的結(jié)論是數(shù)據(jù)并不理想。

比如:用條形碼匹配已有的商品,發(fā)現(xiàn)有1579個找不到,占比20.87%;再用這1579個的通用名查找,仍有147個仍找不到,即絕對找不到的比例1.9%。

4. 數(shù)據(jù)的冗余性

很多表都是從MongDB轉(zhuǎn)化過來的,所以表之間的結(jié)構(gòu)不合理。最終14個表,也就有7個表是有用的,其余的多是過度表(初步驗收時候雖然也發(fā)現(xiàn)了)。

5. 雙方交涉

其實大家看得出,全量數(shù)據(jù)的檢測結(jié)果不理想。

主要發(fā)生在,表結(jié)構(gòu)不合理;數(shù)據(jù)存在錯誤、一些名詞在各表中的表述不一致等。但是這個時期,合同的約定并不利于買方,因此只能繼續(xù)往前。

我們在一周內(nèi)輸出了問題清單,摳合同字眼,尋找有利的機會,然后責(zé)令對方將數(shù)據(jù)清洗后重新交接。

五、數(shù)據(jù)購買后的應(yīng)用規(guī)劃

在經(jīng)歷5次數(shù)據(jù)交付后,雙方法務(wù)協(xié)商一致,進(jìn)行了價格的調(diào)整,最終完成了交易。

如果把驗收當(dāng)做一次項目,那么雖然項目做的不太漂亮,但是數(shù)據(jù)還是有價值的,是可用用的。

數(shù)據(jù)拿到了,技術(shù)層面進(jìn)行應(yīng)用規(guī)劃:第一步,元數(shù)據(jù)檢查和清洗,將14個表,抽離成整潔的新表;第二步,指定底層服務(wù)邏輯,以作為數(shù)據(jù)中臺,供應(yīng)用端接口調(diào)用。

比如:

案例 ║ 購買數(shù)據(jù)的案例分享

第三步:對接具體業(yè)務(wù)場景,輸出具體方案(此處略)。

六、總結(jié)

1. 本次數(shù)據(jù)購買主要涉及三方面

  1. 產(chǎn)品角度的需求鍥合度;
  2. 醫(yī)藥專業(yè)角度的數(shù)據(jù)權(quán)威性;
  3. 法務(wù)層面的合同約定項:其中后兩點都沒做太好,尤其是法務(wù)方面,這導(dǎo)致了全量數(shù)據(jù)拿到之后的進(jìn)退兩難。

但是項目自身也存在局限性和難度:比如數(shù)據(jù)量大,很難發(fā)現(xiàn)細(xì)節(jié)問題;缺少標(biāo)桿,自行推敲只能抽樣調(diào)查的方式;數(shù)據(jù)的價格方面沒有固定的標(biāo)準(zhǔn),難以拿捏。

2. 數(shù)據(jù)購買帶來的經(jīng)驗教訓(xùn)

  • 自身對數(shù)據(jù)的需求范圍和目標(biāo)明確;
  • 了解賣家,和賣家數(shù)據(jù)的影響力;
  • 應(yīng)當(dāng)在購買之前,應(yīng)該了解還有誰買過或者用過,調(diào)查口碑;
  • 在于對方接洽之前,準(zhǔn)備充分的行業(yè)和技術(shù)方面的驗證標(biāo)準(zhǔn)和計劃;
  • 制定基本的項目步驟,比如:前置研究、評估成本、購買談判、后置約束;
  • 在拿到全量數(shù)據(jù)之前,應(yīng)當(dāng)充分采取遠(yuǎn)程調(diào)查的手段,挖掘?qū)Ψ綌?shù)據(jù)的漏或者不足,以作為合同約定和議價的前提;
  • 在合同簽署中,更多約定對“隔皮斷貨”的風(fēng)險的鑒定標(biāo)準(zhǔn)和賣方的責(zé)任。這個份文檔一定要提供給行業(yè)專家、法務(wù),以便將來拿到真實數(shù)據(jù)之后,可進(jìn)可退;
  • 合同中要約定驗收過程問題的處理辦法,驗收成本誰來負(fù)責(zé),驗收不通過的最大次數(shù)等。

#專欄作家#

唧唧歪歪PM,公眾號:唧唧歪歪PM(ID:jjyypm),人人都是產(chǎn)品經(jīng)理專欄作家,2019年年度作者?!逗蠖水a(chǎn)品經(jīng)理寶典》作者,藥學(xué)碩士轉(zhuǎn)行互聯(lián)網(wǎng)產(chǎn)品多年;熟悉跨境電商業(yè)務(wù),醫(yī)藥領(lǐng)域;擅長大型后臺體系,社交APP。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!