產(chǎn)品干貨:?醫(yī)療大數(shù)據(jù)平臺建設(shè)實踐
編輯導(dǎo)語:這篇文章通過分析醫(yī)療大數(shù)據(jù)平臺的背景和市場現(xiàn)狀,從醫(yī)療大數(shù)據(jù)不同類型的應(yīng)用和場景、大數(shù)據(jù)平臺產(chǎn)品建設(shè)實踐、醫(yī)療數(shù)據(jù)中臺產(chǎn)品的未來規(guī)劃這三個方面向我們講述了醫(yī)療大數(shù)據(jù)平臺的建設(shè)理論和相關(guān)知識,希望對你有所幫助。
一、背景和市場現(xiàn)狀
在過去的2010-2020的十年里,國內(nèi)大力投資于醫(yī)療系統(tǒng)信息化建設(shè),產(chǎn)生并積累了大量醫(yī)療數(shù)據(jù),迫切需要通過人工智能及大數(shù)據(jù)等技術(shù)來挖掘和實現(xiàn)數(shù)據(jù)價值,需要整合更加先進的技術(shù)基礎(chǔ)設(shè)施以更有效的方式進行數(shù)據(jù)集成、數(shù)據(jù)標準化以及數(shù)據(jù)分析,最終實現(xiàn)醫(yī)療大數(shù)據(jù)更有效的應(yīng)用。2020年新冠疫情爆發(fā)進一步推動了國內(nèi)醫(yī)療健康產(chǎn)業(yè)的數(shù)字革命,AI、大數(shù)據(jù)、數(shù)字孿生等技術(shù)與醫(yī)療健康產(chǎn)業(yè)不斷結(jié)合,促使醫(yī)療健康產(chǎn)業(yè)對于數(shù)據(jù)的利用又上了一個新的臺階。
同時,來自不同方面的要素也在推動著醫(yī)療大數(shù)據(jù)產(chǎn)品市場的發(fā)展。醫(yī)院方面,公立醫(yī)院轉(zhuǎn)型壓力與日俱增,需要引入數(shù)字化醫(yī)療管理解決方案發(fā)揮電子病歷(EMR)的潛力以提高臨床研究效率、降低人工成本、提高疾病診斷和治療質(zhì)量、更好地管理病人。
醫(yī)院正逐漸推出創(chuàng)新業(yè)務(wù)模式,注重學(xué)術(shù)研究、臨床治療、轉(zhuǎn)化醫(yī)學(xué)及患者管理,推升了對醫(yī)療數(shù)據(jù)集成及應(yīng)用的需求;許多大型三甲醫(yī)院已引入先進醫(yī)療系統(tǒng)以提升醫(yī)院管理效率,緩解中國醫(yī)療資源的短缺和分配不均。政府投資將進一步流入醫(yī)院細分市場,支持其繼續(xù)升級系統(tǒng),提升與多個監(jiān)管機構(gòu)平臺的數(shù)據(jù)互連性。
區(qū)域衛(wèi)健方面,經(jīng)過全民信息健康平臺的初步建設(shè),積累了大量的數(shù)據(jù),這些數(shù)據(jù)如何產(chǎn)生更大的應(yīng)用價值,如何在區(qū)域里面互聯(lián)互認,如何跨區(qū)域互聯(lián)互認方面有明確的需求。醫(yī)保局方面,管理每年數(shù)萬億的醫(yī)?!稿X袋子」,對于如何使用數(shù)據(jù)來更好地管理醫(yī)?;鹩袕娏业男枨蟆<部胤矫?,隨著全球疫情的頻繁爆發(fā),如何使用數(shù)據(jù)來更加快速、精準的進行疫情風(fēng)險的管控有強烈的需求。
從市場情況來看,根據(jù)相關(guān)調(diào)研報告,中國是2019年世界第二大醫(yī)療市場,國內(nèi)醫(yī)療大數(shù)據(jù)解決方案整體市場規(guī)模將從2019年的105億元增至2024年的577億元,復(fù)合年增長率達40.5%[1]。
二、場景和需求分析
我們可以從數(shù)據(jù)流轉(zhuǎn)的方向分析醫(yī)療大數(shù)據(jù)不同類型的應(yīng)用和場景。在醫(yī)療行業(yè),絕大部分數(shù)據(jù)產(chǎn)生于醫(yī)療機構(gòu)內(nèi),例如我們?nèi)メt(yī)院的檢驗、檢查、門診、住院、醫(yī)保結(jié)算等數(shù)據(jù)都在醫(yī)院里面產(chǎn)生,數(shù)據(jù)最直接的流轉(zhuǎn)是在醫(yī)療機構(gòu)內(nèi)流動。除了醫(yī)院使用數(shù)據(jù)以外,數(shù)據(jù)也會通過數(shù)據(jù)上報或者采集的形式流動到對應(yīng)的政府機構(gòu),包括、衛(wèi)健委、醫(yī)保局以及疾控中心等。
因此,醫(yī)療大數(shù)據(jù)平臺面向的主要場景括醫(yī)療機構(gòu)(各類公立、民營的醫(yī)院和醫(yī)療集團)、衛(wèi)健委、疾控中心和醫(yī)保局。對于不同的場景,其數(shù)據(jù)的處理方式會存在一些差異。下面按照四個場景進行分析。
1. 醫(yī)療機構(gòu)場景
在醫(yī)療健康大數(shù)據(jù)與電子病歷評級等政策的強驅(qū)動下,各級醫(yī)院對于醫(yī)療大數(shù)據(jù)平臺的采購有比較切實的需求。信息化程度高的三級醫(yī)院(尤其是三甲)出于電子病歷評級、科研論文發(fā)表與臨床應(yīng)用的需求來使用大數(shù)據(jù)平臺 。對于醫(yī)院來說,在數(shù)據(jù)治理和使用方面以下三個問題[2]。
- 數(shù)據(jù)質(zhì)量有待提高,需要加強數(shù)據(jù)標準化。從醫(yī)院業(yè)務(wù)系統(tǒng)直接產(chǎn)生的原生數(shù)據(jù),往往是不符合數(shù)據(jù)應(yīng)用的模型標準。所以需要使用對應(yīng)的數(shù)據(jù)平臺將原始數(shù)據(jù)加工和處理成符合數(shù)據(jù)應(yīng)用所需要的標準模型。
- 院內(nèi)系統(tǒng)數(shù)據(jù)壁壘未破除, 院外系統(tǒng)數(shù)據(jù)饑渴,需加強數(shù)據(jù)共享。在醫(yī)院內(nèi)不同的子醫(yī)院或者不同的科室之間系統(tǒng)和數(shù)據(jù)存在壁壘,院內(nèi)數(shù)據(jù)共享和互通程度低,缺少統(tǒng)一的數(shù)據(jù)平臺。
- 線上線下醫(yī)療數(shù)據(jù)持續(xù)增長,海量數(shù)據(jù)等待挖掘與利用。隨著數(shù)據(jù)的大量增長使用傳統(tǒng)的平臺和工具已經(jīng)不能夠滿足大數(shù)據(jù)下的數(shù)據(jù)挖掘和利用了。需要采取更加先進的技術(shù)和理念。
2. 區(qū)域衛(wèi)健場景
在2016年,國家發(fā)布了《國務(wù)院辦公廳關(guān)于促進和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見》明確要實施全民健康保障信息化工程,要全面建成互通共享的國家、省、市、縣四級人口健康信息平臺。
同年,國家衛(wèi)生計生委規(guī)劃與信息司和國家衛(wèi)生計生委統(tǒng)計信息中心發(fā)布了《省統(tǒng)籌區(qū)人口健康信息平臺應(yīng)用功能指引》明確了全面健康信息平臺的核心功能,其中明確要建設(shè)數(shù)據(jù)采集交換、數(shù)據(jù)規(guī)范上報、大數(shù)據(jù)應(yīng)用支撐和健康檔案服務(wù)等內(nèi)容。2020年國家衛(wèi)健委發(fā)布了醫(yī)院信息互聯(lián)互通標準化成熟度評測方案。
目前區(qū)域衛(wèi)健的全民健康信息平臺各地都有一些基礎(chǔ)的建設(shè),例如三大庫數(shù)據(jù)完成了一輪采集、有了初步的協(xié)同服務(wù)、也有了一些例如綜合監(jiān)管和健康檔案的數(shù)據(jù)應(yīng)用。但整體來看也存在部分問題。
- 數(shù)據(jù)使用時數(shù)據(jù)質(zhì)量不高。數(shù)據(jù)采集之后沒有形成業(yè)務(wù)應(yīng)用的數(shù)據(jù)標準,數(shù)據(jù)治理缺乏深度,數(shù)據(jù)處于誰使用誰治理的階段。
- 協(xié)同服務(wù)層面,雖然開通了部分共享服務(wù)接口,但是新接口的擴展還需要再次付費開發(fā),缺少服務(wù)的整體配置和數(shù)據(jù)服務(wù)的業(yè)務(wù)化。
- 數(shù)據(jù)準備周太長導(dǎo)致數(shù)據(jù)應(yīng)用比較少。一方面缺少統(tǒng)一面向數(shù)據(jù)應(yīng)用的標準,一方面缺少統(tǒng)一的數(shù)據(jù)平臺工具,開發(fā)一款數(shù)據(jù)應(yīng)用數(shù)據(jù)準備的周期很長,缺少對應(yīng)的數(shù)據(jù)準備、開發(fā)的工具和數(shù)據(jù)開發(fā)、數(shù)據(jù)治理的最佳實踐。
針對以上問題,醫(yī)療大數(shù)據(jù)平臺應(yīng)該解決的問題主要有三點:數(shù)據(jù)治理、數(shù)據(jù)協(xié)同和更快的數(shù)據(jù)洞察。
3. 疾控中心場景
新冠疫情的爆發(fā)在疾控場景開辟了數(shù)據(jù)應(yīng)用的新戰(zhàn)場,也讓醫(yī)療健康行業(yè)對數(shù)據(jù)應(yīng)用走向了新的階段。例如我們每天的健康碼、核酸檢測、疫苗以及在醫(yī)院的就診都會產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)需要在疾控中心和衛(wèi)健委等系統(tǒng)中進行上報、集成、標準化、治理、匹配融合等等數(shù)據(jù)加工操作,這些操作都是對應(yīng)的大數(shù)據(jù)平臺上進行。
在疾控場景下,數(shù)據(jù)的處理和應(yīng)用有獨特的特點。
- 數(shù)據(jù)來源更多源。疫情防控中需要融合多種來源的數(shù)據(jù),需要解決不同來源的數(shù)據(jù)標準不統(tǒng)一的問題。
- 對數(shù)據(jù)實時性要求高。疫情的防控朝夕必爭,是對數(shù)據(jù)實效性要求非常高的場景。很多來源的數(shù)據(jù)需要在分鐘級別完成數(shù)據(jù)的獲取,完成多源數(shù)據(jù)的融合以及對外提供快速、高效的數(shù)據(jù)查詢接口。對于大數(shù)據(jù)處理的引擎和效率有更高的要求。
- 需要更快、更準、更智能的數(shù)據(jù)洞察和分析。疫情防控中對于數(shù)據(jù)的需求不光是更快的融合,更需要從數(shù)據(jù)中更快的獲取到蘊含在數(shù)據(jù)中的洞察。另外,在防疫這種需要快速決策和響應(yīng)的場景,這些數(shù)據(jù)洞察要盡可能地準確。對于大量多源數(shù)據(jù)的融合和分析,需要借助更加智能的能力,例如AI算法模型,才可以讓數(shù)據(jù)的洞察更加快速、準確和智能。例如,在疾控場景下基于AI算法模型的數(shù)據(jù)分析洞察和疫情檢測預(yù)警。
4. 醫(yī)保場景
2018年5月31日,國家醫(yī)療保障局正式掛牌。2020年7月國家醫(yī)療保障局印發(fā)了《醫(yī)療保障信息平臺數(shù)據(jù)歸集技術(shù)規(guī)范》等四部規(guī)范的通知,其中《醫(yī)療保障信息平臺數(shù)據(jù)中臺建設(shè)及應(yīng)用指南》中將數(shù)據(jù)中臺的建設(shè)標準規(guī)范進行了詳細的定義。建設(shè)內(nèi)容包括醫(yī)保數(shù)據(jù)數(shù)倉建設(shè)、數(shù)據(jù)的歸集建設(shè),數(shù)據(jù)模型管理、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)共享管理、數(shù)據(jù)分析等服務(wù)的建設(shè)。
相對于醫(yī)療機構(gòu)、區(qū)域和疾控等醫(yī)療場景,由于國家醫(yī)保局的統(tǒng)一規(guī)劃,醫(yī)保信息平臺和大數(shù)據(jù)平臺的建設(shè)更為靠前,在建設(shè)指南出臺前期就有阿里、騰訊等互聯(lián)網(wǎng)公司參與了建設(shè)指南的輸出,從指南的名字包含”數(shù)據(jù)中臺”可以看到有互聯(lián)網(wǎng)公司大數(shù)據(jù)平臺建設(shè)的印記,建設(shè)的范圍和模式跟互聯(lián)網(wǎng)公司的大數(shù)據(jù)平臺更加貼緊。因此,在醫(yī)保大數(shù)據(jù)平臺這個賽道,對于互聯(lián)網(wǎng)公司更為有利。
對于省級醫(yī)保數(shù)據(jù)中臺的建設(shè),主要的需求有以下幾點:
- 業(yè)務(wù)應(yīng)用和數(shù)據(jù)中臺分開建設(shè)。《建設(shè)指南》中明確要求14個業(yè)務(wù)子系統(tǒng)國家統(tǒng)一下發(fā),數(shù)據(jù)中臺由各個省自行建設(shè)。
- 匯集醫(yī)保業(yè)務(wù)全部新老數(shù)據(jù)形成高質(zhì)量數(shù)據(jù)資產(chǎn)。由于業(yè)務(wù)和數(shù)據(jù)中臺同時建設(shè),業(yè)務(wù)數(shù)據(jù)會有歷史數(shù)據(jù)和增量數(shù)據(jù)標準不統(tǒng)一的情況,醫(yī)保數(shù)據(jù)中臺需要統(tǒng)一存儲、管理和處理歷史數(shù)據(jù)和增量數(shù)據(jù)。
- 數(shù)據(jù)治理和上報標準化、需要緊貼國家考核要求。由于在新的建設(shè)方案下各省業(yè)務(wù)系統(tǒng)數(shù)據(jù)結(jié)構(gòu)統(tǒng)一,省級通過數(shù)據(jù)中臺將數(shù)據(jù)上報到國家,國家會使用統(tǒng)一的規(guī)則進行數(shù)據(jù)質(zhì)量的評分,因此數(shù)據(jù)的治理和上報都需要標準化。省級數(shù)據(jù)中臺的數(shù)據(jù)質(zhì)控需要跟國家對齊,保證本省數(shù)據(jù)上報合規(guī)。
- 面向主題的、分層的數(shù)據(jù)倉庫建設(shè),賦能數(shù)據(jù)應(yīng)用。在醫(yī)保數(shù)據(jù)中臺建設(shè)指南中,國家醫(yī)保局給出了一些業(yè)務(wù)主題的劃分,也明確了醫(yī)保數(shù)據(jù)倉庫建模的一些規(guī)范。因此,省級醫(yī)保數(shù)據(jù)中臺需要支持數(shù)據(jù)倉庫、數(shù)據(jù)主題的統(tǒng)一建設(shè),方便上層數(shù)據(jù)應(yīng)用的數(shù)據(jù)調(diào)用。
三、產(chǎn)品建設(shè)實踐
1. 產(chǎn)品洞察分析
基于以上四大目標場景的分析,我們可以得出以下洞察和的對應(yīng)的產(chǎn)品和服務(wù)方案。
(1)四大場景基礎(chǔ)的數(shù)據(jù)治理場景類似,上層的數(shù)據(jù)應(yīng)用存在場景化差異
在以上四個不同的場景里面整體的需求有相似、相通之處,可以總結(jié)為底層的大數(shù)據(jù)引擎、醫(yī)療數(shù)據(jù)治理層,數(shù)據(jù)應(yīng)用支撐和上層的數(shù)據(jù)應(yīng)用部分。
數(shù)據(jù)治理及以下部分的功能類似,針對不同的場景內(nèi)容和配置的方式可能有差異。例如,數(shù)據(jù)倉庫建模的工具是可以復(fù)用的,數(shù)據(jù)質(zhì)控平臺的工具是可以復(fù)用的,數(shù)據(jù)加工的工作流工具也是可以復(fù)用的,但是針對不同的場景數(shù)據(jù)建模的方法、數(shù)據(jù)質(zhì)控的內(nèi)容、數(shù)據(jù)加工的流轉(zhuǎn)邏輯是有差異的。
上層的數(shù)據(jù)應(yīng)用部分,因為都是針對了具體的場景,都有自己的不同之處。例如,醫(yī)保場景有基金收支洞察,醫(yī)院和區(qū)域衛(wèi)健場景有健康檔案,疾控場景有重點人群管控等。這些應(yīng)用基于數(shù)據(jù)的應(yīng)用,那使用的數(shù)據(jù)還是底層治理的數(shù)據(jù),因此對于上層應(yīng)用部分可以結(jié)合下層的數(shù)據(jù)和一些應(yīng)用搭建工具來組裝,當然部分應(yīng)用還需要定制化的開發(fā)。通過數(shù)據(jù)服務(wù)模塊和可視化的報表搭建工具可以完成一些數(shù)據(jù)應(yīng)用的快速開發(fā)和配置。
因此,整個醫(yī)療大數(shù)據(jù)產(chǎn)品的產(chǎn)品矩陣分為四個部分:大數(shù)據(jù)引擎、醫(yī)療數(shù)據(jù)治理套件、數(shù)據(jù)應(yīng)用支撐、數(shù)據(jù)應(yīng)用。
(2)大部分醫(yī)療機構(gòu)缺乏數(shù)據(jù)相關(guān)的人力儲備,需要提供產(chǎn)品+內(nèi)置規(guī)則+服務(wù)的模式
在以上的四個場景中,絕大部分醫(yī)療機構(gòu)都沒有數(shù)據(jù)部門。部分醫(yī)院逐漸的開始在信息科中有一些做數(shù)據(jù)開發(fā)和分析的角色,而其他運用主體都沒有對應(yīng)角色的人來操作大數(shù)據(jù)的平臺。在這種情況下,運用主體需要的產(chǎn)品不光是平臺和工具,而是基于平臺和工具的場景化數(shù)據(jù)服務(wù)。有一個形象的比喻叫做『交鑰匙工程』。提供數(shù)據(jù)質(zhì)控工具只是服務(wù)的一部分,提供數(shù)據(jù)治理服務(wù)和提升數(shù)據(jù)治理效果才更契合實際需求。
因此,提供平臺以外的基于不同場景下的內(nèi)容以及對于數(shù)據(jù)的長期運營和服務(wù)。例如醫(yī)保場景下我們要提供醫(yī)保數(shù)據(jù)接入、質(zhì)控、上報的工作流模板,這些模板需要生態(tài)合作伙伴商協(xié)調(diào)完成配置,并持續(xù)的運營。隨著信息化、云化的深入滲透,部分醫(yī)院開始組建對應(yīng)的數(shù)據(jù)運營團隊,部分醫(yī)美和私立醫(yī)院逐步采用了公有云模式。政府也在成立相關(guān)的數(shù)據(jù)運營公司來運營醫(yī)療數(shù)據(jù),未來醫(yī)療數(shù)據(jù)運營也會逐步的標準化,服務(wù)化,需要提供基于業(yè)務(wù)的數(shù)據(jù)加工功能和模板的沉淀,讓運營團隊可以低成本的運營。
(3)抽象醫(yī)療數(shù)據(jù)處理流程,使之產(chǎn)品化
既然要提供大數(shù)據(jù)平臺+規(guī)則+服務(wù)的模式,通用的大數(shù)據(jù)平臺提供的主要是代碼和流程的編輯工具,對于醫(yī)療數(shù)據(jù)規(guī)則的積累無法很好的產(chǎn)品化。將醫(yī)療數(shù)據(jù)處理的的過程抽象成可配置化的、面向場景的醫(yī)療數(shù)據(jù)處理步驟是一個不錯的方案。從更直觀的角度來看,可以把這種配置叫做醫(yī)療數(shù)據(jù)加工的算子,每一個算子不單單是通用的數(shù)據(jù)過濾、數(shù)據(jù)關(guān)聯(lián)等操作,而是一個有業(yè)務(wù)含義的數(shù)據(jù)處理過程。
例如,把數(shù)據(jù)質(zhì)控抽象成一個算子,在工作流中配置一個算子就可以完成整個表的質(zhì)控;將患者主索引抽象成一個算子,配置患者主索引算子就可以完成主索引數(shù)據(jù)合并的配置;將醫(yī)保數(shù)據(jù)轉(zhuǎn)碼抽象成一個算子,在工作流中用一個算子就可以完成醫(yī)保數(shù)據(jù)從地方碼轉(zhuǎn)換為國家標準編碼。這種經(jīng)過抽象過的可視化配置算子一方面在產(chǎn)品層面沉淀了醫(yī)療數(shù)據(jù)處理的方法,一方面降低了產(chǎn)品的實施和維護成本。
(4)一體化的大數(shù)據(jù)平臺
由于醫(yī)療數(shù)據(jù)的處理基于上游的數(shù)據(jù)采集標準和面向數(shù)據(jù)應(yīng)用的數(shù)據(jù)應(yīng)用標準。標準的變動會影響到數(shù)據(jù)處理流程全鏈路的變動,例如標準變更以后對應(yīng)的數(shù)據(jù)模型表、數(shù)據(jù)工作流、數(shù)據(jù)指標、展示層的BI報表都需要做一些變更。
在這種情況下,割裂的數(shù)據(jù)平臺和工具會帶來很高的數(shù)據(jù)治理和運維成本,為醫(yī)療數(shù)據(jù)的使用套上不必要的枷鎖。因此,提供一體化的大數(shù)據(jù)平臺可以更有效地降低數(shù)據(jù)治理和運維成本。例如數(shù)據(jù)標準的變更可以借助于數(shù)據(jù)資產(chǎn)計算的血緣關(guān)系,自動通知到下游的數(shù)據(jù)工作流、數(shù)據(jù)指標和報表的變更,進一步降低數(shù)據(jù)治理的成本,提高數(shù)據(jù)的可用性。
2. 核心模塊功能特性
基于以上的分析和在具體項目中的實踐,醫(yī)療數(shù)據(jù)中臺提供了四層產(chǎn)品,分別是以下模塊。
(1)大數(shù)據(jù)處理引擎層
大數(shù)據(jù)處理引擎:騰訊集團已經(jīng)有比較成熟的大數(shù)據(jù)能力和平臺產(chǎn)品套件,包括云Spark、Flink、Hive、數(shù)據(jù)湖基礎(chǔ)能力。
(2)醫(yī)療數(shù)據(jù)治理套件
數(shù)據(jù)工作流:將醫(yī)療數(shù)據(jù)處理抽象成具體的可視化配置算子(例如數(shù)據(jù)質(zhì)控算子、患者主索引算子、醫(yī)保轉(zhuǎn)碼算子等),通過表和算子的向?qū)渲猛瓿蓴?shù)據(jù)工作流的組裝,同時基于TBDS調(diào)度和任務(wù)運行的能力,生成對應(yīng)的Spark、Shell、HiveSQL任務(wù)下發(fā)到TBDS執(zhí)行。
另外,針對數(shù)據(jù)工作流提供了更加全面和細致的監(jiān)控功能。例如每個算子每次實例的數(shù)據(jù)條數(shù),每個算子的任務(wù)運行狀態(tài)等。內(nèi)容沉淀方面,針對具體場景沉淀數(shù)據(jù)工作流的模板,方便后期在具體項目實施中一鍵配置。
標準管理平臺:提供了醫(yī)療數(shù)據(jù)標準的管理和維護能力。跟下游的數(shù)據(jù)工作流、數(shù)據(jù)質(zhì)控打通。定義好的數(shù)據(jù)標準可以直接用于質(zhì)控規(guī)則的生成,避免多次配置,保證規(guī)則的一致性。內(nèi)容沉淀方面,沉淀具體場景下的數(shù)據(jù)標準,積累各類醫(yī)學(xué)數(shù)據(jù)標準。
數(shù)據(jù)質(zhì)量平臺:跟數(shù)據(jù)標準和數(shù)據(jù)工作流打通。建表后自動創(chuàng)建默認的質(zhì)量規(guī)則,同時提供多種規(guī)則模板。配置的質(zhì)控規(guī)則可以在數(shù)據(jù)工作流中用算子的方式調(diào)用,讓數(shù)據(jù)質(zhì)控可以在工作流的任何節(jié)點以任何頻率發(fā)起。
同時,由于醫(yī)療場景下的很多數(shù)據(jù)都不是直接去讀業(yè)務(wù)的備庫,是有專門的廠商整理好數(shù)據(jù)到前置機,然后再從前置機同步數(shù)據(jù),勢必會造成數(shù)據(jù)的不一致,所以數(shù)據(jù)的一致性對賬尤為重要。因此,數(shù)據(jù)質(zhì)量平臺提供了從數(shù)據(jù)接入對賬、到數(shù)據(jù)接入趨勢監(jiān)控到醫(yī)療機構(gòu)質(zhì)量評分三個階段的數(shù)據(jù)質(zhì)量保障。
根據(jù)標準自動生成的質(zhì)控規(guī)則配置
在數(shù)據(jù)質(zhì)控的展現(xiàn)層面提供面向不同場景的質(zhì)控Dashboard,做到一份質(zhì)控數(shù)據(jù)根據(jù)場景的需要按照不同方式展示。內(nèi)容沉淀方面,沉淀和內(nèi)置面向場景的質(zhì)控規(guī)則。例如,國家醫(yī)保的數(shù)據(jù)質(zhì)控規(guī)則。
醫(yī)療機構(gòu)場景下源表-接入表對賬監(jiān)控
疾控場景下源表-接入表對賬監(jiān)控
數(shù)據(jù)資產(chǎn)平臺:通過從數(shù)據(jù)工作流、指標管理平臺、數(shù)據(jù)服務(wù)平臺中獲取元數(shù)據(jù),通過元數(shù)據(jù)的計算來生成全鏈路的血緣關(guān)系。為數(shù)據(jù)變更影響分析提供有利的依據(jù)。同時,數(shù)據(jù)資產(chǎn)基于不同的場景提供資產(chǎn)的分類,沉淀場景化的數(shù)據(jù)資產(chǎn)目錄。
指標管理平臺:指標管理平臺提供原子指標、維度、衍生指標的定義。同時指標的運行會跟數(shù)據(jù)工作流互通。指標管理平臺的核心在于沉淀各個場景下的常用指標。例如,結(jié)合醫(yī)保數(shù)據(jù)倉庫,沉淀醫(yī)保運行檢測等數(shù)據(jù)應(yīng)用的指標。
(3)數(shù)據(jù)應(yīng)用支撐層
數(shù)據(jù)服務(wù)平臺:數(shù)據(jù)服務(wù)平臺處理提供最常見的數(shù)據(jù)查詢服務(wù)以外,也提供了醫(yī)療場景下常用的XML數(shù)據(jù)寫入服務(wù),支持共享文檔等內(nèi)容可以通過數(shù)據(jù)服務(wù)的方式進行配置。同時,數(shù)據(jù)資產(chǎn)也可以采集到數(shù)據(jù)服務(wù)的內(nèi)容,可以分析潛在的數(shù)據(jù)變更對數(shù)據(jù)服務(wù)的影響。另外,數(shù)據(jù)服務(wù)平臺作為數(shù)據(jù)應(yīng)用的開發(fā)方式之一,沉淀了健康檔案等數(shù)據(jù)應(yīng)用常用的數(shù)據(jù)查詢服務(wù)。
數(shù)據(jù)可視化平臺:數(shù)據(jù)可視化平臺包括數(shù)據(jù)分析平臺和3D可視化數(shù)字孿生平臺。數(shù)據(jù)可視化平臺結(jié)合醫(yī)療數(shù)據(jù)中臺的能力,提供了政府監(jiān)管、醫(yī)療運營分析可視化等模板。3D可視化數(shù)字孿生平臺基于領(lǐng)先的3D可視化能力,結(jié)合醫(yī)療數(shù)據(jù)中臺的數(shù)據(jù)和智能的AI算法,提供了醫(yī)療場景下3D的可視化產(chǎn)品能力。
(4)數(shù)據(jù)應(yīng)用層
數(shù)據(jù)應(yīng)用面向不同的場景,結(jié)合數(shù)據(jù)應(yīng)用支撐層開發(fā)面向行業(yè)的數(shù)據(jù)應(yīng)用。例如360患者瀏覽器、醫(yī)保基金收支洞察等。
四、未來規(guī)劃
當前醫(yī)療數(shù)據(jù)中臺產(chǎn)品已經(jīng)在大型醫(yī)有一些項目在逐步落地,隨著項目的落地產(chǎn)品的能力也在逐漸的補全。未來的產(chǎn)品規(guī)劃大概會從以下幾個方面發(fā)力:
- 提升產(chǎn)品標準化能力。由于在醫(yī)療大數(shù)據(jù)賽道積累時間不算很長,有些產(chǎn)品功能存在項目的定制,對于類似的產(chǎn)品能力需要把能沉淀成功能的沉淀成面向場景的功能,根據(jù)不同的場景配置會提供不同的功能,進一步把能力做成可配置化、標準化,提升產(chǎn)品的標準化能力。
- 交付和實施標準化。在產(chǎn)品標準化的同時,根據(jù)項目中實踐的積累,沉淀出交付標準化的能力,上架對應(yīng)的標準交付包。除了安裝、部署的標準化之外,不同場景下的數(shù)據(jù)采集規(guī)范、醫(yī)療健康數(shù)據(jù)倉庫建模規(guī)范、醫(yī)療數(shù)據(jù)指標配置都可以沉淀成標準產(chǎn)品的能力和標準的交付實施工作。將這些交付工作標準化,進一步減少自研能力的投入,培養(yǎng)更多的醫(yī)療數(shù)據(jù)交付和運營人才。
- 引入更符合場景和更先進的技術(shù)能力,增加產(chǎn)品的適用性。醫(yī)療行業(yè)的在大數(shù)據(jù)方面使用的技術(shù)跟互聯(lián)網(wǎng)行業(yè)還有比較大的差距,在某些場景下數(shù)據(jù)量也在暴增,數(shù)據(jù)更新和查詢的需求非常的突出,但是計算資源又投入不多。所以在這種場景下一方面要引入互聯(lián)網(wǎng)行業(yè)里面成熟的、靠前的技術(shù),另外一方面也需要根據(jù)醫(yī)療行業(yè)特有的情況做評估。例如,目前在醫(yī)保的場景下嘗試數(shù)據(jù)湖來解決數(shù)據(jù)更新的問題,在疾控的場景下引入ClickHouse來滿足更快的查詢服務(wù)。
- 完善產(chǎn)品的生態(tài)體系。醫(yī)療大數(shù)據(jù)平臺的建設(shè)牽扯的流程比較長,參與的角色也比較多,在產(chǎn)品的交付、實施中引入生態(tài)合作伙伴可以降低產(chǎn)品規(guī)?;桓兜某杀?。另外,醫(yī)療大數(shù)據(jù)最終服務(wù)的還是面向業(yè)務(wù)的數(shù)據(jù)應(yīng)用,業(yè)務(wù)的應(yīng)用是偏向于定制化、多元化的。因此,需要引入面向業(yè)務(wù)應(yīng)用的合作伙伴,讓大數(shù)據(jù)平臺更加的開放,讓合作伙伴也可以一起加入數(shù)據(jù)應(yīng)用的開發(fā)才能更長久、健康地保障產(chǎn)品的成長。
- 加強產(chǎn)品在醫(yī)療數(shù)據(jù)安全方面的建設(shè)。醫(yī)療數(shù)據(jù)關(guān)系到患者的眾多敏感信息,對于數(shù)據(jù)敏感性、安全性要求更高。因此,平臺遵循國家衛(wèi)健印發(fā)的《國家健康醫(yī)療大數(shù)據(jù)標準、安全和服務(wù)管理辦法(試行)》進行產(chǎn)品的建設(shè),內(nèi)置符合醫(yī)療數(shù)據(jù)的分類分級產(chǎn)品功能模塊,根據(jù)不同的數(shù)據(jù)分級做針對性的脫敏處理和權(quán)限審批處理,保障醫(yī)療數(shù)據(jù)的安全使用。
參考資料:
[1,2] 安信證券.從醫(yī)渡科技赴港上市看醫(yī)療大數(shù)據(jù)解決方案行業(yè)潛力如何?
作者:jayshi,騰訊CSIG產(chǎn)品;公眾號:騰訊大講堂
本文由 @騰訊大講堂 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于 CC0 協(xié)議
文章從醫(yī)療大數(shù)據(jù)平臺的背景和市場現(xiàn)狀,再到使用場景類型,具體建設(shè)時間及未來發(fā)展,都有作者自己獨到的思考。