智慧医疗 | 久其如何建立医疗数据中台?


新冠肺炎疫情发生以来,CT影像诊断、无人服务车、红外体温检测等AI服务为守护人类健康做出了许多贡献;预约诊疗、互联网医院、远程医疗等改善医疗服务重要举措也在应对疫情、满足人民群众就医需求等方面发挥了积极作用。

在疫情和舆情交织的复杂局面下,运用云计算、大数据等技术进行精确详实的数据归集和分析,让医疗机构、科研与疾控中心、政府部门有效的快速的利用数据,甚至是大数据,就显得尤为重要。如何把数据变成资产并对业务产生真正的支撑,是医疗机构面临的一个核心挑战,而数据中台则被视为应对这一挑战的利器。

为什么要构建医疗数据中台?

数据中台涵盖数据资产、数据治理、数据模型、垂直数据中心、全域数据中心、萃取数据中心、数据服务等多个层次的体系化建设方法,是一套可持续“让企业的数据用起来”的机制。

医院对数据中台的需求是呼之欲出的。如果说医院数字化前台就是面向患者的服务界面、面向医护人员的诊疗业务界面、面向医院管理人员的行政业务管理界面;那么医院数字化中台就是以医生为核心,整合多业务系统,建立数据标准,实现医疗数据沉淀和流转,并沉淀多种能力;最后再通过医院数字化后台,区域联通形成医疗大数据,盘活存量知识进行诊断辅助,临床数据反哺科学研究形成数据应用闭环。

目前,医疗数据被广泛应用于临床决策支持、药物研发、远程病人数据分析、公共卫生领域等方面,与此同时,数据质量及数据孤岛成为医疗大数据应用的“绊脚石”,医疗大数据发展应用的问题也逐渐浮现,主要体现在以下几个方面:

  • 患者数据散落在各医疗业务系统中,形成临床医学数据孤岛,数据难以打通;

  • 患者临床数据格式多样、类型复杂,有EMR系统中的文档数据,也有LIS系统中的影像数据、图片数据等,多模态的数据导致管理难、维护难,数据价值挖掘更难;

  • 现有的信息系统中的数据除了少量的结构化数据外,更多的是半结构化、非结构化数据,半结构化、非结构化的数据中的信息按照现有的信息系统处理方式,很难挖掘其中的价值;

  • 医生书写电子病历的时候,难免存在书写不标准甚至书写错误的情况,非标准化的数据增大了临床数据信息挖掘的难度,也难以在医疗科研中利用起来。

如何建立医疗数据中台?

疫情期间,由协和医院血管外科与久其软件合作开发的患者全景数据中台正式上线,对外提供标准化的API,向上支撑了全景数据库云平台、云阅片、早交班系统、多中心科研管理平台以及专病辅助诊疗系统。数据中台向上为上层各个智能应用提供的底层数据基础的同时,上层业务应用的数据也沉淀积累进入数据中台,形成了数据流程上的闭环,使医院的数据充分利用起来,方便医生、造福患者。此外,数据中台还具备了患者全域数据汇聚整合,标准数据资产形成以及临床医疗数据服务支撑等核心能力。

结合协和医院血管外科的数据情况,将整体系统划分为:数据源接入层、技术组件层、数据处理层、数据存储层、数据中台层以及业务中台层,如下图所示:

架构图

医院内部业务系统繁杂众多,将不同系统之间的数据汇聚整合是平台建设的首要任务。数据对接方式有三种:

1) ETL抽取,即需要取得业务系统数据库的连接方式;

2) 标准化的数据接口,不同类型的数据可调用不同的数据接口来获取,获取方式也按照业务系统实现的不同来选择“推”或者“拉”的方式。对于电子病历数据来说,可以参照《电子病历数据数据共享规范》基于WSDL/XML协议的接口进行数据对接与解析;也可以参照《临床病历上报接口规范》中的方式,基于Restful/JSON的方式,通过接收业务系统上报来获取。业务系统中的影像数据通过文件下载的方式获取,设备或者工作站中的影像数据通过DICOM协议来传输获取;

3) RPA机器人技术对接,对于大部分医院的业务系统来说,很难协调去开通接口或者直连数据库,可以通过RPA机器人模拟人的操作来获取数据。数据接入之后,首先对数据进行数据稽核校验,检查数据的完整性、清洗掉非法数据以及重复数据,然后建立患者主索引并对患者数据进行脱敏,最后将数据存入源数据资产库。

怎样进行患者数据提纯?

参照卫生部发布的《电子病历基本架构与数据标准》、《健康档案基本数据集编制规范》以及《电子病历基本数据集》等资料,研发团队梳理出一套标准的临床数据模型,在此基础上建立标准数据库,将原数据资产库中的数据进行提纯加工,再存入到标准数据库里面。患者数据提纯加工主要包含以下几个方面:

(1) 诊断名称、手术名称以及药物名称等专有名称标准化处理,通过ICD10、ICD9-CM3等规范进行映射处理;

(2) 从病历数据的文本描述中提取关键信息,例如:从既往史中提取患者是否患有高血压,服用什么药物等;

(3) 半结构化数据到结构化数据的映射,在源数据资产中更多的数据是以半结构化形式存在;

(4) 根据数据的业务场景,形成数据目录。

标准数据资产库形成后,向上层应用提供了标准化的接口,上层应用可以直接调用或者进行数据呈现。如果标准数据资产仍需进一步加工,则可以在标准库的基础上创建专病库、科研库等主题数据库,数据可以基于NLP等技术进一步深加工。除此之外,平台本身有完善的数据权限体系,根据不同人、不同部门、不同职责可以设置对应的数据权限,保障数据安全。

由于医疗数据中台投入大,时间周期长,且尚处于探索阶段,目前构建医疗数据中台的机构并不多。但数据中台是助力医疗机构信息化建设的有效手段,建设的基于深度治理后的医疗数据资产,将有助于医疗工作者完整的理解疾病相关指征、深刻理解各类指标数据,为确立有效的诊疗方案提供数据支撑,为医学科研项目提供更优质的患者案例数据。

联系我们,获取更多资讯