
健康云上如何进行大数据的挖掘与分析(一)
本文旨在介绍区域医疗信息系统建设和大数据分析技术的发展,并总结出健康云上的大数据分析面临的特殊挑战和提出初步解决方案。
一、健康云的兴起
随着我国经济持续稳定的发展和现代科技的日益进步,越来越多的人们开始重点关注自身健康。在满足日常工作和生活的需求之外,规律的健身休闲活动、年度体检、健康饮食已经成为越来越普遍的想象。与此同时,随着国家新医改政策的颁布和实施,与健康直接相关的医疗行业也正在迅猛发展。这里重点介绍一下我国医疗行业IT解决方案市场呈现的发展趋势:
1、 渐增的多样医疗数据源:医疗数据的生成和采集已经不再仅局限于医院这个单一环境。它还可以来自于体检中心、社区/乡镇卫生院、私人诊所、实验室检验中心、急救中心、家庭,随着物联网(IoT, Internet of Things)相关技术的发展,我们甚至可以说:个人医疗数据可以采自于任何适合的地方。
2、 医疗数据的高度集中化:区域医疗信息系统(RHIS, Regional Health Information System)将逐步取代现有的基于医院的信息系统。并且,它将更广泛的覆盖一个特定区域内的所有医院、社区、急救中心、体检中心、实验室检验中心、社会保险机构等。居民个人来自各个数据源的全周期医疗数据将集中保存在统一的区域数据中心中。医疗数据将不再只是某家医院独享的资源,而是与整个区域中的所有医疗机构共享,甚至可以与更上层的大区域级、国家级信息系统进行数据交换。
3、 从医疗信息系统到医疗信息服务:区域医疗信息系统的逐步建立将使先进的医疗信息服务的设计和开发变得更加便捷。例如:流行病分析、公共卫生事件预测、临床决策支持、慢性病管理、个性化的健康照护计划、日常卫生保健管理等。其原因是因为这些信息服务必须建立在数据集中化的基础上。这些服务的受众群体将是整个社会。
正是如上所述的发展趋势使得“健康云(Healthcare Cloud)”的建立才会成为可能。试想一下:在不久的将来,我们可以通过手机统一查询在不同医院的就诊记录、生化检验结果、处方和收费清单;慢性病患者在家中可以自测血压、血糖等指标并通过无线网络上传到区域医疗数据中心,医生也可以远程分析患者自测数据判断其病情发展;大量的知识和规则从海量数据中自动提取出来,并用来协助社区及基层卫生机构的初级医生对患者作出准确的诊断和用药决策;各个社区居民的医疗数据将会自动汇总,并进行统计分析,用以进行流行病、慢性病的自动筛查、趋势分析和爆发预警,为公共卫生机构制定防治干预计划和行动提供有力的依据和参考;患者的症状、生命体征、检验检测结果、医疗影像、诊断、处方、医嘱、手术、住院和账单等全周期数据将会进行全方位的跟踪和分析,为新药开发、新治疗方案的设计提供支持。上述这些事例都将是我们通过健康云可以逐步实现的。
当然,健康云不是一天就可以建成的,这将是个阶段性的工程。除了国家政策和地方支持等外围因素之外,云计算和大数据技术将会起决定性作用。从构建底层云基础架构、云存储方案,到中层的云计算平台,最后到上层的云应用服务设计和开发,至少需要3~5年的长期规划。其中,大数据分析部分更是纵向贯穿于云基础架构、云平台和云服务三层,需要整体设计和逐步实施。基于现有技术和需求,在本文中,我们暂且把健康云简化定义为:基于区域医疗信息系统的医疗信息服务,并重点关注1~3年的市场需求。
二、大数据分析技术的发展
区域医疗信息系统中的医疗数据是典型的大数据。我们知道所谓的“大数据”并不只是数量上的“大”。在此,我们简单套用一下大数据的4V(Volume,Velocity,Variety,Value)定义:
1、 Volume:区域医疗数据通常是来自于拥有上百万人口和上百家医疗机构的区域,并且数据量持续增长。按照医疗行业的相关规定,一个患者的数据通常需要保留50年以上。我们可以想象这是多么巨大的数据量。
2、 Velocity:医疗信息服务中可能包含大量在线或实时数据分析处理的需求。例如:临床决策支持中的诊断和用药建议、流行病分析报表生成、健康指标预警等。
3、 Variety:医疗数据通常会包含各种结构化数据表、非(半)结构化文本文档(XML和叙述文本)、医疗影像等多种多样的数据存储形式。
4、 Value:医疗数据的价值不必多说,它不仅与我们个人生活息息相关,更可用于国家乃至全球的疾病防控、新药研发和顽疾攻克。
近年来,在卫生部的领导下和国家财政支出的支持下,绝大多数的三甲医院和部分二级医院已经先后建立了先进的数字化信息系统和电子健康档案系统。但至今为止,大部分系统和数据仍然只限于内部使用。据了解,2010年底,卫生部完成了“十二五”卫生信息化建设工程规划编制工作,初步确定了我国卫生信息化建设路线图,简称“3521工程”,即建设国家级、省级和地市级三级卫生信息平台,加强公共卫生、医疗服务、新农合、基本药物制度、综合管理5项业务应用,建设健康档案和电子病历2个基础数据库和1个专用网络建设。由此可看出,今后的几年,随着云计算技术的成熟和实用化,大规模区域医疗信息系统和大型数据中心的建立将逐步展开。然而,随着海量医疗数据被保存下来,一个棘手的问题出现了:我们如何通过高效的分析这些数据来提供有价值的服务?
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27数据分析在当今信息时代发挥着重要作用。单因素方差分析(One-Way ANOVA)是一种关键的统计方法,用于比较三个或更多独立样本组 ...
2025-04-25