
拥抱大数据 加快医疗信息化建设_数据分析师
3月25日,国务院总理李克强主持召开国务院常务会议,确定今年深化医药卫生体制改革重点工作。会议强调,要建立医疗信息化系统,推动异地就医即时结算。医疗信息化建设在深化医药卫生体制改革工作中越发重要,医疗信息化建设的最终目的是使得医疗卫生相关数据在法规要求下实现数据的互联互通、信息共享,改变“信息孤岛”的现状,更好地支撑医疗卫生事业的发展。
当前我们正处于一个数据爆炸性增长的大数据时代,各类信息系统在医疗卫生机构的广泛应用以及医疗设备和仪器的逐步数字化使得医院积累了更多的数据资源,这些数据资源是非常宝贵的医疗卫生信息,对于疾病的诊断、治疗、诊疗费用的控制等都是非常有价值的。如何在大数据时代做好医疗卫生信息化建设,是值得我们思考的问题。
一、中国医疗信息化建设现状
中国医疗信息化建设从1998年开始,1998年国务院决定建立城镇职工医疗保险制度,医疗卫生机构需要对计价、收费、住院管理等流程进行信息化,并实现与医保结算系统的对接,医院开始建设以收费为中心的初级HIS系统,中国医疗信息化建设开始起步。2008年中国开始深入推进医药卫生体制改革,在医药卫生体制改革中确认的新医改“四梁八柱”体系中,信息化是唯一的技术支柱,医疗信息化从而进入了快速发展期。
2008年至今6年时间里国家出台多项政策推动医疗信息化建设,包括:医疗卫生信息化“十二五”规划、基层医疗信息系统建设指导意见、中医药信息化建设“十二五”规划、健康中国2020等,这些政策的出台使得医疗信息化建设步入快车道。根据赛迪顾问数据,2013年中国医疗行业IT应用整体投资规模突破300亿元。
图1 2009-2013年中国医疗行业IT应用市场规模与增长
在这一过程中IT技术发展日新月异,新兴IT技术开始渗透并影响医疗卫生领域,为医疗信息化建设带来新的气息,特别是大数据相关技术在其中发挥了重要作用。
二、大数据时代对医疗信息化建设新要求
据估计,中国一个中等城市(100万人口)50年所积累的医疗数据量就会达到10PB级别。随着我国医疗信息化建设加快,医疗卫生数据量爆发式增长,医疗卫生领域已迎来了自己的“大数据时代”,大数据相关特性对医疗信息化建设提出了新的要求。
(一)数据量爆发式增长,要求医疗信息化架构可扩展
医疗卫生数据主要来源于三方面:
1、生命科学领域及医药研发领域
在生命科学领域,随着高通量测序的技术发展和逐步应用,生命科学领域的数据量正在高速增长,每台高通量的测序仪每天可产生约100GB的数据,仅华大基因一家中国基因公司,每天就有一百多台这样的测序仪在满负荷的运行着,产生10TB的数据。在医药研发领域,药物研发是相当密集型的过程,一家中小型制药企业年累积的数据量也在TB以上。
2、医疗领域
就医疗机构诊疗数据看,诊疗数据结构复杂包含大量半结构化或非结构化数据,单个半结构化数据(如心电图、B超、CR、CT等)的数据量远远大于单个结构化数据(如XML文档),如一张普通CT图像大约150MB、一个标准的病理图接近5GB,而一个XML文档大小约几十K,随着医疗机构信息化建设转向临床信息系统,越来越多医院将重点建设PACS、LIS系统,从而产生大量非结构化诊疗数据。
医疗领域大数据除医疗机构诊疗数据外,患者在医疗机构就医过程中还将产生挂号、缴费、新农合基金使用情况、医保资金使用情况、诊断结论、诊疗过程等数据。根据卫计委2014年颁布的《人口健康信息管理办法(试行)》要求,电子健康档案、电子病历、全员人口信息等人口健康信息需要实现长期保存,医疗领域数据量将逐年累积增加。
3、移动医疗领域
随着移动互联网、物联网技术的快速发展,可穿戴式医疗设备逐步从概念走向现实。可穿戴式设备最重要的应用就在医疗健康管理领域,从谷歌眼镜、苹果手表到耐克腕带等均具备一定医疗健康管理功能,为用户提供身体素质指标监测、疾病数据跟踪等服务。随着可穿戴式设备的快速发展,未来将产生大量的医疗健康数据。
面对来源丰富且日益膨胀的医疗卫生数据,目前医疗信息化的存储架构无法满足大数据应用的需要,在处理和查询大数据集时更是力不从心,需要设计新的以数据为中心的计算模型和系统架构,把医疗卫生各个业务系统独立的、分散的、不同品牌或不同级别的存储产品统一到一个或几个大的存储池下,形成逻辑上统一的整体,进而根据数据整合或应用整合的需要将数据迁移到相应的存储空间,从而实现医疗信息化中存储架构的统一规划和部署。
(二)数据价值高,要求医疗信息化建设重视数据挖掘
医疗卫生数据结构较为复杂,除了普通结构化数据外,多为半结构化或者非结构化的数据,如心电图、B超、CT、MR、CR、等临床影像文件多为非结构化数据。在“大数据”时代,传统的数据库分析系统正面临着一次历史性变革。
目前国外已经有许多机构开始深入研究医疗数据的挖掘利用,并已经从大数据中找到了与医疗卫生相关的潜在价值,例如:早在2009年,甲型H1N1流感爆发的几周前,Google开发“谷歌流感趋势”延伸服务,通过分析大量用户对于流感有关词条所做的搜索记录识别流感爆发,与官方机构相比Google能提前1-2周预测流感爆发,预测结果与官方数据相关性高达97%。苹果前总裁史蒂夫•乔布斯在与胰腺癌症斗争的过程中也应用了大数据技术,他是世界上第一个对自身所有DNA和肿瘤DNA进行排序的人,通过分析整个基因数据的大数据文档,乔布斯的医生能基于他的特定基因组成按需用药。资料显示,胰腺癌患者的死亡率极高,出现症状后患者的平均寿命仅为9个月,5年生存率不到2%,但是乔布斯通过大数据技术开发出的个性化药物将生命延长了好几年。
相对国外医疗卫生数据挖掘的进展,我国医疗卫生数据挖掘才刚刚起步,大部分医疗卫生机构还停留在数据的精确性层面,而非从数据关联性方面分析挖掘数据价值,需要加大对医疗卫生大数据分析的投入,通过对医疗卫生大数据有效的存储、处理、查询和分析,辅助医生做出更为科学和准确的诊断和用药决策,帮助医院根据患者潜在需求开发全新个性化服务及自动服务,帮助相关研究机构突破医疗方法和药物革新,支持地区甚至全国医疗行业主管部门优化医疗资源及服务配置。
三、大数据时代中国医疗信息化建设的建议
大数据时代医疗信息化建设从产业角度看,未来将创建一个以患者为中心,数据快速流通,精准分析的价值链条。在此链条中政府、医疗卫生机构、医疗信息化软硬件提供商等应明确各自定位,协同合作,才能在大数据时代做好医疗信息化建设。
(一)政府应发挥政策制定、产业发展推动作用
政府在医疗信息化建设中主要发挥政策制定、产业发展推动作用。目前我国医疗信息化标准建设不完备,基础的电子病历和电子健康档案建设标准虽然已经出台,但目前并没有出台针对大数据时代医疗信息化建设中涉及的各项数据的采集、传输、处理及相关医疗信息架构的标准。
(二)医疗卫生机构应前瞻部署医疗信息化建设
医疗卫生机构是医疗信息化建设主体,在进行医疗信息化建设过程中应该有前瞻意识,勇于将新一代信息技术融入医疗信息化建设过程中。目前一些三甲医院已经进行了诸如移动医疗、远程医疗等尝试,但对于大数据在医疗卫生机构应用仍然较为保守,仍停留在BI用大数据辅助办公阶段,用于临床精准用药的较少,未来随着大数据相关技术的逐步成熟,医疗卫生机构应逐步将大数据从辅助办公拓展到提高临床医疗服务质量方面。
(三)ICT厂商应加大上下游合作,瞄准大数据下医疗信息化建设积极开发新产品
软硬件设备厂商作为医疗信息化技术的提供者,应瞄准大数据下医疗信息化建设新机遇开发新产品,加大上下游产业链合作,如针对可穿戴设备产生的大量健康监测数据,医疗信息化软硬件设备厂商可以与下游医疗卫生机构合作,将医疗服务前置,使患者能够尽快发现可能的健康隐患,甚至在家中就能通过智能终端定期查看可穿戴设备中记录的健康信息,并得到医疗机构相关医生给予的医疗健康诊断信息及就诊建议,实现“治已病”向“治未病”的转移;由于可穿戴设备小巧、轻薄的特点对电池的续航能力和CPU、无线传输芯片的功耗提出更为苛刻的要求,医疗信息化软硬件设备厂商需要软硬件厂商与上游处理器、存储器、电源、无线通信、软板、传感器、执行器等主要零部件厂商合作,共同开发具有功耗低功能强的可穿戴式医疗产品。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09