京公网安备 11010802034615号
经营许可证编号:京B2-20210330
医疗大数据的正确打开方式:什么样公司有发展前景?
大多数医院已完成了配置各种辅助检查的软硬件安装和网络存储,并有超过半数的医院已配置了HMIS和CIS,医疗信息以分散和非结构化的形式存在于HMIS和CIS的各个模块中,如ERM,HIS,LIS等。对于传统的软件服务商来说,机会已经不大。待这些基础设施搭建完毕后,下一阶段医院将集中投资建立汇集各模块信息的集成平台,以及信息结构化技术上。医院智能化带来的投资机会将是如何利用医院数据实现医疗产业中的各方共赢。我们看好那些具有数据开放性、数据深度结构化的公司,以及具备权威可信数据应用规则的公司,和达到一定的医院覆盖率的公司。
76亿人次诊疗信息的价值
在医疗大数据和互联网+医疗被热烈讨论的今天,大部分移动医疗只是做一些边缘性的工作,所获取的数据也多为行走步数、锻炼频次和强度、心率血压血糖、膳食数据和药店或App购药信息,并没有能够切入医疗的核心流程。与其在这片红海里和诸多竞争者厮杀,不如把目光投向这块尚未被充分开发的处女地——医院信息。
根据卫计委公布的数字,2014年前11个月全国医疗卫生服务机构诊疗量(门诊和住院)达到67.7亿人次,其中三级医院接收了12.1亿人次。全年全国诊疗量估计超过76亿人次。这些医院信息有极大的价值,它涵盖了患者的人口统计学信息、诊疗信息、用药信息和费用信息,而这些信息又为流行病学研究、循证医学研究、医保控费标准制定、新险种开发和药品研究及精准销售提供了数据基础。
三级医院信息化率超过60%
医院信息主要储存在HMIS和CIS两大系统中。HMIS(Hospital Management Information System,医院管理信息系统)的主要目标是支持医院的行政管理与事务处理业务,提高医院的工作效率。HMIS偏重医院管理,以医院各级管理人员为服务对象。常见模块包括门诊收费、药房药库、功能科室、住院收费、财务查询、病案管理等。CIS(Clinical Information System,临床信息系统)的主要目标是支持医院医护人员的临床活动,收集和处理病人的临床医疗信息,为病人提供更好的服务。CIS偏重临床服务,以病人为中心,以医护人员为服务对象。常见模块包括门急诊挂号系统、医生工作站系统、护士工作站、影像归档和通信系统(PACS)、实验室系统(LIS)、药物咨询系统等。
现阶段大多数医院已完成了配置CT、MRI和网络存储,这些基础的软硬件相当于骨骼。有超过半数的医院已配置了HMIS和CIS,医疗信息以分散和非结构化的形式存在于HMIS和CIS的各个模块中,如ERM,HIS,LIS等,这些分散的模块相当于人体的肌肉。CHIMA发布的《2014-2015年度中国医院信息化状况调查》显示,在抽样调查的300余家三级医院中,一些使用频次最高的HMIS和CIS模块的整体渗透率高于60%。可以想象,在经济发达地区的三甲医院中,信息系统的覆盖率会更高。
技术、资金、政策驱动信息化迈进智能化
待这些基础设施搭建完毕后,下一阶段医院的投入会集中在建立汇集各模块的集成平台和将信息结构化为可搜索可统计的数据上。这也是最复杂最高级的一部分,相当于我们的大脑,它可以调动肌肉和骨骼,实时获取信息。最后利用大脑来产生智慧,更好的服务五个潜在的付费方:保险、医院、医生、药企和患者。
五个潜在的付费方各自有不同的需求。首先,政府和医保面临着医保资金压力和控费要求。对于医院来说,主要诉求是提高临床业务效率和保障医疗安全。医生则面临着医疗质量和科研考评的双重压力。商业保险需要大量的数据来设计面向病人和医生的新险种。药企希望能降低研发和营销成本并增加销售额。最后,患者希望得到优质医疗服务。能否研发出满足某一类或某几类付费方需求的产品是公司在医院信息智能化过程中立足的根本。
特别值得一提的是商业保险公司,作为政策驱动中的重要力量,商保的发展值得密切关注。向商业保险收费的模式虽然在中国尚不普及,但在美国已是成熟的商业模式。随着商业保险逐渐进入社保和医生多点执业的放开,未来不仅会有支付方式和覆盖范围的改变,还会有根据人群特点精准定价的可能,新的对于医生执业的险种也会应运而生,而这一切的基础都是能够对医疗过程和结果有准确及时的掌握。
数据、规则、覆盖率是三大竞争壁垒
那么是不是说在这些力量的推动下,信息系统的覆盖率上去了,医疗数据就可用了呢?并不是。医院的医疗数据必须要去掉患者姓名等敏感信息,经过标准化和结构化之后才能用于统计分析,并且只有当数据量达到一定量级之后才有统计分析的意义,而目前医院的信息孤岛问题显着,严重制约了数据的利用价值。信息孤岛产生的主要原因是医院对病人数据安全性有所顾虑,另外,医疗体制的预算和支付制度、病种编码、收费代码、以及药品和耗材数据库标准不一,也为打通数据增加了难度。加上同一家医院内HMIS和CIS各模块常由不同厂商提供,模块间的数据整合也很困难。我们认为,医疗大数据的门槛主要体现在以下三点:
1)数据的开放性、数据结构化的深度。
即是否能将医院内大量分散的信息整合,再把这些以文本形式存在的信息准确地识别并拆分,并且赋予这些词、词组和数字以逻辑关系。这种全结构化的数据库由于覆盖信息面广,数据结构程度高,可以按照病人、政府、医院、保险和药企的不同需求提供更精准的信息,做到“指哪打哪”,从而更好地帮助政策制定、市场营销和医疗服务。
2)数据应用规则的共识性和可信性。
数据本身不直接带来价值,还是要看最终的应用场景。对于医学数据的应用来说,能否促动数据专家和医学专家参与到产品的设计中来,最终的产品不管是临床决策辅助系统还是医保控费系统,能否得到临床一线工作者和医药经济学家的认可,是区分产品优劣的关键点。有志于探索人工智能在医疗诊断方面应用的诸位英雄,除了团结一批临床工作者外,还需要在团队里配备人工智能的顶级专家。
3)达到一定的医院覆盖率,打通各级医院之间的孤岛。
单一医院的数据虽然有价值,但是由于它不能反应出一个个体连续的医疗记录,且样本量小(特别是对于不特别常见的疾病来说),往往不能作为决策参考二次利用,这时如能取得一定区域内多个医院的数据,不仅有“圈地”效应—医院替换掉现有的数据结构化应用是有成本的,还能扩大样本量,提升医疗数据变现的可能性。
医疗信息化未来想象空间巨大,玩家也不少。目前来看最难突破的是批量地铺设医院形成规模。我们认为比较有希望完成规模化的几种方式包括:通过帮助地方医保中心和商业保险机构做控费,以此倒逼医院应用其产品服务;从提高医院的医疗质量和帮助医生搞科研这样的刚需入手,促使医院采购其产品服务;以易结构化的化验单和病种(如肝炎慢性肾炎和康复)切入,在患者和医生之间形成互动,改善医疗资源的不合理分布,提高疗效和依从性。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09