京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代,美国医院评价带给中国什么启示_数据分析师考试
2015年7月21日,《美国新闻与世界报道》公布了美国2015-2016年最佳医院排名。紧随其后的7月22日,由中国医学科学院、中国研究型医院学会主办的现代化医院评价与评估高峰论坛举行,国家卫计委医疗管理服务指导中心主任赵明钢指出,中国将基于数据,科学、规范和准确地建立全国医疗机构的统一评价体系。
其实,《美国新闻与世界报道》对全美医院的评价排名已进行了十余年,类似的评价体系在美国还有很多,例如:消费者报告(Consumer Report)、医院安全指数(hospital safety score)等。与美国已经相对健全的医院评价体系相比,中国在此领域才刚刚起步。
本文将简单梳理中美在医院评价体系上的异同,并希望从中获得对大数据时代中国医院评价体系发展的启示。
数据至上
数据是医院评价的灵魂。如果去问一个美国医院评价者最重要的是什么,答案一定是数据。《小王子》中说:真正重要的往往是无法通过双眼直接看到的(L'essentielest invisible pour les yeux)。虽然医院的硬件条件可以反映一定的事实,但是更重要的信息往往埋藏在海量的医院运营与病历数据中。
在美国,联邦政府的CMS部门构建和维护庞大的数据库,用于跟踪每一笔医疗保险报销并监控其背后的医疗行为。美国医院协会和一些专业医疗机构也拥有大规模、跨地域的病历数据库。而这些客观的数据库就成为第三方评价的最主要信息来源。当然,这些数据库往往记载的是较为表层、未经处理(或经过简单处理)的原始医疗数据。第三方的评价功力,就体现在如何利用这些数据合理、客观地进行医院排名。
其中有一些指标较易取得或计算,如某些重点疾病的30天死亡率,显然与医院医疗质量和安全有着密切的关系。但有些指标,如住院期间发生的感染,手术之后出现的并发症等信息,则可能深深埋藏在数据(例如病程记录)之中,而这些信息对于真正关心医疗安全和质量的患者,以及真正希望医院管理能够精细化的管理者,有着极高的价值。
近年来,随着美国医院数据的全面电子化,数据量已经不再是问题的关键(相信中国在自上而下的医疗改革过程中很快也会如此),而数据挖掘的相关技术,才是医院评价的关键所在。试想,当面对上千万份电子病历,其中一大部分却都是运用医生式的语言来描述患者病情,那又如何能完整地呈现患者的就医经历,是否存在院内感染,检查是否恰当而不过度,疾病是否好转或治愈,以及出院后特定时间内是否再次入院?
在中国,虽然HIS和电子病历已在大医院中普及,但即使排除行政层面的重重限制,现阶段可供整合的数据仍十分有限。多数医院还是愿意使用传统的方法统计简单、表层运营数据,且仅局限于内部使用。
今年6月27日,国家卫计委医疗管理服务指导中心相关负责人透露,中国将建立一个基于国家医疗数据中心的医院综合评价体系。该体系包括基于病种对比的医疗服务能力分析和基于DRGs的医疗服务绩效分析两大部分,将充分运用大数据理念,依托国家医疗数据中心。
在具体操作中,医管中心将病案首页的第一诊断和疾病疑难危重的分级指数来作为分级,同级别病种比对包括时间消耗指数(平均住院日)、费用消耗指数(均次住院费用、费用结构)、医疗服务质量(住院死亡率),并将这三项内容综合比对医师医疗服务能力水平;而不同级别病种数量比对体现的是则是专科医疗服务能力水平,即大型医院的疑难病种到底有多少。
翟晓辉承认,做到上述这一切的前提是对国家医疗数据中心实行网格化管理,各成员单位及时准确地上报医疗数据。
虽然在规模与评价方式上还有较大的差距。笔者认为,随着对医院评价关注热度的不断提高,国内在规模上超越美国只是时间问题。然而,在优化评价方式方面,中国的路还很漫长。
下一步我们亟需考虑的是如何充分挖掘并整合大数据,将其纳入医院评价体系。使真正跟医疗质量相关的变量(如住院的感染、并发症、可以避免的二次住院),代替如今主宰评价体系的表层变量(住院时长等),真正用于医院质控。
医疗大数据的应用
下面将用几个当今大数据在医院评价领域的应用展示数据挖掘的重要意义。需要指出的是,这些应用只能展现大数据在医疗领域贡献的的冰山一角。还有无限的宝藏等待高手挖掘。
1.患者安全评价
一所医院的产出很大程度上取决于患者是否能够安全地在医院接受救治。所谓安全,可以表现在几个方面:首先,导致患者入院的疾病能够有效地被控制甚至治愈;其次,病人留院期间,不会因为医院的环境或治疗方式产生其他不必要的症状(如感染,术后并发症等)。但还没有明确的指标准确反应此类事件,所以需要我们使用适当的技术从海量的病人数据中发现此类现象。
通过对电子医疗数据的系统分析,数据提取与统计分析,我们可以知道一所医院是否经常导致某类病人的不必要感染。如果属实,是否是由于医院运营或某些医疗过程的操作不当导致。在美国,某所医院患者感染率居高不下,专家通过分析其原因得出病房格局设计不合理导致交叉感染的结论。
美国新闻与世界报道最佳医院排行自2013-2014年最佳医院排名中使用了6个患者安全性指标(PSI)。根据RTI的数据分析后增加了两个额外安全性指标,它们是AHRQ PSI 03和AHRQ PSI 08,分别代表了皮肤破裂(褥疮性溃疡)的发生率和术后髋部骨折的发生率。这将更加全面地反映医院的安全性。
2. 医院质控
医疗改革领域中的临床转型实际上就是在品质提升、风险管理、绩效考核和成本控制几者之间保持微妙的平衡。一旦将大数据技术应用于医院,我们便可以从一个新的高度分析医院的运营情况。目前英国NICE(国家卫生与临床技术优化研究所)、德国IQWIG(质量和效率医疗保健研究所)、加拿大普通药品检查机构等都开展了类似项目并且取得了初步成功。
谈到排名,也许很多医院都敬而远之,担心一旦名次较低会影响医院长期发展。然而,没有评价与竞争就无所谓优化与长远的发展。在和其他医院的比较中院方往往可以发现自身的不足。如果医院再入院率(readmission rate)居高不下,我们就需要反省,对某些病人的出院决定是否太草率了,又或许是病人出院后的用药指导不够明确。而无论如何,一旦能够发现问题并尝试解决,医院的发展只会蒸蒸日上。而数据的共享,无论对医院的科研还是运营,均有着战略性价值。
3. 患者寻医指导
不幸罹患疾病,病人总是想得到最好的医疗服务,这也导致了有些专家号被炒至几百甚至上千元。从全局考虑,如何让病人在合适的医院看合适的病是极为重要的。所谓合适,是指既不小题大做、浪费金钱及医疗资源,也不让大病患者无处就医、四处转院浪费宝贵的救治时间。面对这一难题,数据也许能给出让人满意的解决方案。
如果有一个如同美国HealthGrade或者Consumer Report一样具有公信力的第三方、综合性评价平台,通过对各地医院的现有病历的综合分析,患者就可以知道哪些医院有收治某类患者的资质以及治疗对应疾病平均的开支、安全情况等。综合比较后,病人便可以选择最合适的医院解决自身问题,避免疾病乱投医现象。同时,医院通过该数据也可以了解自身的优劣势,以便有针对性地进行改进。
评价体系三要素
考察任何一个评价体系,无非考虑三个因素:1. 评价机构(谁在评),2. 评价方式(如何评),3.社会影响(谁在看)。
现阶段,国内主要实行自上而下搭建医院评价体系,如国内应用最普遍的医院等级划分标准(三级十等)。最初医院评审分等标准包括医院的规模、技术水平、医疗设备、管理水平、医院质量等五个标准,但由于其他评审内容设置缺乏直观指标,如今容易量化的硬件标准(床位、科室设置、医疗设备、人员配备等)成为划分医院等级的决定因素,暂时未能考虑医院的综合医疗效果。
医院着重加强基础设施建设以期在短时间内达到突击效果,医疗质量和安全评价则未受到重视。严格来说,这并不是全面的医院排名。
而美国则流行官方集中数据,由第三方公司或组织进行多方位、多元化评价,更关注医疗产出以及患者满意度。近年来,国内也有一些非政府机构尝试进行国内医院排名。例如由复旦大学医院管理研究所组织、全国30个临床专科的几千位著名专家学者共同参与评审的"中国最佳医院排行榜"。
上述版本的医院排行榜分为专科声誉和科研学术两个部分。其中,医院专科声誉主要由专家提名心目中名列前茅的医院,而在科研学术方面,得分主要来自于国家级奖项和SCI影响因子(美国学术界极少使用SCI杂志作为判别标准,但笔者认为,影响因子较论文数量是个更为重要的指标,此处没有使用SCI论文数量是个较大的进步)。
与中国官方的医院评级系统不同的是,美国官方对医院更多只做分类(床位多少,所有权等)而不做评级。对医院的评价由各个营利性公司或非营利机构来做,有别于国内对硬件配置的重视,美国医院把提高医疗质量及患者满意度作为最终目标。
现今美国主流医院评价平台包括:消费者报告(Consumer Report),Healthgrade,hospital advisory board,医院安全指数 hospital safety score,Joint Commission,美国新闻与世界报道(US News &Report)等。其中多数都是涵盖了上千家医院的大规模评价体系,按年更新甚至按季度更新,具有相对成熟的用户搜索界面和极大的用户访问量。以《美国新闻与世界报道》的医院排名为例,覆盖美国近5000家医院,调查14万左右的医师,为16个医疗领域的137家医院排名。该排名对医院声誉、患者存活率、患者安全性及其他医疗相关指标在内的数十项评价指标进行综合排序。
国内的评价体系正在向美国看齐。
对于最后一个问题:排行榜是给谁看的?美国的评分者认为理所当然地是给患者看!医院排名的宗旨就是让患者选择合适的医院、医师。这也是为什么第三方选取的众多评价标准中多数是关于患者安全、医疗质量及就医满意度的,而这些指标正是一个排行榜见功力、需要大量数据分析支撑的地方。
中国的排名处在萌芽期,技术水平不成熟,只选择了专科声誉和学术文章这两个指标,虽然前者主观性较强,受固有观念和历史影响,有一定滞后性,缺乏详细量化标准,后者和临床服务质量也并不完全呈正相关,但至少作为一次有益的尝试,对医院管理、国家政策制定均有辅助作用,对患者寻医就诊也有指导意义。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15