京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代,美国医院评价带给中国什么启示_数据分析师考试
2015年7月21日,《美国新闻与世界报道》公布了美国2015-2016年最佳医院排名。紧随其后的7月22日,由中国医学科学院、中国研究型医院学会主办的现代化医院评价与评估高峰论坛举行,国家卫计委医疗管理服务指导中心主任赵明钢指出,中国将基于数据,科学、规范和准确地建立全国医疗机构的统一评价体系。
其实,《美国新闻与世界报道》对全美医院的评价排名已进行了十余年,类似的评价体系在美国还有很多,例如:消费者报告(Consumer Report)、医院安全指数(hospital safety score)等。与美国已经相对健全的医院评价体系相比,中国在此领域才刚刚起步。
本文将简单梳理中美在医院评价体系上的异同,并希望从中获得对大数据时代中国医院评价体系发展的启示。
数据至上
数据是医院评价的灵魂。如果去问一个美国医院评价者最重要的是什么,答案一定是数据。《小王子》中说:真正重要的往往是无法通过双眼直接看到的(L'essentielest invisible pour les yeux)。虽然医院的硬件条件可以反映一定的事实,但是更重要的信息往往埋藏在海量的医院运营与病历数据中。
在美国,联邦政府的CMS部门构建和维护庞大的数据库,用于跟踪每一笔医疗保险报销并监控其背后的医疗行为。美国医院协会和一些专业医疗机构也拥有大规模、跨地域的病历数据库。而这些客观的数据库就成为第三方评价的最主要信息来源。当然,这些数据库往往记载的是较为表层、未经处理(或经过简单处理)的原始医疗数据。第三方的评价功力,就体现在如何利用这些数据合理、客观地进行医院排名。
其中有一些指标较易取得或计算,如某些重点疾病的30天死亡率,显然与医院医疗质量和安全有着密切的关系。但有些指标,如住院期间发生的感染,手术之后出现的并发症等信息,则可能深深埋藏在数据(例如病程记录)之中,而这些信息对于真正关心医疗安全和质量的患者,以及真正希望医院管理能够精细化的管理者,有着极高的价值。
近年来,随着美国医院数据的全面电子化,数据量已经不再是问题的关键(相信中国在自上而下的医疗改革过程中很快也会如此),而数据挖掘的相关技术,才是医院评价的关键所在。试想,当面对上千万份电子病历,其中一大部分却都是运用医生式的语言来描述患者病情,那又如何能完整地呈现患者的就医经历,是否存在院内感染,检查是否恰当而不过度,疾病是否好转或治愈,以及出院后特定时间内是否再次入院?
在中国,虽然HIS和电子病历已在大医院中普及,但即使排除行政层面的重重限制,现阶段可供整合的数据仍十分有限。多数医院还是愿意使用传统的方法统计简单、表层运营数据,且仅局限于内部使用。
今年6月27日,国家卫计委医疗管理服务指导中心相关负责人透露,中国将建立一个基于国家医疗数据中心的医院综合评价体系。该体系包括基于病种对比的医疗服务能力分析和基于DRGs的医疗服务绩效分析两大部分,将充分运用大数据理念,依托国家医疗数据中心。
在具体操作中,医管中心将病案首页的第一诊断和疾病疑难危重的分级指数来作为分级,同级别病种比对包括时间消耗指数(平均住院日)、费用消耗指数(均次住院费用、费用结构)、医疗服务质量(住院死亡率),并将这三项内容综合比对医师医疗服务能力水平;而不同级别病种数量比对体现的是则是专科医疗服务能力水平,即大型医院的疑难病种到底有多少。
翟晓辉承认,做到上述这一切的前提是对国家医疗数据中心实行网格化管理,各成员单位及时准确地上报医疗数据。
虽然在规模与评价方式上还有较大的差距。笔者认为,随着对医院评价关注热度的不断提高,国内在规模上超越美国只是时间问题。然而,在优化评价方式方面,中国的路还很漫长。
下一步我们亟需考虑的是如何充分挖掘并整合大数据,将其纳入医院评价体系。使真正跟医疗质量相关的变量(如住院的感染、并发症、可以避免的二次住院),代替如今主宰评价体系的表层变量(住院时长等),真正用于医院质控。
医疗大数据的应用
下面将用几个当今大数据在医院评价领域的应用展示数据挖掘的重要意义。需要指出的是,这些应用只能展现大数据在医疗领域贡献的的冰山一角。还有无限的宝藏等待高手挖掘。
1.患者安全评价
一所医院的产出很大程度上取决于患者是否能够安全地在医院接受救治。所谓安全,可以表现在几个方面:首先,导致患者入院的疾病能够有效地被控制甚至治愈;其次,病人留院期间,不会因为医院的环境或治疗方式产生其他不必要的症状(如感染,术后并发症等)。但还没有明确的指标准确反应此类事件,所以需要我们使用适当的技术从海量的病人数据中发现此类现象。
通过对电子医疗数据的系统分析,数据提取与统计分析,我们可以知道一所医院是否经常导致某类病人的不必要感染。如果属实,是否是由于医院运营或某些医疗过程的操作不当导致。在美国,某所医院患者感染率居高不下,专家通过分析其原因得出病房格局设计不合理导致交叉感染的结论。
美国新闻与世界报道最佳医院排行自2013-2014年最佳医院排名中使用了6个患者安全性指标(PSI)。根据RTI的数据分析后增加了两个额外安全性指标,它们是AHRQ PSI 03和AHRQ PSI 08,分别代表了皮肤破裂(褥疮性溃疡)的发生率和术后髋部骨折的发生率。这将更加全面地反映医院的安全性。
2. 医院质控
医疗改革领域中的临床转型实际上就是在品质提升、风险管理、绩效考核和成本控制几者之间保持微妙的平衡。一旦将大数据技术应用于医院,我们便可以从一个新的高度分析医院的运营情况。目前英国NICE(国家卫生与临床技术优化研究所)、德国IQWIG(质量和效率医疗保健研究所)、加拿大普通药品检查机构等都开展了类似项目并且取得了初步成功。
谈到排名,也许很多医院都敬而远之,担心一旦名次较低会影响医院长期发展。然而,没有评价与竞争就无所谓优化与长远的发展。在和其他医院的比较中院方往往可以发现自身的不足。如果医院再入院率(readmission rate)居高不下,我们就需要反省,对某些病人的出院决定是否太草率了,又或许是病人出院后的用药指导不够明确。而无论如何,一旦能够发现问题并尝试解决,医院的发展只会蒸蒸日上。而数据的共享,无论对医院的科研还是运营,均有着战略性价值。
3. 患者寻医指导
不幸罹患疾病,病人总是想得到最好的医疗服务,这也导致了有些专家号被炒至几百甚至上千元。从全局考虑,如何让病人在合适的医院看合适的病是极为重要的。所谓合适,是指既不小题大做、浪费金钱及医疗资源,也不让大病患者无处就医、四处转院浪费宝贵的救治时间。面对这一难题,数据也许能给出让人满意的解决方案。
如果有一个如同美国HealthGrade或者Consumer Report一样具有公信力的第三方、综合性评价平台,通过对各地医院的现有病历的综合分析,患者就可以知道哪些医院有收治某类患者的资质以及治疗对应疾病平均的开支、安全情况等。综合比较后,病人便可以选择最合适的医院解决自身问题,避免疾病乱投医现象。同时,医院通过该数据也可以了解自身的优劣势,以便有针对性地进行改进。
评价体系三要素
考察任何一个评价体系,无非考虑三个因素:1. 评价机构(谁在评),2. 评价方式(如何评),3.社会影响(谁在看)。
现阶段,国内主要实行自上而下搭建医院评价体系,如国内应用最普遍的医院等级划分标准(三级十等)。最初医院评审分等标准包括医院的规模、技术水平、医疗设备、管理水平、医院质量等五个标准,但由于其他评审内容设置缺乏直观指标,如今容易量化的硬件标准(床位、科室设置、医疗设备、人员配备等)成为划分医院等级的决定因素,暂时未能考虑医院的综合医疗效果。
医院着重加强基础设施建设以期在短时间内达到突击效果,医疗质量和安全评价则未受到重视。严格来说,这并不是全面的医院排名。
而美国则流行官方集中数据,由第三方公司或组织进行多方位、多元化评价,更关注医疗产出以及患者满意度。近年来,国内也有一些非政府机构尝试进行国内医院排名。例如由复旦大学医院管理研究所组织、全国30个临床专科的几千位著名专家学者共同参与评审的"中国最佳医院排行榜"。
上述版本的医院排行榜分为专科声誉和科研学术两个部分。其中,医院专科声誉主要由专家提名心目中名列前茅的医院,而在科研学术方面,得分主要来自于国家级奖项和SCI影响因子(美国学术界极少使用SCI杂志作为判别标准,但笔者认为,影响因子较论文数量是个更为重要的指标,此处没有使用SCI论文数量是个较大的进步)。
与中国官方的医院评级系统不同的是,美国官方对医院更多只做分类(床位多少,所有权等)而不做评级。对医院的评价由各个营利性公司或非营利机构来做,有别于国内对硬件配置的重视,美国医院把提高医疗质量及患者满意度作为最终目标。
现今美国主流医院评价平台包括:消费者报告(Consumer Report),Healthgrade,hospital advisory board,医院安全指数 hospital safety score,Joint Commission,美国新闻与世界报道(US News &Report)等。其中多数都是涵盖了上千家医院的大规模评价体系,按年更新甚至按季度更新,具有相对成熟的用户搜索界面和极大的用户访问量。以《美国新闻与世界报道》的医院排名为例,覆盖美国近5000家医院,调查14万左右的医师,为16个医疗领域的137家医院排名。该排名对医院声誉、患者存活率、患者安全性及其他医疗相关指标在内的数十项评价指标进行综合排序。
国内的评价体系正在向美国看齐。
对于最后一个问题:排行榜是给谁看的?美国的评分者认为理所当然地是给患者看!医院排名的宗旨就是让患者选择合适的医院、医师。这也是为什么第三方选取的众多评价标准中多数是关于患者安全、医疗质量及就医满意度的,而这些指标正是一个排行榜见功力、需要大量数据分析支撑的地方。
中国的排名处在萌芽期,技术水平不成熟,只选择了专科声誉和学术文章这两个指标,虽然前者主观性较强,受固有观念和历史影响,有一定滞后性,缺乏详细量化标准,后者和临床服务质量也并不完全呈正相关,但至少作为一次有益的尝试,对医院管理、国家政策制定均有辅助作用,对患者寻医就诊也有指导意义。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21