京公网安备 11010802034615号
经营许可证编号:京B2-20210330
改善医疗卫生事业的关键—大数据
作为奥巴马政府大数据及发展计划的初始部分之一,美国医疗保险和医疗补助服务中心(Centers for Medicare & Medicaid Services,CMS)最近推出了其最新的虚拟研究数据中心(Virtual Research Data Center)。现在,研究人员不需要等到CMS给他们寄出加密文件,就可以直接在自己的电脑上远程访问、分析并操控中心的庞大数据集。新工具不但缩短了数据访问时间,还将研究成本降低了一半。
电子健康记录(electronic health records ,EHR),以及更好的计算能力,还有大量具备信息分析能力的专业人员,这些因素促使数据汇集起来。以往这些数据只能保存在纸面上,或者在各类封闭系统的“信息孤岛”中相互隔绝。由于各个领域出发点不同,所谓的“大数据”在概念上还没有统一。但大部分专家都认为,获取并分析大数据的能力是促进医疗卫生服务高效率和高质量的关键,同时对于缩短从研究到实践转化的时间成本也起着至关重要的作用。
菲利·普伯恩(Philip Bourne)博士,即将加入国家卫生研究院(National Institutes of Health ,NIH)成为其第一个数据科学研究终身副总监。他说,大数据概念反映了“真正数字企业”(real digital enterprise)的趋势,而这一趋势可以充分利用信息汇集的能力来实现。他将负责建立一个数据发现索引,以方便NIH研究人员相互之间数据的共享和访问。
乔纳森·西尔弗斯坦(Jonathan Silverstein),拥有医学博士和理学硕士学位,在芝加哥的北岸大学卫生系统负责领导生物医学研究信息中心。他说,大数据时代带来了很多显著的挑战,医疗卫生机构不但要有发掘价值信息的能力,还要在招聘那些稀缺的真正具备大数据处理能力的专业人员时应对来自Google和Facebook等公司的竞争。
“虽然这一切听起来挺酷,人类社会现在也有庞大的技术基础设施来实现这些。”西尔弗斯坦说,同时他还是芝加哥普利兹克医学院的外科教授,“那些‘炒作’是真的,我们确实可以做很伟大的事情,甚至是我们以前从没做过的,但是支撑这些美好愿景背后的事情却着实被低估了。”
北岸大学最近推出了一个叫做“What’s Going Around”的新工具,它可以通过分析电子健康记录(EHR)数据来针对疾病准确地做出地理信息峰值标定,如流感和百日咳。该系统可以实时地为医师提供数据服务,允许他们针对疾病预防措施提出更准确的医疗卫生建议。
该教学医院也是“未确诊高血压项目”的实施地。该项目使用专门开发的算法和基于血压读数的预测模型来识别带有未确诊高血压风险的患者。西尔弗斯坦说,该项目在提高诊断率方面获得了让人刮目相看的改进。
在北岸大学实现的这种数据驱动创新听起来像是理论空谈,但西尔弗斯坦说这些“不是幻想,确确实实地从数据中识别出了信息,而且这些信息可以立即用于影响临床决策”。
来自加州大学圣地亚哥分校研究事务办公室主管创新和产业联盟的助理副校长伯恩说,大数据的发展已经超过了公共访问的技术需求。“病人可以同时访问他们自己的健康记录和以往只有医生才能获得的信息。一切都改变了!”他说,“医疗卫生事业正向以病人为中心(patient-centric)的方式转变”。
与此同时,大数据时代抛出了一系列围绕隐私和安全的伦理政策问题。理查德·布克曼(Richard Bookman)博士说,他是迈阿密米勒大学医学院的项目发展和科学政策高级顾问。他解释道:“有个很大的问题在于,这是谁的数据?我们对于这场‘数据海啸’摧毁掉人类行为和文化堤岸的后果几乎一无所知。我们要平缓我们激动的心情,别忘记我们与病人的关系更多意义上是传统的道德和伦理问题……因为向病人提供的医疗护理工作是永远没法被数字化的。”
布克曼将生活在大数据时代定义为“一种反映,即将经验转化为比特的成本下降得如此之快,以至于我们可以越来越多地获得和体验我们以数字化方式存在的世界”。他说,目前非常明确的事情是,医学院校和教学医院必须考虑相关问题,而毕业医生则要知道如何利用大数据获得益处。
全美医疗信息技术协调办公室(ONC)的科技办公室主任兼首席科学官,Doug Fridsma博士(医学/哲学双博士)说,展望未来,电子健康记录(EHR)的角色决不仅仅是一种文件记录方式,它将成为医生手里与其他诊断手段同等重要的工具。尽管在应用大数据的能力上,医学界被认为已经落后于形势发展。但Fridsma博士相信,医疗卫生系统可以充分利用它们价值驱动的使命性特点来吸引从事数据分析的专家。他说,“毕竟,利用这种技术来造福人类的机会是一个很多其他产业所没有的优势。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25