
如何解决医疗数据分析的难题?
一提到数据分析能力,医疗行业在某种程度上是落后于其他行业的。造成如此窘境的一大原因是要从电子健康记录(EHR)中提取数据非常困难,它采用的是私有数据的存储方式并且缺乏数据共享功能。但是医疗机构已经开发出解决这些问题的曲线措施,并且这些努力正在奏效。
CrescentCare是一家美国医疗机构,专门治疗HIV和AIDS病患。它的数据分析能力取得重大的突破,得益于能够获取EHR底层的数据模式(data schema)。
Seema Gai是CrescentCare的CIO。她介绍,由Aprima医疗软件公司提供的EHR系统带有一些预装包,可以进行医疗数据分析,但是功能相当有限。Gai想要更为强大的功能。Gai说,大多数EHR供应商不会轻易给客户提他们的数据模式信息,但是CrescentCare与Aprima协同工作,获取了数据模式文档。Gai发现,此系统基本上建立在SQL数据库之上,没有什么纷繁复杂的东西。现在,Gai和她的团队可以在此数据存储的上层加入更为复杂的分析应用。
“我们大部分的日常工作会生成大量数据,”Gai说,“能够访问数据模式,就可以让我们能够访问所需的数据。”
医疗数据分析风险分级
出于临床分析的目的,CrescentCare将目光转向了SAS的Visual Analytics软件。使用该软件的主要目的之一就是根据病患的健康风险对他们进行划分。
Gai的团队已经用此工具建立了一套自动报告系统,它可以通过观察过去的实验室结果、生命体征和其他信息来分析病患记录,并且可以为临床医生创建日常报告,提醒哪些病人的并发症风险较高。这些信息可以帮助医生了解到哪些病人需要在探视后加以跟进,哪些需要部署更为严密的治疗计划,如此一来就可以让他们对潜在的问题时刻保持警惕。
“我们正努力辨别这些高风险病患,”Gai说,“除了正确的技能,还需要有正确的工具。”
CrescentCare通过获得EHR系统的数据模式,能够在病患数据上进行更有意义的分析。但这并不是所有供应商都可以提供的。CrescentCare所拥有的一项优势就是,它所有的办公机构都是基于一套单独的EHR实现标准化。这在所有医疗系统中并非是普遍存在的。如今,很多医疗系统是一个聚集有众多医院和医生的办公机构,其中很多都使用的是自己的EHR系统。对于大多数医疗供应商来说,要为他们所维护的每个EHR系统建立数据存储和分析应用程序间的自定义链接会非常耗费精力。这也是为什么数据平台和集成工具越来越受欢迎的原因。
更为统一的医疗数据分析方法
Tina Esposito现在就职于一家美国中部的Advocate 医疗看护机构,担任健康信息服务中心的副总裁。该机构下属医院一共有12家。她说,在今年之前健康系统分析上的工作大部分都是一次性项目。临床医生或分析人员如何使用数据,没有统一的方法,而且每个项目收集数据的工作都要从零开始收集。
“我们并没有真正地将所有的点连接起来,全局性了解我们是如何提供护理的,”Esposito说,“我们需要更效的方式帮助我们了解数据。”
今年,该医疗机构引进了一套数据平台,叫做HealtheIntent,由Cerner 公司提供。它可以把来自多个数据源的数据放入一个云存储中,分析人员在此利用分析应用进行分析。例如,他们现在能够根据某些病患的特点来分析病患记录,从而做出最成功的过渡护理计划。将病患从一个护理环境转移到别处,如从住院处转到家庭护理,这通常会引起并发症。如何确定最为有效的策略,是很多医院亟需考虑的重中之重。
Esposito说,没有共同的数据存储,Advocate是无法开发出连贯的分析方法。不过,她也提醒道,仅仅是实施这类工具,并不能解决所有的问题。她的团队仍然需要花费大量时间来确保连接器正常工作。EHR系统仍然以专有格式来记录数据并且使用独特的数据库系统。在此设置改变之前,供应商会尽其所能来寻找一切可以找到的修复手段。“这并不是最终解决办法,而是寻找最终解决办法的过程。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15