
医疗大数据能兑现承诺吗_数据分析师培训
如果说哪个行业从分析大量不同来源的数据中受益,那一定是医疗。在电子病历系统、图片系统、电子处方软件、医疗索赔、公共卫生报告、新兴的健康应用、移动医疗设备及医疗产业中,充满了等待被使用的数据。
对于一个急于寻找方法来降低成本、提高效率并提供更好治疗的行业来说,分析这些数据是意义深远的。成效一定会有,但从不同的、专有的系统中获得数据,却是一个繁琐的过程,对于一个公司来说,相当于不可能。
数据就是数据,无论它来自哪里
总体说来,大多数医疗机构的数据来自临床、财务、操作的应用程序。就其本身而言,iHT2在《分析:高科技医疗的神经系统》报告中说,每个类型的数据都有一个特殊的用处。临床数据能提高医疗质量,使人口健康管理变得简单;财务数据帮助医院对盈亏底线做成本分析;而操作数据能帮助设备管理和资源利用。
把这些都综合在一起,就可以开始解决类似满足员工需求、提高工作效率和护理质量等大问题。这也是Laura Madsen在Lancet开展的商业智能医疗中提出,没有必要把不同类型的数据资源区分开的原因。
“数据就是数据,”她说,“最终,数据就只是位与字节,如果我们是好的数据专家,我们应该将临床数据和商业数据整合在一起。”
政府的项目,授权——给医疗增加了很大的压力,然而也给了医疗机构一个认真看待数据分析的理由。如果采用了HER系统,将ACO模型与病患治疗相结合,以病患为中心的医疗机构的理念,不断强调提高医疗质量,政府项目就会给予一定的经济补贴,但这都需要一个更复杂的医疗数据分析方法。
大量无结构化的医疗数据让数据分析变得困难
当然,医疗机构在没有收集数据的前提下无法进行数据分析。iHT2表示,在医疗机构中,有些因素使分析变得复杂。80%以上的医疗数据都是无结构的,无论纸质还是其他形式的都需要手动提取数据,甚至是结构数据——例如来自于HIE的——也经常无法分析。iHT2指出,这样的结果就是医疗机构最终使用来自保险公司的数据来对自己的机构有了更多的认识。
Madsen在书中写道,“谈到医疗商业智能化,医疗机构的规模是很重要的,”美国最大的医疗机构Intermountain Healthcare和Kaiser Permanente,已经实施商业智能化的医疗很久了,但对于小型医疗机构,难度还是很大的。Madsen表示,大部分的医疗机构都看到了商业智能的价值,但他们一直想不清一个问题——“我们该做些什么呢”。
大多数选择商业智能的机构都是看重它适用于管理报告的需求。这对于医院每年要向政府机构提供一千份以上的报告很有意义。Madsen说,尽管有如此明显的需要,但医疗机构通常不知道接下来该怎么做,也不知道如何把报告中的数据使用好,来提高实际操作的效率或者是做出其他的改进。
还好,IHT2报告提出了建议。如对病人的健康需求做一个评估,可帮助医疗机构合理改进服务,同样也能认识每个人的健康差异,甚至能预测哪个病患的病情会变的更严重。另外,评估也能帮助推进高质量项目,更能发现造成医疗变化的原因。
值得注意的是,有些模型并不起效。在医疗共享储蓄计划和ACO模型中,目标就是能积累储蓄,最终使医疗成本降低。所以,根据iHT2的说法,收入周期管理工具并不起效。
另外,如今的成本计算系统并不能完整计算出医疗机构的总成本,它需要考虑到早期医院的一次解雇能为一个短期设备存到足够的钱,但对于另一个长期医疗设备,它失去了收入的机会。iHT2说,弄清楚医疗机构的总成本,需要一个“针对捆绑支付、复杂的、分阶段的会计记账系统”。
医疗采用数据分析能精确的找出它在哪里
不是所有的医疗分析系统都需要变得复杂。在美国亚拉巴马州Springhill Memorial手机医院,最近由Pandora Clinicals更新的自动药剂橱柜系统,这是一个分析数据包,来帮助减少麻醉药的失窃。
这个软件来自Omnicell,能追踪到是谁及什么时候拿了医药橱中的麻醉药。一个月一次的报告,帮助医院管理者查出谁拿了比其他病患更多的药。药剂师Joe Adkins说,这可能意味着医院员工将麻醉药拿走作为销售或私用——或者也意味着护士或药剂师对病患的疼痛预先做了处理。他说,这个软件是独立的,它能帮助医院人员在他人察觉之前发现问题。
更好的是,从Pandora Clinicals获得数据对整个工作流程没有太大影响,Adkins补充道。报告会自动以邮件形式发送,与冗长的报告不同,它使用的是条形图。简单地说,不需要很多的数据操作和计算,一目了然,不需要花太多时间去计算思考。
InsightsOne预测分析公司市场副总裁Bob Dutcher说,对于医疗机构而言,完善服务的目的就是要提高患者的满意度。
在2012年的一个试点中,公司和IBC合作帮助费城的医疗机构了解影响患者满意度的问题,并将这些问题解决——三个月前,这些问题可能还存在,Dutcher说。这家公司也帮IBC找到了潜在新客户,以及能从他们没有使用的服务中获益的老顾客。
为此,IBC从客服中心找到数据,看看哪些病患总频繁问询,这样就可以对他们有额外的关注。IBC也找到了医疗组织成员的数据,看看哪些就医流程是最容易被病人问询的,以及为什么个别病人需要特别治疗。这些分析可以让IBC警觉“高几率出现负面结果”的患者,可能会让保险公司发出提前预防的信息(避免在同样的条件下重复治疗),或者长期的家庭健康服务(如果即将到来的手术需要一个长期恢复)。
Dutcher说,这样一项预防措施的改进,节省了医疗机构在不必要的、重复的治疗中的花销。
分析需要人才和数据库,这两样都是很短缺的
IDC Health Insights的可靠地医疗IT策略项目研究者Cynthia Burghard说,让保险公司在先进的分析上花钱,比起让医疗机构来投资简单得多。
但有两个重要的原因让医疗机构也会在不久后采用先进的数据分析。其中一个原因是,如果患者的医生推荐的方案和其健康计划相反时,患者就更愿意选择保险公司的平安计划。
另一个是20世纪90年代的医疗改革大部分都以失败告终,主要是因为缺少数据。“不仅是可能的信息很少,另外数据也是陈旧的,对医生了解患者的现状以及和预期达到的状态相比,几乎没用。”在最近的报告中,Burghard表示,数据分析能产生可靠的医疗投资,大多数争论是医疗提供者和病患间对于数据准确性和及时性的异议。
新兴的ACO模型,将医疗改革从医疗费模式的行业变成一个集中且协调的护理,强调分析和数据库科技。而需求就是找出能从特殊医疗项目中获益的患者,为了管理和改进他们的治疗找一些患者加入,以及把干预治疗整合成为医生的工作流程。Burghard说,当ACO模型和协调护理扩大,机构就会发现急需检测无结构数据,情绪分析以及其他数据源——包括猜想,预测智能,和混合的临床和商业智能—这都来自患者所遇到的,和临床系统的内容。
如此先进的分析法呈现出了挑战,Burghard说,医疗机构“需要人手来管理数据库,并利用好他们所投资的数据库。”那些既不用数据库又不用员工来管理他们的机构,可能最后会发现,他们要被迫加入更大的整合服务网络。
毫无疑问,这会破坏这个产业,但最终,拥有更多的数据并能够使用它,也会改进这个行业。“‘你不能掌控你无法预测的事情’,可以在医疗中适用,”Burghard报告中写道,“在20世纪90年代,医疗组织对慢性病病人的配合度管理上缺少认识;如今,医疗行业有了较多的信息,并运用科技在医生、患者之间分享数据来改进成果。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11