京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代下医疗领域的五大突围方向
大数据概念的火热让不少人逐概念而行,更多的人依旧是一头雾水,没办法真正弄明白大数据到底是什么鬼,大数据到底有什么用?麦肯锡2011年发布的报告《大数据的下一个前沿:创新、竞争和生产力》中就看好5大应用领域,分别是欧洲公共领域、美国健康医疗、制造业、美国零售业以及基于地理位置的服务。其中,医疗健康领域,如何才能在大数据的助力下崛起?
在麦肯锡2011年发布的报告《大数据的下一个前沿:创新、竞争和生产力》中,它看好5大应用领域,分别是欧洲公共领域、美国健康医疗、制造业、美国零售业以及基于地理位置的服务。就现在回头来看,大数据的确是大玩了一把。 其中,影响最大的是零售业和基于地理位置的服务,因为这两个领域的用户以数字土著(那些出生于80年代末,90年代初这一批及其以后的年轻一代人)为主,所以传播也最快,数量级也就最大。相比之下,制造业、公共领域和健康医疗影响就没那么深了。据统计,数据分析体现的价值还不到5年前预估潜在价值的30%。也就是说,它们之间的差距在越拉越大。
数据分析在5大领域中实现的潜在价值占比(2011年)
此外,数据分析还创建了几大颠覆性创新模式。下面简述几种能打破既定产业格局、突破信息孤岛和创建新格局的新型数据集。如超大规模数字平台可实现实时交易,这对效率低下的商品市场是很有用的;精细化数据可用于个性化产品/服务的设计,尤其是医疗;而新的分析技术可以促进发现创新。综合来看,数据分析让循证决策更精准更高效。
所以在大数据商业探索的过程中,利益相关者们可能会从变化莫测的数据分析中迷失,不知所措。不过在医疗领域却又是另一番景象,因为法规会对此进行约束,从而产生阻碍。2011版报告预估,数据分析在医疗领域每年能够产生3000亿美元的潜在价值,年生产增长率为0.7%。但2011年只能实现10~20%,也即产生300~600亿美元的价值。原因有两个,一个是需要临床试验证明;再一个就是数据共享与互操作的实现还存在大量问题。
截至目前,美国健康医疗仅仅抓住了数据分析在医疗领域中10~20%的机会。还有一系列问题亟待解决,比如缺乏激励、机构改革困难、技术人才短缺、数据共享挑战和法规监管。
但也确实取得了一些成效,如临床上,最大的成功就是电子病历的采用,虽然目前看来其中的海量数据尚未完全挖掘出来。但支付方已经在逐步利用大数据来制定报销决策,因此数据分析在公共卫生监督方面将产生创新性效用。另外,许多制药企业也在将数据分析应用在研发上,尤其是在简化临床试验方面。但如果继续落后半拍,将会错失大量改革临床护理和个性化用药的机会。
数据分析实现个性化
数据分析可以从深层次将事物区别开来,最强大的功能之一就是基于人的特征给人群贴标签,由此向用户提供个性化的服务/产品,比如教育、旅游休闲、传媒、零售、广告等行业。
如果将这些与患者的行为、基因、分子数据连接起来,将会对医疗服务产生深远影响。基因组测序的成本下降,蛋白质组学的出现,以及实时监测技术的发展有可能产生出一种新的超精细化数据。
这些数据可以以两种方式重新定义健康医疗。第一个,它们可以帮助解决医疗系统的信息不对称和激励问题。这样在看到患者的一个病情完整数据图后,医院和其他医疗服务方就可能将焦点从治病转为预病及健康管理,从而节约巨额的医疗支出和改善生活质量。其次患者拥有精细化的数据就可以实现精准诊疗。制药企业和医疗设备公司也可借此提升药物研发效率。但是它们有一个挑战就是,要向更小范围的目标患者提供治疗方案。
海量信息突破信息孤岛
在产品创新上,数据分析在材料科学、合成生物学和生命科学领域产生了重大影响,比如药企巨头正在使用数据分析进行药物开发,从而确定药物化合物,作为一种治疗多种疾病的有效药物。如在2016年4月,阿斯利康与美国测序公司Human Longevity、英国桑格研究院以及芬兰分子医学研究所展开合作进行200万例全基因组测序,为今后的药物研发提供指导。而且,阿斯利康将从公司的临床试验中选取50万份样本用于全基因组测序。
根据协议,阿斯利康将要建立一个专门的基因组学研究中心,将临床样本的基因组测序数据和相关的临床治疗和药物反应信息有效整合。阿斯利康还计划公开发表此次合作项目中的所有研究结果。这种模式在推进科技和药物开发中非常有价值。
数据分析在医疗领域内的潜在机会
目前美国的现状是,医疗服务方才刚刚开始提高数据分析能力和改变护理患者的医疗方式。未来需要抓住数据分析在以下5个领域的潜在应用机会:临床,报销,研发,商业模式创新和公共卫生服务。
美国的医疗大数据产业正在崛起
我们强调的机会有五大类:临床、报销、研发、商业模式创新和公共卫生。在临床中,主要的成功就是电子病历的快速扩张,已经从2010年的15.6%提升到2014年的75%,这其中很大的推动来自平价医疗法案的实施。如Sutter Health,它的新EMR系统要比旧系统快40倍,而且在预测再住院率上准确率大大提高。
支付方也在逐步开始利用大数据制定报销决策,而且已经可以看到一些趋势。加上国家级医疗保险和医疗补助服务中心的动作,医疗价格的透明度已有所提高,同时超过30个州建立了所有保险索赔数据库以作为大型报销信息库。几家保险公司也因此盈利,比如联合健康集团的一个业务板块Optum就通过梳理处方药的索赔记录帮助雇主节约医疗支出。
对于制药企业来讲,算是取得了更大进展,许多公司应用数据分析助力研发。大多数制药企业在从动物试验到I期临床试验期间,使用预测模型来优化给药,但数据分析还没应用于后期的试验中,如各类药物临床试验入组和排除标准。此外在研发上的应用可以快速确定目标人群,从而节约时间,降低成本。如合同研究组织(Contract research organizations)比5年前应用更广泛,以前是使用统计工具改善临床试验管理,现在可以从数据中得出更多结论。一些领先的玩家一直在使用临床试验数据来给药物贴标签(也就是说,看药物有没有其他用途)。同时,FDA与医疗保险公司和电子病历提供商合作开展Sentinel Initiative项目,收集1.78亿患者的药品不良反应的数据。
在商业模式创新上也不断生根发芽,例如Explorys,一家可以查看4000万份美国患者病例的分析公司,在2015年4月被IBM收购,来加强其健康数据分析工作力度。
患者交流社区(如PatientsLikeMe)也是一个不错的数据源,它在公共卫生监测中的应用正在产生新的重要作用,如2014年爆发的埃博拉和齐卡病毒。
总之,想要整合数据分析,医疗领域还有很长的路要走。但同时,这个可能性要比5年前设想的大得多。我们不要心急,随着尖端技术的慢慢渗,整个医疗系统会随之革新。在将来,随着深入学习的进步,尤其是自然语言和视觉技术的发展,可能有助于医疗活动的自动化,节约劳动力成本。现在一家医院劳动力成本占了60-70%,这将是一个重要的商业机会。
那么,数据分析应用在医疗领域存在的问题又是什么呢?答案即为缺乏可以让数据实现交互性的操作。患者的生理数据常常存在于不同的系统中,各个系统不能便捷地实现无缝信息共享。
医疗领域的数据共享,存在很多抑制其进共享的因素。例如,服务方和制药企业可能不愿与支付方共享更多数据,因为数据可能会暴露企业的盈利模式。除此之外,在个人健康管理的过程中,收集数据的可穿戴暂时还没有显示出临床应用价值。同时,鉴于医疗健康行业的大环境和政府政策,导致数据的利用过程可能会比较缓慢。
不过虽然数据分析在医疗的应用存在一些抑制因素,但相比过去的诊疗方式,我们可以看到大数据在当今诊疗过程中的意义。传统意义上,诊疗依赖于病史、医学检验和实验室检查结果。如今,一系列新的数据表正在由用户的可穿戴和家庭健康设备(如血压监控仪或胰岛素泵)产生,这部分数据是有很大参考价值的。一些创新者正在试验,希望这些数据对于临床也可以起到直接有效的作用。
个性化的医疗服务
因每个人疾病史和基因构成的不同,所以标准化治疗方案根本不适合所有人。但是每个人的特征却对定制化的服务很有用。随着基因测序成本的下降、蛋白质组学(蛋白质分析)的出现,以及越来越多能够提供实时数据流的传感器、监视器和诊断技术的突破,患者的数据集将变得越来越精细。未来的创新技术(如免疫和CRISPR/Cas9 基因组定点编辑技术)可以最大限度地提高每个人的体格。先进的分析方法可以将标准化的疾病治疗转化为个性化的风险评估、诊断、治疗和监测。一些医疗服务方已经应用在工作中,临床发展潜力无限。如,美国中西部地区的一个医疗保健系统Essentia Health,就正在对充血性心力衰竭患者进行家庭监护,将30天再住院率降到2%,远低于全国25%的平均水平。
1、医疗的现状与未来
在医疗领域,个性化是基于患者的生物标志物、遗传情况和具体症状的数据来实现的。使用这些精细化数据,可以确定量身定制的个人治疗方案。除此之外,个性化医疗其实可以改变整个健康医疗大系统。
在世界上许多国家,尤其是美国,信息透明度的缺乏导致医疗健康系统机能失调。大多数患者的现状是,只有当他们已经患病时才会主动进入医疗机构接受诊疗。并且诊疗服务的重点也不是为了优化病人的体验或体现诊疗价值。导致这一现状的原因是个人健康数据一般是不会提供给患者本人的,所以他们不能及早发现并调整自身情况,只有当生病时才会去就医。这样看来,显然更好地利用数据可以帮助用户在没有生病前就了解到自身的健康风险所在,这也是对自己健康负责的关键所在。医疗保险公司也可以通过数据来了解他们的客户。通过敦促客户针对潜在的健康问题采取预防性措施,从而降低医疗保险费用支出。
在整个医疗健康系统中,当前状的态是:患者沿着一个统一化、标准化的治疗流程进行诊疗。什么是标准化的路径呢?
(1)患者只有在患病时才主动进入医疗健康系统;
(2)诊疗服务重点不是为了优化的病人的体验或体现诊疗价值;
(3)相同的疾病,医生会对所有患者均采取相同的临床指导方案,而这样的方案不一定适合每一个个体。
将数据分析用于医疗的未来状态应该是:医生对患者持续进行监测和给予个性化治疗方案,并在最佳时机完成健康干预。那么,未来诊疗的具体路径又是怎样的?
(1)持续性监测和风险评估;
(2)最大限度地提高诊疗服务的价值;
(3)针对每个个体提供个性化的治疗方案。
有机构预测,医疗领域在应用数据分析后,人均GDP将提高200美元,国家在医疗卫生领域的支出将减少5%~9%,人类的平均寿命将增1年。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26