
大数据如何改变医疗保健
如果你想知道大数据是如何使世界变得更加美好,那么最鲜活的例子可能就是它在医疗保健行业之中的应用了。我们的一切行为产生了大量的数据,同时我们数据分析师能够使用技术来分析和理解这些数据。在过去的十年中这种分析和理解的行为已经取得了巨大的进步。用现在的时髦话来说,这些趋势的交集就是我们所说的“大数据”。大数据正在使各行各业的企业变得更加高效。
医疗保健领域也是如此。在医学领域中,大数据除了被用于提高利润和减少开销,还被用于预测流行病、治疗疾病、提高生活质量和避免可预防的死亡。随着世界人口的增长以及人均寿命的延长,治疗交付的模式正在迅速改变,而这些变化背后的众多决定都是由数据驱动的。
现在这种驱动是了解尽量和尽快地了解病人,以期在早期发现疾病的征兆。相比由于没有发现病情征兆而直到为时已晚,对疾病早期的治疗更为简单,也更为便宜。
所以在我们生病之前让我们来一场医疗保健的大数据之旅,从头开始。
可穿戴的血压监测器将数据发送到一个智能手机应用程序,然后人们再去看医生(照片来自John Tlumachi)
智能手机仅仅只是开始。应用程序能够使智能手机应用在任何方面,例如通过计步器测量一个人一天走多远,通过卡路里计数器帮助个人规划饮食等。如今大家都很喜欢使用移动技术来使自己过一种更健康的生活方式。例如,最近涌现的可穿戴设备,比如Fitbit,Jawbone和 Samsung Gear Fit,允许追踪个人行程并将数据上传,同周围其他人进行比较。在不久的将来,人们也可以和医生分享这些数据。当生病去找医生时,他们会把这些数据作为诊断内容的一部分。哪怕是你很健康,但通过这项技术,医院不断地累计大量的公众健康状况的信息数据库,使得个人健康问题在发生之前被发现,从而可以提前准备好补救措施——不管是药用或者教育性的。
由此产生了开创性的工作。这包括医疗和数据专家之间相互合作,进而使得有洞察未来以及超前识别问题变得可能。最近的例子就是匹兹堡健康数据联盟的形成。它旨在把来自不同数据源的数据(如医疗和保险记录、可穿戴传感器数据、基因数据,甚至社交媒体使用的数据) 绘制成作为病人个体的数据集合体,从而为病人量身定制医疗保健方案。
数据分析师对个人数据不会被独立处理,而是将会同周围成千上万的人的数据进行对比和分析,以此突显在对比过程中出现的特殊因素和问题,从而使得复杂的预测模型有了可用之处——一个医生将能评估任何一个他认为可预测的治疗方案的可能性结果,备份其他有相同情况、相同遗传因素和生活方式的人的数据。诸如这样的项目是该行业在追求数据驱动型医疗保健中试图解决的最大障碍之一:医疗行业收集大量的数据,但这些数据往往储存在在不同的医院、诊所、行政部门,甚至医生手中。
另一个例子是刚刚宣布合作的苹果和IBM。这两家公司正在一个大数据健康平台相互协作,这个平台允许使用苹果手机和苹果智能手表用户将数据分享给IBM的华生健康云医疗分析服务。该项合作的目的是从数以百万计的潜在用户的众多实时活动和生物数据寻找新的医学发现。
如果留心观察医患之间的互动,这些行为将来很可能有所改变。远程医疗是目前的流行语,指的是远程接受医学治疗。患者通常可以在电脑和互联网的帮助下在自己家里进行。严格来说,远程医疗即是访问webmd网站和自我诊断。但越来越多的远程医疗是指针对患者提供一对一的专业服务。目前这一类的服务由Healthtap公司提供。患者和医生之间的所有互动无疑会留下一个数据链,这些数据可以在被分析后汇集成公共健康的总趋势,并为人们的医疗保健提供有价值的信息。
如果医生告诉你,不管你哪里不舒服,最佳的治疗方法就是用药,那么他们给你提供的药丸或试剂很可能都是在大数据帮助下而制定的。根据从受试者获得的大量数据,研究人员得以选择最佳的治疗方案。最近,制药巨头们之间的数据共享已经取得了一些突破性进展。比如,他们发现了常用抗抑郁剂地昔帕明在肺癌治疗领域存在着潜在的用途。
个性化医疗是医疗保健领域的又一热门话题,它是根据每个人独一无二的遗传结构来规划用药,并将个人的基因蓝图和数据整合到他们的生活和所处的环境中,然后将这些数据与其他成千上万的人进行比较,从而诊断疾病并确定最佳治疗方案。
大数据也有助于抗击流行病的蔓延。在非洲,移动电话的定位数据为追踪人口流动提供了非常有价值的信息,它有助于人们预测埃博拉病毒的蔓延趋势。这就为政府建立治疗中心的提供了潜在的最优方案。并且在必要时能够对人群的活动范围进行限制。这些策略是人们在2010年海地地震后才意识到的,当时他们只采取了简单的灾难救援计划。
当然,人们在寻找医学上“包治百病的圣杯”——能够医治癌症的药时就提出了利用大数据的解决方案。Flatiron Health公司已经打造了一种名叫“肿瘤学云平台(OncologyCloud)”的服务。基于该设想,关于癌症患者潜数据,尚有96%未被分析。这个服务的目的是在诊断和治疗过程中收集这类数据,并将其提供给临床医生做进一步研究。
个人医疗数据无疑是在所有数据中最具有私密性的,因此必须要保证安全无误的保障措施,以确保这些信息只流向应该获得该信息的人。尽管如此,网络上的黑客们也会偷取医疗数据,因为有报道称,偷来的健康数据要比偷来的信用卡信息更值钱。2015年2月发生了一起迄今为止最大规模的医疗数据盗窃案,美国第二大的医疗保险服务商Anthem公司信息系统被黑客攻破,8000万患者的资料被盗。幸运的是,黑客们只偷走了客户的身份信息,如姓名和地址,而患者相关的疾病和治疗细节都没有暴露。但是公众十分担心大规模的病人记录丢失案的发生在黑客找到安全漏洞之前只是时间问题。包括美国南卡罗来纳大学身体计算中心的Leslie Saxon博士在内的许多专家已经在呼吁建立一个效仿联合国形式的国际组织,来规范涉及健康数据的有关隐私和安全的问题。
尽管如此,未来的大数据可以带来的潜在好处却远比坏处要多。医疗数据的中心化和焦点化将是未来的趋势。同时,只要隐私和安全的问题可以解决,中心化一定能够在开发全新的治疗手段上扮演极为重要的角色。此外,中心化还有助于我们了解自身身体机能,从而确保我们能够长时间地进行工作。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30