京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据如何赋予医疗行业最大价值?
当在医院看医生的时候,我们信任医护人员的专业知识,相信他们会根据我们的情况以行之有效的科学方法做出处理,这被称为循证医学(EBM)。它的意思是,医生们开具的处方和选择的处理方式是在临床研究中已经被验证过,是正确的、可行的。
虽然“循证医学”这个词只能追溯到20世纪90年代初,但这一概念却是古时留下来的。对照临床试验早在20世纪40年代早期就已经进行过了,临床知识和专业知识也早已在医学杂志和教科书中被传播。(事实上,最古老的的医学杂志至今仍在运转中,The New England Journal of Medicine,成立于1812年,比首次临床试验更早,第一次临床试验在1747年进行的,是为水手们进行坏血病的治疗。)
临床试验和研究均针对疾病、健康和可以缓解症状或彻底消除疾病的治疗方法的研究,他们不断探索哪种治疗方法能有效的治疗哪些疾病,以及病人接受治疗后的效果。在世界各地,循证医学是医疗提供者所依照的准则。但是在大数据时代,这可能会被改变。
最初,小团体在测试新的治疗方法时会进行临床试验,以验证所用方法的治疗效果,并确定有何副作用。当一个临床试验有希望成功时,它就会被扩大到更多的人群中。一般进行此类实验时,会将新的方法独立于其他方法进行试验,将患者分成不同的组,每个组进行不同的治疗。此分配过程为随机分配,病人会随机分到不同的组中。
为了保障参与者的权利和提高试验的可靠性,临床试验必须符合严格的科学标准。然而,这并不是说就没有方法上的缺陷和风险存在,且在临床试验中,以小型群体为样本所得出的结果,并不能完全代表更广大的群体。而这正是大数据可以为医学提供助力的地方。通过挖掘世界上经过实践的临床资料,也就是目前所有的病人医疗记录:病人的实际情况、他被什么治疗手段治疗过、最后的效果如何,我们可以得到很多治疗病人的方法。
Apixio是一个人工智能计算机公司,总部位于加利福尼亚,它坚定的着眼于为患者者提供医疗服务,在实践研究基础上提供单独个性化定制服务。Apixio的首席执行官Darren Schulte解释道,“我们的系统可以从医学实践中学习更多的东西,通过计算处理来改进我们的临床护理方法。这其实更像一个‘医疗保健学习系统’。对于什么方法有用,什么方法没用,我们会从真实世界不断更新的数据中获得,如此会更加准确。”
80%有关患者的医疗和临床资料都是非结构化数据,如医师的书面笔记、咨询记录、放射科资料、病理分析结果以及从医院的出院记录等等。
Schulte医生在成为Apixio的CEO之前是任其首席医疗官,他说,“如果我们想学习如何更好的照顾病人,了解普遍人群的健康状况,我们需要从这些非结构化数据中找寻研究,才能得到不一样的结果。”
电子健康档案(EHR)存在已久,但它们是以不同的格式存在于不同的系统中,并不是直接为我们思考分析而设计的。所以,在Apixio分析如此多种类的数据之前,他们需要先从各种来源中提取数据(如家庭医生诊所、医院、政府的医疗记录等等)。然后,再将这些信息转换成计算机可以分析的格式。医生的笔记有很多不同的格式,一些为手写,一些事扫描的PDF文件,所以Apixio使用OCR(光学字符识别)技术来将这些创建成文本信息,以供电脑阅读理解。
达到个体分析水平的数据可以创建一个患者的数据模型,将大量人口的模型汇总后,就能较为准确的从更大范围中获得疾病的患病率和其治疗模式等。
Schulte解释道,“我们创建了一个‘病人对象(patient object)’,其本质上是使用从文本处理、文本挖掘和编码中挖掘出的数据,建立的医疗数据框架集合。通过创建这些个体资料,并将相似的个体资料分组,我们可以判断哪些方案能够对这个人有用,哪些没用,等等这些基础个性化医疗方面的问题。”
然而,如何让医疗保健提供者和健康保险共享出数据,是一个很大的挑战,Apixio通过确保获得数据后自身所能产出的价值,才克服这一困难,得到入口。正如Schulte所说,“除非你能解决目前的关键问题,这些组织才会给你提供访问真实数据的入口。”因此,重点是实际结果和能够解决问题,而不是炒作大数据概念。Schulte说,“医院的CIO们通常看不到很多正在被大数据解决的实际问题。他们看到的更多是无法为其提供帮助的,华而不实的仪表盘。而实际对他们有帮助的是解决现在存在的问题。”
另一个巨大的挑战是,你必须确保这些涉及到病人健康数据的资料是安全的,特别是在一些健康数据泄露事件被曝光之后。2014年,被盗医疗数据在所有被盗数据中所占比例高达43%,而医疗部门也意识到了自2010年起医疗被盗数据的大幅增加(远超过企业或政府部门)。Schulte指出,数据安全就相当于“赌注”,它是在医疗大数据领域进行相关动作的必备基础,“在订立每一个新合同之前,我们都必须向对方证明我们的安全性。”病人的数据必须在存储和传输过程中加密,Apixio从不公开个人健康信息(PHI),除非是由Apixio工作人员在绝对有需要时访问。
那么,实践证明医学是否能够代替循证医学,成为医疗保健行业的黄金准则?也许不会这样。但毫无疑问,我们即将有新的方式去了解、处理和预防疾病,这一点十分令人兴奋。正如Schulte所说,“从医疗保健的方式来看,我们正处于一个全新的世界,这种方式以数据洞察力为驱动,更加精准熟练。”融合了循证医学和实践医学的未来,医生可能有能力为病人提供最好的治疗结果,这正是所有的医疗专业人士期望来到的一天。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16在游戏行业“存量竞争”的当下,玩家留存率直接决定游戏的生命周期与商业价值。一款游戏即便拥有出色的画面与玩法,若无法精准识 ...
2026-01-16为配合CDA考试中心的 2025 版 CDA Level III 认证新大纲落地,CDA 网校正式推出新大纲更新后的第一套官方模拟题。该模拟题严格遵 ...
2026-01-16在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15在CDA(Certified Data Analyst)数据分析师的日常工作中,“高维数据处理”是高频痛点——比如用户画像包含“浏览次数、停留时 ...
2026-01-15在教育测量与评价领域,百分制考试成绩的分布规律是评估教学效果、优化命题设计的核心依据,而正态分布则是其中最具代表性的分布 ...
2026-01-15在用户从“接触产品”到“完成核心目标”的全链路中,流失是必然存在的——电商用户可能“浏览商品却未下单”,APP新用户可能“ ...
2026-01-14在产品增长的核心指标体系中,次日留存率是当之无愧的“入门级关键指标”——它直接反映用户对产品的首次体验反馈,是判断产品是 ...
2026-01-14在CDA(Certified Data Analyst)数据分析师的业务实操中,“分类预测”是高频核心需求——比如“预测用户是否会购买商品”“判 ...
2026-01-14在数字化时代,用户的每一次操作——无论是电商平台的“浏览-加购-下单”、APP的“登录-点击-留存”,还是金融产品的“注册-实名 ...
2026-01-13在数据驱动决策的时代,“数据质量决定分析价值”已成为行业共识。数据库、日志系统、第三方平台等渠道采集的原始数据,往往存在 ...
2026-01-13在CDA(Certified Data Analyst)数据分析师的核心能力体系中,“通过数据建立模型、实现预测与归因”是进阶关键——比如“预测 ...
2026-01-13在企业数字化转型过程中,业务模型与数据模型是两大核心支撑体系:业务模型承载“业务应该如何运转”的逻辑,数据模型解决“数据 ...
2026-01-12当前手游市场进入存量竞争时代,“拉新难、留存更难”成为行业普遍痛点。对于手游产品而言,用户留存率不仅直接决定产品的生命周 ...
2026-01-12在CDA(Certified Data Analyst)数据分析师的日常工作中,“挖掘变量间的关联关系”是高频核心需求——比如判断“用户停留时长 ...
2026-01-12在存量竞争时代,用户流失率直接影响企业的营收与市场竞争力。无论是电商、互联网服务还是金融行业,提前精准预测潜在流失用户, ...
2026-01-09在量化投资领域,多因子选股是主流的选股策略之一——其核心逻辑是通过挖掘影响股票未来收益的各类因子(如估值、成长、盈利、流 ...
2026-01-09在CDA(Certified Data Analyst)数据分析师的工作场景中,分类型变量的关联分析是高频需求——例如“用户性别与商品偏好是否相 ...
2026-01-09数据库中的历史数据,是企业运营过程中沉淀的核心资产——包含用户行为轨迹、业务交易记录、产品迭代日志、市场活动效果等多维度 ...
2026-01-08在电商行业竞争日趋激烈的当下,数据已成为驱动业务增长的核心引擎。电商公司的数据分析师,不仅是数据的“解读官”,更是业务的 ...
2026-01-08