京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据如何赋予医疗行业最大价值?
当在医院看医生的时候,我们信任医护人员的专业知识,相信他们会根据我们的情况以行之有效的科学方法做出处理,这被称为循证医学(EBM)。它的意思是,医生们开具的处方和选择的处理方式是在临床研究中已经被验证过,是正确的、可行的。
虽然“循证医学”这个词只能追溯到20世纪90年代初,但这一概念却是古时留下来的。对照临床试验早在20世纪40年代早期就已经进行过了,临床知识和专业知识也早已在医学杂志和教科书中被传播。(事实上,最古老的的医学杂志至今仍在运转中,The New England Journal of Medicine,成立于1812年,比首次临床试验更早,第一次临床试验在1747年进行的,是为水手们进行坏血病的治疗。)
临床试验和研究均针对疾病、健康和可以缓解症状或彻底消除疾病的治疗方法的研究,他们不断探索哪种治疗方法能有效的治疗哪些疾病,以及病人接受治疗后的效果。在世界各地,循证医学是医疗提供者所依照的准则。但是在大数据时代,这可能会被改变。
最初,小团体在测试新的治疗方法时会进行临床试验,以验证所用方法的治疗效果,并确定有何副作用。当一个临床试验有希望成功时,它就会被扩大到更多的人群中。一般进行此类实验时,会将新的方法独立于其他方法进行试验,将患者分成不同的组,每个组进行不同的治疗。此分配过程为随机分配,病人会随机分到不同的组中。
为了保障参与者的权利和提高试验的可靠性,临床试验必须符合严格的科学标准。然而,这并不是说就没有方法上的缺陷和风险存在,且在临床试验中,以小型群体为样本所得出的结果,并不能完全代表更广大的群体。而这正是大数据可以为医学提供助力的地方。通过挖掘世界上经过实践的临床资料,也就是目前所有的病人医疗记录:病人的实际情况、他被什么治疗手段治疗过、最后的效果如何,我们可以得到很多治疗病人的方法。
Apixio是一个人工智能计算机公司,总部位于加利福尼亚,它坚定的着眼于为患者者提供医疗服务,在实践研究基础上提供单独个性化定制服务。Apixio的首席执行官Darren Schulte解释道,“我们的系统可以从医学实践中学习更多的东西,通过计算处理来改进我们的临床护理方法。这其实更像一个‘医疗保健学习系统’。对于什么方法有用,什么方法没用,我们会从真实世界不断更新的数据中获得,如此会更加准确。”
80%有关患者的医疗和临床资料都是非结构化数据,如医师的书面笔记、咨询记录、放射科资料、病理分析结果以及从医院的出院记录等等。
Schulte医生在成为Apixio的CEO之前是任其首席医疗官,他说,“如果我们想学习如何更好的照顾病人,了解普遍人群的健康状况,我们需要从这些非结构化数据中找寻研究,才能得到不一样的结果。”
电子健康档案(EHR)存在已久,但它们是以不同的格式存在于不同的系统中,并不是直接为我们思考分析而设计的。所以,在Apixio分析如此多种类的数据之前,他们需要先从各种来源中提取数据(如家庭医生诊所、医院、政府的医疗记录等等)。然后,再将这些信息转换成计算机可以分析的格式。医生的笔记有很多不同的格式,一些为手写,一些事扫描的PDF文件,所以Apixio使用OCR(光学字符识别)技术来将这些创建成文本信息,以供电脑阅读理解。
达到个体分析水平的数据可以创建一个患者的数据模型,将大量人口的模型汇总后,就能较为准确的从更大范围中获得疾病的患病率和其治疗模式等。
Schulte解释道,“我们创建了一个‘病人对象(patient object)’,其本质上是使用从文本处理、文本挖掘和编码中挖掘出的数据,建立的医疗数据框架集合。通过创建这些个体资料,并将相似的个体资料分组,我们可以判断哪些方案能够对这个人有用,哪些没用,等等这些基础个性化医疗方面的问题。”
然而,如何让医疗保健提供者和健康保险共享出数据,是一个很大的挑战,Apixio通过确保获得数据后自身所能产出的价值,才克服这一困难,得到入口。正如Schulte所说,“除非你能解决目前的关键问题,这些组织才会给你提供访问真实数据的入口。”因此,重点是实际结果和能够解决问题,而不是炒作大数据概念。Schulte说,“医院的CIO们通常看不到很多正在被大数据解决的实际问题。他们看到的更多是无法为其提供帮助的,华而不实的仪表盘。而实际对他们有帮助的是解决现在存在的问题。”
另一个巨大的挑战是,你必须确保这些涉及到病人健康数据的资料是安全的,特别是在一些健康数据泄露事件被曝光之后。2014年,被盗医疗数据在所有被盗数据中所占比例高达43%,而医疗部门也意识到了自2010年起医疗被盗数据的大幅增加(远超过企业或政府部门)。Schulte指出,数据安全就相当于“赌注”,它是在医疗大数据领域进行相关动作的必备基础,“在订立每一个新合同之前,我们都必须向对方证明我们的安全性。”病人的数据必须在存储和传输过程中加密,Apixio从不公开个人健康信息(PHI),除非是由Apixio工作人员在绝对有需要时访问。
那么,实践证明医学是否能够代替循证医学,成为医疗保健行业的黄金准则?也许不会这样。但毫无疑问,我们即将有新的方式去了解、处理和预防疾病,这一点十分令人兴奋。正如Schulte所说,“从医疗保健的方式来看,我们正处于一个全新的世界,这种方式以数据洞察力为驱动,更加精准熟练。”融合了循证医学和实践医学的未来,医生可能有能力为病人提供最好的治疗结果,这正是所有的医疗专业人士期望来到的一天。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27在数字化时代,企业积累的海量数据如同散落的珍珠,若缺乏有效的梳理与分类,终将难以发挥实际价值。CDA(Certified Data Analys ...
2026-02-27在问卷调研中,我们常遇到这样的场景:针对同一批调查对象,在不同时间点(如干预前、干预后、随访期)发放相同或相似的问卷,收 ...
2026-02-26在销售管理的实操场景中,“销售机会”是核心抓手—— 从潜在客户接触到最终成交,每一个环节都藏着业绩增长的关键,也暗藏着客 ...
2026-02-26在CDA数据分析师的日常工作中,数据提取、整理、加工是所有分析工作的起点,而“创建表”与“创建视图”,则是数据库操作中最基 ...
2026-02-26在机器学习分析、数据决策的全流程中,“数据质量决定分析价值”早已成为行业共识—— 正如我们此前在运用机器学习进行分析时强 ...
2026-02-25在数字化时代,数据已成为企业决策、行业升级的核心资产,但海量杂乱的原始数据本身不具备价值—— 只有通过科学的分析方法,挖 ...
2026-02-25