京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据如何赋予医疗行业最大价值?
当在医院看医生的时候,我们信任医护人员的专业知识,相信他们会根据我们的情况以行之有效的科学方法做出处理,这被称为循证医学(EBM)。它的意思是,医生们开具的处方和选择的处理方式是在临床研究中已经被验证过,是正确的、可行的。
虽然“循证医学”这个词只能追溯到20世纪90年代初,但这一概念却是古时留下来的。对照临床试验早在20世纪40年代早期就已经进行过了,临床知识和专业知识也早已在医学杂志和教科书中被传播。(事实上,最古老的的医学杂志至今仍在运转中,The New England Journal of Medicine,成立于1812年,比首次临床试验更早,第一次临床试验在1747年进行的,是为水手们进行坏血病的治疗。)
临床试验和研究均针对疾病、健康和可以缓解症状或彻底消除疾病的治疗方法的研究,他们不断探索哪种治疗方法能有效的治疗哪些疾病,以及病人接受治疗后的效果。在世界各地,循证医学是医疗提供者所依照的准则。但是在大数据时代,这可能会被改变。
最初,小团体在测试新的治疗方法时会进行临床试验,以验证所用方法的治疗效果,并确定有何副作用。当一个临床试验有希望成功时,它就会被扩大到更多的人群中。一般进行此类实验时,会将新的方法独立于其他方法进行试验,将患者分成不同的组,每个组进行不同的治疗。此分配过程为随机分配,病人会随机分到不同的组中。
为了保障参与者的权利和提高试验的可靠性,临床试验必须符合严格的科学标准。然而,这并不是说就没有方法上的缺陷和风险存在,且在临床试验中,以小型群体为样本所得出的结果,并不能完全代表更广大的群体。而这正是大数据可以为医学提供助力的地方。通过挖掘世界上经过实践的临床资料,也就是目前所有的病人医疗记录:病人的实际情况、他被什么治疗手段治疗过、最后的效果如何,我们可以得到很多治疗病人的方法。
Apixio是一个人工智能计算机公司,总部位于加利福尼亚,它坚定的着眼于为患者者提供医疗服务,在实践研究基础上提供单独个性化定制服务。Apixio的首席执行官Darren Schulte解释道,“我们的系统可以从医学实践中学习更多的东西,通过计算处理来改进我们的临床护理方法。这其实更像一个‘医疗保健学习系统’。对于什么方法有用,什么方法没用,我们会从真实世界不断更新的数据中获得,如此会更加准确。”
80%有关患者的医疗和临床资料都是非结构化数据,如医师的书面笔记、咨询记录、放射科资料、病理分析结果以及从医院的出院记录等等。
Schulte医生在成为Apixio的CEO之前是任其首席医疗官,他说,“如果我们想学习如何更好的照顾病人,了解普遍人群的健康状况,我们需要从这些非结构化数据中找寻研究,才能得到不一样的结果。”
电子健康档案(EHR)存在已久,但它们是以不同的格式存在于不同的系统中,并不是直接为我们思考分析而设计的。所以,在Apixio分析如此多种类的数据之前,他们需要先从各种来源中提取数据(如家庭医生诊所、医院、政府的医疗记录等等)。然后,再将这些信息转换成计算机可以分析的格式。医生的笔记有很多不同的格式,一些为手写,一些事扫描的PDF文件,所以Apixio使用OCR(光学字符识别)技术来将这些创建成文本信息,以供电脑阅读理解。
达到个体分析水平的数据可以创建一个患者的数据模型,将大量人口的模型汇总后,就能较为准确的从更大范围中获得疾病的患病率和其治疗模式等。
Schulte解释道,“我们创建了一个‘病人对象(patient object)’,其本质上是使用从文本处理、文本挖掘和编码中挖掘出的数据,建立的医疗数据框架集合。通过创建这些个体资料,并将相似的个体资料分组,我们可以判断哪些方案能够对这个人有用,哪些没用,等等这些基础个性化医疗方面的问题。”
然而,如何让医疗保健提供者和健康保险共享出数据,是一个很大的挑战,Apixio通过确保获得数据后自身所能产出的价值,才克服这一困难,得到入口。正如Schulte所说,“除非你能解决目前的关键问题,这些组织才会给你提供访问真实数据的入口。”因此,重点是实际结果和能够解决问题,而不是炒作大数据概念。Schulte说,“医院的CIO们通常看不到很多正在被大数据解决的实际问题。他们看到的更多是无法为其提供帮助的,华而不实的仪表盘。而实际对他们有帮助的是解决现在存在的问题。”
另一个巨大的挑战是,你必须确保这些涉及到病人健康数据的资料是安全的,特别是在一些健康数据泄露事件被曝光之后。2014年,被盗医疗数据在所有被盗数据中所占比例高达43%,而医疗部门也意识到了自2010年起医疗被盗数据的大幅增加(远超过企业或政府部门)。Schulte指出,数据安全就相当于“赌注”,它是在医疗大数据领域进行相关动作的必备基础,“在订立每一个新合同之前,我们都必须向对方证明我们的安全性。”病人的数据必须在存储和传输过程中加密,Apixio从不公开个人健康信息(PHI),除非是由Apixio工作人员在绝对有需要时访问。
那么,实践证明医学是否能够代替循证医学,成为医疗保健行业的黄金准则?也许不会这样。但毫无疑问,我们即将有新的方式去了解、处理和预防疾病,这一点十分令人兴奋。正如Schulte所说,“从医疗保健的方式来看,我们正处于一个全新的世界,这种方式以数据洞察力为驱动,更加精准熟练。”融合了循证医学和实践医学的未来,医生可能有能力为病人提供最好的治疗结果,这正是所有的医疗专业人士期望来到的一天。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26