京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据:有助发现癌症阿喀琉斯之踵_大数据培训
北京时间3月9日消息,据国外媒体9日报道,今年1月,瑞士罗氏制药公司出资10多亿美元收购美国基础医学公司大约一半的股份。基础医学公司只是一家小公司,致力于从数据角度分析癌症,寻找癌症的阿喀琉斯之踵,并没有研发出任何新药或者拯救生命的医疗设备。绝大多数保险公司都不愿为它们的主要产品买单,与很多生物科技公司一样,这家公司一直在赔钱。罗氏之所以收购基础医学公司是为了提高自身的癌症治疗和药物研发能力。
罗氏、基础医学以及其他很多癌症研究人员都认为从数据角度分析癌症是最终战胜这种可怕疾病的理想方式。根据罗氏和基础医学签署的协议,罗氏可以访问基础医学的数据库。他们的数据库收录了3.5万名癌症患者的肿瘤DNA序列,以及这些患者服用的药物和药物在遏制癌症方面产生的功效等信息。
肿瘤学领域一直缺乏相关数据和信息。癌症的分类和治疗立基于它们影响的身体部位,显微镜下的癌细胞形态以及肿瘤扩散程度,例如二期结肠癌。这种类型学随着时间的推移越发细致,但仍将很多癌症混杂在一起。这就像对诺亚方舟上的动物进行普查,最后发现船上共有十几种动物,包括长羽毛和翅膀的动物,6条腿且长翅膀的动物和4条腿且长毛发的动物。这并没有错,但只描绘出一幅模糊的图画,并没有揭示真实情况。
在给癌症分类方面,医学家做得还不够好。癌症药物(例如让肿瘤大幅萎缩)在22%的时间的疗效另人沮丧,肿瘤学家很难预测哪种药物对哪些患者拥有最佳治疗功效。据估计,每年的癌症药物支出高达500亿美元,其中有390亿美元以这种方式被白白浪费掉。罗氏公司前高管玛拉-阿斯皮纳尔表示:“这是一种采用试错法的药物。”
DNA测序以及其他生物学信息技术正在改变这一切。肿瘤基因测序技术揭示出我们所说的“肾癌”或者“肺癌”的真相。从某种程度上说,它们是1000种或者100万种病变的结合,每一种带有一种不同的变异以及其他分子错误。每一个肿瘤拥有属于自己的“微型方舟”,充满怪异的功能紊乱的细胞以及大量出问题的DNA。最近一项针对肾癌的研究发现,没有两名患者存在相同的基因错误,同一名患者体内也没有两个基因变异相同的肿瘤。2014年一项对乳腺癌进行的高分辨率DNA测序研究未能在一个肿瘤内发现两个基因相同的细胞。
这一点非常重要,因为找到变异的基因通常能够告诉我们如何攻击癌症,或者说暴露出癌症的阿喀琉斯之踵。药物研发人员已经发明了几十种靶向疗法药物,能够专门对存在特定癌症相关基因变异的细胞发动攻击,杀死这些细胞或者让它们陷入瘫痪。由于这些药物的针对性极强,治疗效果往往超过传统药物,例如针对结肠癌的爱必妥和针对确定乳腺癌的赫赛汀。不过,在使用这些武器前,你首先需要知道你要攻击的敌人藏身何处。因此,寻找乳腺癌的HER2变异以及检测某些晚期肺癌以寻找EGFR基因变异成为一项标准。不过,这些检测一次只能探测到一种变异,就像在街灯下找钥匙。一种更为理想的做法是全面搜寻基因变异。
患者的样本被送到基础医学公司接受扫描,寻找在癌症中扮演角色的大约300种已知变异,不管是乳腺癌、骨癌还是肺癌样本。这些信息有望揭示出确凿的基因证据,找到可以利用的变异,进而选择恰当的药物进行治疗。在最为理想的想定中,每一种癌症都存在一个弱点,基因组测序(或者其他全面的生物学数据分析法)能够找到癌症的这个弱点。基础医学公司总裁迈克尔-佩里尼在1月举行的个性化医疗世界大会上表示:“借助于所有这些新数据,我们重新对患者进行分类。我们不再用‘X期’描述一名乳腺癌患者,而是确定乳腺癌的分子驱动器水平。”
现在,很多知名癌症研究中心提供全面的基因分析服务,尤其是针对晚期癌症患者。美国波士顿的黛娜-法伯癌症研究所向所有成年患者提供这种服务。这种分析改变了非小细胞肺癌(最常见的肺癌)的分类方式。现在,非小细胞肺癌根据其主要变异进行描述,而不是根据发生癌变的组织。从这个角度诊疗癌症是美国总统奥巴马1月末宣布的精准医疗计划背后的驱动力之一。
利用数据改变我们治疗癌症的方式并不像利用数据敲定亚马逊上的消费品价格或者利用Waze等众源应用避免交通拥堵那么简单。生物学要比人造系统复杂得多。2012年对100名乳腺癌患者进行的一项研究发现了40种不同的基因变异,形成73种不同的组合。一些患者存在6种在癌症中扮演角色的不同变异组合。在我们进行治疗的同时,肿瘤也适时进化,因此有必要重复测序肿瘤DNA,也就是要抢在癌症前面。对于很多变异来说,可能不存在任何适当药物。
现在,这种富信息方式在治疗癌症方面已经有一些成功案例。在基础医学公司数据库收录的3.5万名癌症患者中,有一位名叫科里-伍德的年轻妇女。2014年春季,也就是从大学毕业短短一周,她便被诊断出患上四期非小细胞肺癌并且已经扩散到骨骼和眼睛。这种癌症通常采用药物治疗,但药物只在大约20%的时间奏效。基础医学公司对伍德的肿瘤样本进行分析,结果发现基因ROS-1存在一个弱点。这一发现意味着伍德可以服用一种名叫“克里唑蒂尼”的药物进行治疗,遏制存在这种异常基因的细胞的活性。据统计,只有不到2%的肺癌患者存在这种变异。如果没有发现这个变异,伍德的医生可能永远不会让她用克里唑蒂尼进行治疗。
在服药后不到3个月,伍德的癌症几乎消失了。2月,她收到一条令人兴奋的消息,自己已经彻底摆脱肺癌。她在2014年秋季的福布斯医疗峰会上表示:“借助于基因组测序和数据,我正在战胜肺癌。”基础医学公司、罗氏公司和其他很多癌症研究人员正在“数据治疗癌症”的道路上不断迈进,幸运的伍德成为首批受益者。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16