精准医学之贝瑞和康基因组“大数据之路”
自基因测序技术被发明以来,建设人类基因组数据库一直是各国基因组研究中心的核心内容之一,人类基因组数据库的宗旨是为从事人类基因组研究的科学家和医护人员提供人类基因组信息。目前国际上人类基因组数据大多来源于西方白种人,然而不同人种的进化差异会导致明显的易感基因差异、特异性位点突变频率不同、基因突变表观差异等,因此在我国分子诊断与精准医学飞速发展的背景下,建立高质量的中国人群基因组数据库已经成为当下制约分子医学发展的重要壁垒。今年两会上,委员也建议应尽快建立精准医学资源库,整合共享医疗大数据,促进精准医学更好的发展。
贝瑞和康作为致力于将高通量测序技术实现临床转化的行业领导者,早在2015年8月14日宣布与云计算服务平台提供商阿里云达成合作,共同打造以海量的中国人群基因组数据为核心的数据云,实现对个人基因组数据的精准解读。该项目由美国贝勒医学院、现任职贝瑞和康CIO的于福利教授牵头,参与“神州基因组数据云”项目的研究人员达到了100多人,由医学、分子生物学、遗传学、计算机编程等研究领域的博士组成。项目组分成三个团队,一个是贝瑞和康的研究团队,一个是于福利在贝勒实验室的团队,另外一个则是专门做高性能运算的阿里云团队。
神州基因组数据云,是一个知识密集型项目。
阿里云拥有批量计算服务的强大能力,贝瑞和康则深耕基因检测多年已积累超过百万人群基因组数据,此次选取其中四十万人份数据作为“神州基因组数据云”项目的第一阶段数据,旨在借助云计算对该数据资源进行深入挖掘,进一步揭示中国人群遗传突变分布,提升中国人遗传疾病诊断的效率和精准程度。
当基因测序成本迅速下降以后,拥有数据量的多少不再是行业里唯一的竞争优势,而是否能够将海量的大数据进行解读,转换成具体能够应用的有效信息,才是测序企业发展的核心竞争力。光有云计算能力和基因组数据还不够,分析和注释技术是能否达成项目目标的内在核心驱动力。该项目发布一年后,也即2016年8月24日贝瑞和康公布了为基因数据分析开发的两大核心专利技术:Verita Trekker®变异位点检测系统和Enliven®变异位点注释系统。
Verita Trekker®经过严格的基因型质量控制,SNP 检测的灵敏度达99.00%,特异性达99.99%,真阳性率达99.90%;Indel 检测的真阳性率达88.00%;家系样本基因型真阳性率大于99.90%;各项指标均属国际业界一流水平。而Enliven®则通过统计学计算和文本挖掘方法整合国际权威的超过50个数据库和预测算法,其中也包括“神州基因组数据云”项目所产生的中国人特有基因信息数据库。同时,支持千万篇文献的即时查找,全面覆盖基因、变异、表型、疾病信息,参考权威文献、美国医学遗传学学会(ACMG)标准与实际基因型-表型对应,在这样完善的体系和先进的算法的保障下,能够出具可靠的变异致病性结果,为科研工作者和临床医生更好的研究和制定精准医疗方案提供帮助。
在Verita Trekker®和Enliven®两大核心技术共同驱动下的“神州基因组数据云”项目取得了阶段性的重要成果。2016年9月8日,贝瑞和康已完成世界首个中国人群基因组数据库建设,填补了国际基因数据库中缺少中国人群特有基因组数据信息的空白。
同年9月23日,在第十九届全国临床肿瘤学大会暨CSCO学术年会上,贝瑞和康进一步展示了该项目的重要成果应用。这其中包括与北京大学肿瘤医院解云涛教授合作的“中国人遗传性乳腺癌基因突变图谱项目”,以及中国40万人基因组大数据项目在临床应用层面上所取得的阶段性成果,结果显示中国人乳腺癌基因突变和其他人种相比具有显著性差异。
项目由解云涛教授和于福利教授共同展示,可以看到采用Enliven®变异位点注释系统对美国国家卫生研究院的相关项目中的BRCA1、BRCA2基因的2152个位点进行注释,将注释结果与以往报告结果对比,PPV(阳性预测值)达到99.3%,充分验证了Enliven®注释和解读能力的准确性。在此基础上,贝瑞和康将自建的中国人基因组数据库与万例妇科肿瘤患者的基因数据进行整合,建设成为全球最大的妇科肿瘤基因组数据库。
现在,神州基因组数据云项目仍在进行中,中国人群的基因组大数据正在成倍累积增长。受益于测序成本下降,降低获得大量数据的难度,因此只要在数据解读能力上快速突破,中国非常有可能在生物基因信息解读这一领域实现弯道超车。
“神州基因组数据云”项目的另一层意义则与我国医疗政策中正在力推的分级诊疗政策息息相关。通过与专家合作,大数据体系为90%以上的医院提供解读能力,这将对基层临床产生重要的指导意义。可以想象,在三四线城市,医生利用该数据云平台分析基因测序数据,在当地可以获得同样质量的检测分析,获得和在大城市大医院同等质量的报告,就能够进一步促进实现分级诊疗。于福利教授展望道。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析在当今信息时代发挥着重要作用。单因素方差分析(One-Way ANOVA)是一种关键的统计方法,用于比较三个或更多独立样本组 ...
2025-04-25CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-25在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-24以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《刘静:10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda ...
2025-04-23大咖简介: 刘凯,CDA大咖汇特邀讲师,DAMA中国分会理事,香港金管局特聘数据管理专家,拥有丰富的行业经验。本文将从数据要素 ...
2025-04-22CDA持证人简介 刘伟,美国 NAU 大学计算机信息技术硕士, CDA数据分析师三级持证人,现任职于江苏宝应农商银行数据治理岗。 学 ...
2025-04-21持证人简介:贺渲雯 ,CDA 数据分析师一级持证人,互联网行业数据分析师 今天我将为大家带来一个关于用户私域用户质量数据分析 ...
2025-04-18一、CDA持证人介绍 在数字化浪潮席卷商业领域的当下,数据分析已成为企业发展的关键驱动力。为助力大家深入了解数据分析在电商行 ...
2025-04-17CDA持证人简介:居瑜 ,CDA一级持证人,国企财务经理,13年财务管理运营经验,在数据分析实践方面积累了丰富的行业经验。 一、 ...
2025-04-16持证人简介: CDA持证人刘凌峰,CDA L1持证人,微软认证讲师(MCT)金山办公最有价值专家(KVP),工信部高级项目管理师,拥有 ...
2025-04-15持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。在实际生活中,我们可能会 ...
2025-04-14在 Python 编程学习与实践中,Anaconda 是一款极为重要的工具。它作为一个开源的 Python 发行版本,集成了众多常用的科学计算库 ...
2025-04-14随着大数据时代的深入发展,数据运营成为企业不可或缺的岗位之一。这个职位的核心是通过收集、整理和分析数据,帮助企业做出科 ...
2025-04-11持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。 本次分享我将以教培行业为 ...
2025-04-11近日《2025中国城市长租市场发展蓝皮书》(下称《蓝皮书》)正式发布。《蓝皮书》指出,当前我国城市住房正经历从“增量扩张”向 ...
2025-04-10在数字化时代的浪潮中,数据已经成为企业决策和运营的核心。每一位客户,每一次交易,都承载着丰富的信息和价值。 如何在海量客 ...
2025-04-09数据是数字化的基础。随着工业4.0的推进,企业生产运作过程中的在线数据变得更加丰富;而互联网、新零售等C端应用的丰富多彩,产 ...
2025-04-094月7日,美国关税政策对全球金融市场的冲击仍在肆虐,周一亚市早盘,美股股指、原油期货、加密货币、贵金属等资产齐齐重挫,市场 ...
2025-04-08背景 3月26日,科技圈迎来一则重磅消息,苹果公司宣布向浙江大学捐赠 3000 万元人民币,用于支持编程教育。 这一举措并非偶然, ...
2025-04-07在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03