
医疗大数据爆发点临近:如何保护用户隐私
多年来,我国医疗机构大都各自为政,即便是一个医院内部也很难做到信息共享,如今,国家力推健康医疗大数据的共享和应用,但这又将是一个信息共享和个人隐私的博弈。
“建立国家级人口与健康科学数据共享平台有重大意义。首先,我国优质医疗资源不平衡,如何去了解全国的医疗服务分布,如何在跨省医疗时得到更精准的信息,这类数据对此类宏观政策的制定有着很好的帮助和借鉴;其次,数据更加规范。根据国家的标准去制定、采集和储存数据,使得数据更具准确性和共识性。”1月4日,中国医学科学院北京协和医学院院校长曹雪涛接受《华夏时报》记者采访时表示,医疗大数据的共享是基础,规范发展是关键,安全是核心,如何在数据共享过程中保障个人隐私是需要着重去考虑的重要方面。
医疗数据平台热潮涌动
面对即将到来的“医疗健康大数据”时代,大数据技术与医疗健康产业融合创新的热潮涌动。
医疗大数据
2016年3月,国务院发布的国民经济与社会“十三五”规划纲要中正式提出,实施国家大数据战略。2016年6月,国务院办公厅发布《关于促进和规范健康医疗大数据应用发展的指导意见》(下称《指导意见》),首次把生物学资源和医疗大数据作为国家的基础战略资源,也把它纳入了国家大数据战略的布局。同年8月召开的全国卫生工作会议上,国家主席习近平特别提出了要完善人口健康信息服务体系建设,推进健康医疗大数据应用。10月份,“健康中国2030规划”得以发布,在这个规划里面也把医疗健康大数据应用创新与发展列入了国家一项重要任务。
“2016年,国家召开了一系列的会议,并且出台了一系列关于医疗健康大数据指导原则和相关文件。”曹雪涛表示,国家级的医疗健康大数据平台对我们国家政府的决策,对于病人就诊和医改体系完善、科学研究都会作出应有的贡献。
据记者了解,多年来,我国的防控项目主要应对的是传染病,很少涉及到慢性病,因为数据样本小,慢性病很难统计,更谈不上预防。
“对于卒中的发病情况,高危人群和低危人群相比,它的发病情况高了10倍,2010年到2013年40岁以上卒中发病人群还在增长,项目点还在以4%左右的速度增长,这个增长速度是很难令人想象的。同时,卒中病人里中年人已经占到将近50%。这些数据是我们通过国家人口与健康数据共享平台,经过几百万人的海量数据获得的,覆盖全国所有的省市。”1月4日,全国人大教科文卫副主任委员王陇德在国家人口与健康科学数据共享平台科技资源发布会上表示,多年来,卒中患病率一直没有明确,如今,经过这样一个数据平台提供的大样本数据得到了2%的患病率结果,同时得出结论,卒中病人的数据占比如果控制不好,对国家和家庭的威胁实在太大。
根据这样的数据结果,王陇德的团队给国家领导人写了一封建议信,“筛查和干预中年人的中风风险刻不容缓”,并且得到国家高层的重视,要求重视开展中年人中风筛查,为此,国家开展卒中综合方案,在国家建立区域的防控体系,同时加大中年人筛查干预和防控力度,到2020年,争取建立起全国的防治体系。
据记者了解,在政策和需求驱动下,医疗信息化建设将处于景气上升期,未来几年在医院端电子病历、移动医疗、远程医疗、医学影像等系统的部署将成为行业主要增长点,预计行业将保持在15%-20%左右的增速;同时我国各地市区域医疗信息化平台招投标正在快速展开,预计未来几年公共卫生信息化将保持在20%-30%的高速增长。
个人隐私如何保护?
医疗健康大数据的共享和应用是政府管理、商业发展和技术创新的需要,但也给个人隐私安全带来了威胁,使得医疗领域的大数据共享变成了双刃剑。
根据《指导意见》的设想,数据不能只是躺在某个医院的信息系统中,各家医疗卫生机构的数据应该汇聚到一块;数据也不能只是在健康医疗行业中实现聚合,应该打破卫生计生、工信、民政、公安、社保、环保、食药品监管等部门的壁垒,做到跨部门的数据互联共享;数据还不能只是在公共部门内流转,还应该探索推进“可穿戴设备、智能健康电子产品、健康医疗移动应用等产生的数据资源规范接入人口健康信息平台”。
而这,无疑给卫计委等相关部门提出了一个棘手的课题:如何做好健康医疗大数据的共享和开放工作。
其实,医疗数据共享与个人隐私的矛盾在发达国家同样是个棘手的问题。
2013年,英国曾推出一个Care.data计划,将有关病人的数据采集、汇总,进行共享和使用,但是实施不过3年,2016年7月份,该项目被关停,更多的原因则是隐私方面的问题没有做得很好。首先,对数据的保密性关注不够,比如,对个人隐私进行匿名化和脱敏处理之后,该系统和其他系统关联后,依然可以通过数据挖掘的方式辨别有关病人。其次,项目里没有界定数据开放共享的用处。最后,采集病人的数据信息时,并未征得患者的同意。
“人口健康大数据发展的难题是隐私保护和共享,比如,我们的健康档案建了好多,但我们应用健康档案时出现过好多问题,有时候半年也拿不到一个市区的数据,因为他们要保护隐私。”1月4日,国家人口与健康科学数据共享平台管理中心常务副主任尹岭表示,对于个人隐私,其平台从数据采集到应用均有一套管理制度,比如每个单位只授权一个人管理数据库,责权相对明确,同时,将业务数据导出来作为科研数据使用时,要把个人的姓名、住址等隐私信息去掉。
就此,中国政法大学传播法研究中心研究员朱巍曾表示,我国现行法律仅将“非法公开”作为承担侵权责任的构成要件,虽然有利于大数据隐晦性使用的发展,但也可能导致大数据使用被滥用。为此,建议在立法上尽早引入“被遗忘权”立法观念,将用户作为自己信息的控制者,在不继续使用服务或产品之后,相关信息保有者应立即彻底删除相关信息记录,同时,必须在立法上明确,法律应禁止医疗信息的非法流动。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15