
大数据时代,医疗数据安全不容忽视
在网络信息爆炸的今天,我们已经听过很多有关金融服务公司和零售商出现安全漏洞的事件了。令人惊讶的是,据最新的调查报告显示,与金融服务公司及零售商相比,医疗机构网络被攻击的频率才是最高的。
黑客从漏洞系统下手
令人担忧的是,很多医院目前都拥有不少基于互联网的医疗设备,包括起搏器、呼吸机等生命维持装置。一旦黑客破解了医院的设备网络系统后,就可以获取心脏起搏器、呼吸机的访问权限,其后果不堪设想。尽管以往这样的事件只会出现在科幻小说里,但是现在,很可能变为现实。
黑客已经将目光日渐瞄准了那些还在使用有漏洞的旧版操作系统的医疗机构,通过将一些新技术植入软件中,能够成功绕过传统安全防火墙进入医院网络,对其中的敏感数据进行访问。
患者数据存在黑市交易
不过,有一点可以减轻黑客所引起的恐慌的是,即这些黑客其实大多只是想获取可以卖出的数据,而不是真的想制造混乱。
有证据表明,熟练的黑客在袭击医疗机构之后,会费尽心思地去获取有价值的病人病历,以此通过黑市获取可观收益。
2016年年末的一份报告显示,美国医疗行业每年因数据泄露平均损失62亿美元。随着互联网和医疗的结合越来越紧密,医疗数据泄露也变得越来越容易。
健康医疗大数据利用的前提:对数据的控制和保护
在健康医疗大数据背景下,医疗信息化建设必然打破传统的数据孤岛,转而走向共享、开放。因此,健康医疗大数据将呈现日益活跃的“流动”趋势,在“流动”中发挥价值。比如,分级诊疗、远程医疗、健康管理等新业态的产生,必然驱动数据的有序流动、合理利用和安全分享。
但是,在数据“流动”的过程中,存在诸多隐患问题:对个体而言,特别关心数据的隐私泄露问题;对卫生医疗机构和主管部门来说,则关心数据是否“健康”,也即数据是否真实、完整、可信,关心敏感的大数据分析结果、政策依据等是否会泄露。安全,已经成为了健康医疗大数据的核心关切点。
当前,我国健康医疗大数据面临着前所未有的安全挑战。在互联共享的时代,数据全生命周期的每一个环节都无法独善其身,根据木桶效应,任何环节的短板都会导致全生命周期的崩溃。而互联网+时代导致数据的边界越来越模糊、越来越开放,进而导致各类网络攻击的手段越来越先进、越来越隐蔽、功利性越来越强。另一方面,业界的数据安全意识和保护手段还很薄弱,信息系统多采用用户名+口令等较弱的访问控制方式,对于数据更是无任何的保护措施,可以说,很多数据正在“裸奔”。
保护健康医疗数据安全
为了更好地保护健康数据,欧洲开启了一项名为KONFIDO的项目,旨在通过识别和阻止网络攻击加强网络安全。项目由欧盟2020地平线( Horizon 2020)项目出资,并且有15家来自行业、学术界和健康产业的不同合伙人加入。计划的目标之一,是开发出一种可以快速识别对健康数据存在潜在网络威胁的电脑程序。这种电脑程序不但可以很好地识别网络威胁,并且可以通过互联网络,把受到威胁的数据转移到更为安全的地方,从而规避网络攻击。
在大数据时代,健康医疗信息的安全需求归根结底就是两点:控制与保护!而数据的控制与保护,都必须在“网络可信体系”中实现。健康医疗大数据需要的“网络可信体系”又是什么呢?对此,《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》(国办发〔2016〕47号)的出台特别在12条中进行了权威解释:“推进网络可信体系建设:强化健康医疗数字身份管理,建设全国统一标识的医疗卫生人员和医疗卫生机构可信医学数字身份、电子实名认证、数据访问控制信息系统,积极推进电子签名应用,逐步建立服务管理留痕可溯、诊疗数据安全运行、多方协作参与的健康医疗管理新模式。”其中,可信医学数字身份、电子实名认证、电子签名应用等关键词,需要特别标红提示!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15