京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代的个人信息保护
近日,关于网易邮箱用户数据库疑似遭泄露的消息在网上引起波澜,涉及数据达数亿条。此前,第三方支付机构也被曝出存在实名认证漏洞,还有一些第三方支付曝出泄露客户信息、账户被盗刷等问题。有调查显示,76%的被调查者认为个人信息在大数据时代更容易被泄露。在过去一年中,超过一半的受访者认为自己的个人信息被泄露过。调查中,对大数据使用以及个人信息保护立法,有20%的受访者认为要“加大惩罚力度,引入惩罚性赔偿制度”。
消费者看病后,接到保健服务、健康管理公司的推销电话;购车购房后,保险公司很快就跟消费者取得联系;生完宝宝刚离开医院产科的女士,推销奶粉、婴儿服务的电话、邮件、短信就络绎不绝,推销人员甚至直接加上了消费者的社交账号。不少用户在网上随意搜索地点、物品,很快就有相应的旅行产品、相关门类的商品出现在推荐栏。
这些非常常见的现象,反映出的共同问题都在于,消费者在完成某方面消费行为,或完成某类主题的网络浏览后,其个人基本信息悄无声息的被披露给相关的商品或服务供应商。如果刨除病毒攻击、木马植入因素,披露消费者信息的,很多情况下就是电商平台、医院、电信企业、汽车及房地产销售企业(直接转让信息);还有一种可能,是社交网络、支付平台、网络安全软件,或安装在手机、PC端的其他软件或消费者,或消费者浏览过的网站、使用过的手机应用,主动捕捉了消费者的个人信息,经过提取挖掘后作为重要的数据资产,与相关企业分享使用或出售给其他企业使用。
上述两种情况,共同特征就在于搜集、挖掘分析、对外分享或出售消费者信息,并未经过消费者本人的许可,或是故意将信息授权条款加入到内容繁复的网站登录、软件和APP许可声明之中。随着国内外网络企业跨界整合的提速,一些社交网络、第三方支付机构、电商网络及其他应用软件建立了密切的结盟合作关系,甚至通过并购整合,成为了同一家集团公司掌控的分支机构——企业鼓励消费者跨网站、软件应用相互绑定身份,借此可以验证消费者个人身份信息、社会关系信息、账户信息,结合个人网络行为信息、设备信息等多方面信息,开展更趋精确的数据挖掘和预测分析。
当企业可以非常精准预测消费者行为后,确实能够更有针对性的开展营销,提高客户服务水平,但从另一个角度来看,企业的行为方式也将变得更为智能化,可以更高效率的把握消费者痛点,实施消费者更难以抵挡的诱导和操纵。
数量更多、更为翔实、(经过多来源信息比对验证)精确度更高的消费者信息,商业价值非常可观。但很少有人意识到,多来源信息的结合,也意味着信息发送外泄的出口增多,大型企业实施数据安全管理的难度因而提升,一旦发生数据泄露,消费者多方面、多来源隐私信息就将毫无保留的呈现在黑客面前,甚至大庭广众之下。
非但如此,未经消费者个人许可,企业方面超范围开展的数据利用,还可能给消费者带来损失。美国计算机科学专家埃里克·西格尔在《大数据预测》就举例指出,已经有社交网站为用户提供未来职业选项的预测服务,也同时为雇主服务预测员工的离职倾向,后一指数较高的员工将很可能在毫不知情的情况下成为职场竞争的牺牲品。又如,医疗机构通过购买其他来源的数据,经分析预判某些病患经抢救仍将无法存活,就会拒绝救治这些病患。
笔者以为,国家有关部门应致力于分别从立法、行政执法、司法、公益救助四个方面,扎紧篱笆,加强消费者个人信息保护。在立法环节,应出台规范的消费者授权个人信息使用条款,网络企业以免费或低价产品、服务换取消费者个人信息授权后,需要严格依照授权要求开展数据挖掘分析,不得以任何方式在未经消费者许可授权或超出授权范围使用消费者个人信息(例如,不得在仅获得消费者个人基本信息授权的情况下,自行挖掘获取消费者的社会关系、账户,结合消费者个人网络行为等信息开展商业开发利用)。要提高对违法违规非法采集使用消费者个人信息做法的罚款数额,完善处罚方式,加大这方面违法违规案件的通报范围,形成强有力的震慑。
在行政执法环节,应明确公安机关、网络信息主管部门、市场监管部门等单位保护消费者个人信息的职责分工,各部门各司其职,有效加强重点监管,加大消费者个人信息保护的抽查力度,畅通举报渠道,严格依法依规处置这方面的侵权案件。在司法、公益救助方面,可以考虑以政府购买的方式,在各地设立消费者就个人信息泄露起诉相关企业的救助基金,为起诉个人提供部分资助,鼓励消费者运用法律手段维护合法权益。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23