京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代,你会被谁出卖
近日,京东、淘宝、支付宝分别调整了隐私政策,新版隐私条款明确指出了收集和使用用户信息的目的,明确点出第三方合作伙伴的类型以及共享的个人信息内容。此次调整源于7月26日中央网信办、工信部、公安部、国家标准委四部门联合宣布启动隐私条款专项工作,并于8月24日结束隐私条款评审。在层出不穷的个人信息被泄露和各类网络、电信诈骗面前,个人信息的保护被提升到了前所未有的高度,大数据产业也被推向舆论的风口。
如今,我们在手机上下载使用淘宝、微信等互联网应用APP时,都会面临一连串的隐私授权,位置信息、通讯录、存储、相机……如果你选择了“同意”,你的个人信息就会被收集和使用,甚至会被共享给其他互联网企业,不过他们并不会告诉你这样做的目的。这些个人信息汇聚成信息的海洋后,大数据云计算就开始发挥作用了,你的生活会在不知不觉中发生改变。
被大数据改变了的生活
家住西安围墙巷的李毅最近几天有些闷闷不乐,原因是妻子无意中翻看了他的手机,他的一点不想让家人知道的“癖好”被发现了。
说不清在什么时候,李毅发现手机上的一款浏览器特别懂自己,平常喜欢偷偷上网搜索欣赏美女图片和带有性暗示笑话的他,在这款浏览器上找到了别样的乐趣。久而久之,只要他在手机上一打开这款浏览器,页面上80%以上的内容都是各种类型的美女图片与花样繁多的带有性暗示的笑话。
直到上个周末的早晨,正在做饭的妻子随手拿起他的手机,准备查找一道菜的做法时,满屏的“不良”内容顿时让家里的气氛紧张起来。面对妻子的诘问,李毅知道,一向在家人眼里正直伟岸的他,跳到黄河也洗不清了。
李毅的遭遇是互联网企业运用大数据投用户所好的典型例子,只不过最终“好心”办成了坏事。而家住西安大明宫遗址公园附近、爱好跑步的梁慧,却爱上了被大数据“算计”的生活。
经常在跑步结束后,梁慧会把运动手环上的数据同步到社交APP上。现在,只要她打开京东等网购APP时,系统会为她推荐跑鞋或者运动装备,而当她打开微信、陌陌这些社交APP时,系统还会为她推荐附近爱好运动的群组和用户。通过购买APP推荐的跑步装备,她现在看起来像是一个专业跑步人士了;通过加入爱好跑步的群组,和群组里的人一起跑步、一块聚会聊天,她的生活开始丰富多彩起来。
一部小小的手机既能维系你的好友圈子,又能囊括你去留过的场所,购买过的东西……甚至你的每一次搜索查询、信息发送、下载使用过的APP应用等信息都会被互联网企业整理成数据,并在云计算的帮助下,对你的性格、收入状况、购物习惯,近期活动甚至你的思想动态做出很明晰的判断。
这就是大数据带给我们的“惊喜”。可以说生活在大数据时代下,我们的一举一动,随时都有可能被人“监视”,成为赤裸裸的“透明人”,而手机则在其中充当了“出卖者”的角色。互联网用户开始感觉到屏幕后面有一双眼睛盯着自己,个人隐私正暴露在这双眼睛的监视之下,而对个人信息安全的保护注定是大数据产业和互联网用户必须迈过的一道坎。
大数据里的个人信息安全
警方运用大数据破案,政府部门通过大数据提高行政效率,一些地方运用大数据进行精准扶贫……大数据运用并不是互联网和各类APP、智能终端的专利,各类组织单位、部门数据,特别是现在逐渐扩大的物联网以及穿戴设备,都成为大数据应用的主战场。
然而在大数据产业应用风生水起的同时,个人信息和隐私的泄露近几年也令人触目惊心。多达2000万条客户开房信息遭泄露、产妇刚出院不久就接到领取“生育补贴”的诈骗电话、快递企业近百万条快递单个人信息在网络上被公开出售、部分共享充电宝存在信息泄露风险、微信朋友圈小游戏窃取用户信息……
层出不穷的个人信息、隐私泄露事件让人们开始关注互联网信息安全问题,此次京东、淘宝、支付宝调整隐私政策,更是让人们看到了个人信息安全面临的挑战。面对大数据势不可挡的发展态势,如何保护个人信息安全已经成为不可回避的话题。
中国电子商务研究中心此前对1000位用户在线调查显示:21.7%的用户曾因网购、使用微信等遭遇过信息泄露,并且11.2%的用户接到过疑似诈骗电话;56.8%的用户表示对互联网信息安全担忧,并会对需要填写个人信息的各类互联网工具、游戏注册等保留一定的戒心,而仍有43.2%的用户认为互联网信息泄露与个人无关,不太关注。
大数据时代,你的个人信息究竟属于谁?中国互联网和手机安全产品及服务供应商、奇虎360公司董事长周鸿祎曾在谈到大数据时代保护个人隐私时指出,就像财产所有权一样,这些数据应该是用户的资产。利用万物互联技术给用户提供信息服务的公司,需要把收集到的用户数据进行安全存储和传输,这是企业的责任和义务。如果企业要使用用户的信息,一定要让用户有知情权和选择权,所谓“平等交换、授权使用”,泄露用户数据甚至以此牟利,不仅要被视作不道德的行为,而且是非法行为。
专家:大数据立法迫在眉睫
针对互联网用户个人信息安全面临的挑战,陕西省社会科学院社会学研究所副所长、陕西省舆情研究中心主任张春华告诉记者,公民个人信息具有私人专属性特征,特别是用户姓名、出生日期、身份证件号码、住址、电话号码、账号和密码等敏感信息,一旦遭到泄露可能会对用户个人造成不良影响甚至损害。因此,互联网企业采集、使用此类敏感信息必须首先获得用户个人明确授权,未经用户同意,不得收集、使用用户个人信息。
张春华说,互联网企业出卖用户个人信息应该依法进行治理,而且,已经有企业私自贩卖用户个人信息被依法惩处的案例。目前已经有一些关于个人信息安全的法律法规,如工信部的《电信和互联网用户个人信息保护规定》《信息安全技术公共及商用服务信息系统个人信息保护指南》,《中华人民共和国刑法》中有“非法获取公民个人信息罪和出售、非法提供公民个人信息罪”的条款。另外,《互联网新闻信息服务管理规定》《互联网信息搜索服务管理规定》等均有对用户个人信息进行保密的相关条文。但从总体上看,这些法律法规在具体实践中往往面临诸多挑战,如责任主体难明确、概念范围模糊、违法成本过低、交叉管理等。
张春华认为,当前,大数据已经成为国家重要的战略资源,数据信息安全不仅关系到个人安全、社会安全,而且直接关系到国家安全。因此,对网络数据信息的保护力度也应该相应提升,应该提到更高的层面去对待。从大数据的国家战略和国家安全的高度考虑,针对大数据立法非常必要,但从现阶段现实来看,大数据立法任重道远,许多瓶颈有待突破:
个人信息保护范围的界定。目前虽然有多部法律法规涉及对网络个人信息保护内容,但是对保护的个人信息范围界定并不统一,而且具有较大的开放性,这就带来具体执法操作上的难度。
法律法规的可操作性有待提高。个人信息保护制度虽然规定了“事先同意”原则,但在大数据的背景下,加上网络的流动性等特点,在实践中很难操作,因此形同虚设。
违法成本与执法力度有待提高和加强。现有的个人信息保护法律法规中,违法成本相对较低,寄希望于企业自律。有些法规将个人信息保护纳入诚信体系,但是由于目前整个社会的诚信体系尚未完全建立,所以,法律效力减弱,约束力不强。
关于大数据立法,张春华认为迫在眉睫,不过需要分阶段、分步骤,有序推进。一是对现有的相关法律法规在网络安全的框架下进行整合完善,明确个人信息保护范围,明确网络安全执法等职能部门的职权和责任,提升法律法规的可操作性;二是强化主体责任,对信息采集、使用的权限进行明确规定,不断提升行业自律,如各平台、单位必须建立健全信息安全管理制度,非法获取、运用用户数据信息的单位或个人要承担法律责任;三是借鉴国际经验,积极探索适合于我国国情和经济社会发展的大数据立法框架,找到既有利于促进大数据产业发展,推进数据资源开放共享,又可以保证信息安全的平衡点。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20