京公网安备 11010802034615号
经营许可证编号:京B2-20210330
警惕大数据成了互联网的“PX项目”
2018年新年伊始,BAT接连遇到了数据隐私问题带来的困扰。蚂蚁金服遭遇“支付宝个人账单隐私保护事件”,吉利控股的李书福曾发表了“微信天天盯着我们的聊天记录看”的言论让腾讯面临了一场不大不小的公关危机,江苏省消保委则是因数据隐私问题对百度提起消费民事公益诉讼,百度只能在法庭上自证清白。
BAT三个巨头不约而同在新年第一周遭遇类似的问题,着实让人感慨,中国互联网基础设施没那么好当。
大数据也成了互联网的“PX项目”——有点年纪的人可能都知道“宁波PX项目事件”,公众因为对这种石油炼化一体化项目存在认知误解,导致相关项目在国内迟迟无法推进。
BAT三家都成了冤大头
事实上,BAT三家在公众对数据隐私的敏感性面前,都成了冤大头。
1月2日,用户查看支付宝年账单,因为某些项目会涉及芝麻信用的数据,需要事先同意《芝麻服务协议》。
但同意按钮非常小,网络上讨伐支付宝的声音愈演愈烈。后来芝麻信用出来道歉称,此做法初衷没错,但用了非常傻逼的方式,愚蠢至极,并已经调整了页面,取消默认勾选。
1月4日,吉利控股李书福在正和岛新年论坛上说, “微信天天盯着我们的聊天记录看”。
1、微信不留存任何用户的聊天记录,聊天内容只存储在用户的手机、电脑等终端设备上;
2、微信不会将用户的任何聊天内容用于大数据分析;
3、因微信不存储、不分析用户聊天内容的技术模式,传言中所说“我们天天在看你的微信”纯属误解。
2018年1月5日,江苏省消费者权益保护委员会则是发布消息称,江苏省消保委于2017年12月11日对北京百度网讯科技有限公司涉嫌违法获取消费者个人信息及相关问题提起消费民事公益诉讼。2018年1月2日,南京市中级人民法院正式立案。
对此,百度详细地回应了这场诉讼中江苏省消保委对百度产品功能权限获取的误读,并通过亲自演示应用安装过程来进行自证清白——在安卓机上安装“手机百度”APP时每一步操作都会出现授权弹窗提醒,用户可自行决定是否接受百度获取其定位和存储等权限,百度APP没有出现越权行为。
完成“监听”要费九牛二虎之力,尤其是当前6.0以上版本的安卓操作系统对安卓手机权限的申请更加严格,手机权限申请由手机系统决定,手机APP根本没有机会进行越权操作。在手机旁边说话就能实现监听的情况,在技术上根本没办法实现。
坦率说,“被同意《芝麻服务协议》”这件事情中,蚂蚁金服有自己的小心思,某些做法确实比较鸡贼,在道德上确实诟病很多,但程序上总体是合法的。至于腾讯和百度两家,则是因为公众对技术缺乏了解,以至于造成了误会。
公众认知的几个误区
不管怎样,这一轮涉及BAT三家的数据隐私舆论危机都证明了一个问题:
公众对大数据隐私的认知非常迫切,对大数据环境下个人隐私的保护也非常重视。
但是,这种认知有时候存在误区。最简单的说,上次某媒体微博发布了极光大数据里有关王者荣耀用户画像的一则消息。
下面有一则评论和回复非常具有代表性:
评论说——我只是想问,腾讯哪里来的这么详细的数据,实名认证认证的不仅仅是年龄吗?难道知道身份证号之后就要把别人的隐私调查个底朝天,然后做成数据在洋洋得意的公布出来?
下面有个懂大数据的朋友则是回复这位网友说——这是粗颗粒的数据,早就脱敏过了。只有群像,没有单一的个体数据。评论之前最好去读一读数据相关的文章和资料。
大数据的采集、挖掘、提炼与分析本身是个技术壁垒很深,而且逻辑非常复杂的产业,大数据产业对公众认知设立了高高的技术门槛,以至于经常会产生误解。
简单来说,对大数据的认知必须把握这几个基本准则。
1、对于所有互联网公司来说,都必须遵守所在国的法律规定。滥用数据必然会遭遇法律制裁,对BAT这样的企业来说,法律永远是制约数据使用的绳索,触犯法律拿用户隐私进行商业分析,随时都会面临法律监管。
2、大数据的使用时要进行脱敏的,对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。没有任何一家互联网企业敢直接拿着用户数据就拿来使用。
3、大数据环境下的数据匿名技术也是大数据环境下的普遍使用的数据处理技术。个人其实在大数据面前早已经被分解成了一个个标签的颗粒,单人的整体数据不可能会被提取。
4、大数据使用早已经进入了不触及用户隐私的阶段。基于数据失真的技术通过添加噪音等方法,使敏感数据失真但同时保持某些数据或数据属性不变,仍然可以保持某些统计方面的性质。阻塞与凝聚、差分隐私保护等技术能够让用户在可以保证隐私的同时,使得大数据同时可以使用。
人们对大数据滥用的担忧的确有必要性,这对巨头来说,是一种必要的制约,但是过渡担忧的话,则是有些杞人忧天。
大企业还需普及常识
这次接二连三的事件,其实给了笔者很深的触动。
因为很多在技术领域可能算是常识的问题,在公众面前,由于对技术缺乏了解,形成了“大数据隐私恐慌”。结果很多时候公众会不分青红皂白,通过愤怒的方式去保护自己的权益。
这种心态值得理解,但是也需要企业去做引导,普及更多有关大数据隐私的常识。
可惜的是,现在很多公司忌疾畏医,看到公众的恐慌反而更畏首畏尾,在有关大数据使用这个问题上,三缄其口躲躲闪闪。
此前和某家BAT级别云计算业务负责人沟通时,提到说大数据采集、利用的问题,这家负责人摆手不谈,称容易会引发舆论危机。私下交流才发现,这位负责人认为大数据隐私的问题太过敏感,公众对技术并不了解,容易造成误解,多说无益。
但这种鸵鸟策略实际上并无太多好处,反而容易加深误解。
就像是当年盛极一时的“宁波PX项目事件”,公众因为对这种石油炼化一体化项目存在认知误解,认为对人体健康会造成恶劣影响。当地政府又躲躲闪闪不敢回应,造成了双方误解不断加深。最后PX项目在全国范围内遭到抵制,每去一个地方都会造成当地恐慌,随之而来的则是群体性事件要求PX项下马。
后来随着产业技术人员、专家不断普及PX项目的信息,公众对其环保忧虑才逐渐淡化。
大数据利用就像是互联网公司的PX项目,这次有关数据隐私的问题在开年就找上门来,也说明冰冻三尺非一日之寒。不过不管是百度这次法庭自证清白,还是腾讯对李书福公开回应都对传播大数据相关知识起到了重要作用。某种意义上来看,这对公众跟深刻了解大数据隐私保护,会起到正向作用。
大数据几乎是潮流。事实上,在未来,大企业还需要更多向公众普及常识,消除公众对大数据使用的恐慌。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21在实际业务数据分析中,单一数据表往往无法满足需求——用户信息存储在用户表、消费记录在订单表、商品详情在商品表,想要挖掘“ ...
2026-01-21在数字化转型浪潮中,企业数据已从“辅助资源”升级为“核心资产”,而高效的数据管理则是释放数据价值的前提。企业数据管理方法 ...
2026-01-21在数字化商业环境中,数据已成为企业优化运营、抢占市场、规避风险的核心资产。但商业数据分析绝非“堆砌数据、生成报表”的简单 ...
2026-01-20定量报告的核心价值是传递数据洞察,但密密麻麻的表格、复杂的计算公式、晦涩的数值罗列,往往让读者望而却步,导致核心信息被淹 ...
2026-01-20在CDA(Certified Data Analyst)数据分析师的工作场景中,“精准分类与回归预测”是高频核心需求——比如预测用户是否流失、判 ...
2026-01-20在建筑工程造价工作中,清单汇总分类是核心环节之一,尤其是针对楼梯、楼梯间这类包含多个分项工程(如混凝土浇筑、钢筋制作、扶 ...
2026-01-19数据清洗是数据分析的“前置必修课”,其核心目标是剔除无效信息、修正错误数据,让原始数据具备准确性、一致性与可用性。在实际 ...
2026-01-19在CDA(Certified Data Analyst)数据分析师的日常工作中,常面临“无标签高维数据难以归类、群体规律模糊”的痛点——比如海量 ...
2026-01-19在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16在游戏行业“存量竞争”的当下,玩家留存率直接决定游戏的生命周期与商业价值。一款游戏即便拥有出色的画面与玩法,若无法精准识 ...
2026-01-16为配合CDA考试中心的 2025 版 CDA Level III 认证新大纲落地,CDA 网校正式推出新大纲更新后的第一套官方模拟题。该模拟题严格遵 ...
2026-01-16在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15