京公网安备 11010802034615号
经营许可证编号:京B2-20210330
警惕大数据成了互联网的“PX项目”
2018年新年伊始,BAT接连遇到了数据隐私问题带来的困扰。蚂蚁金服遭遇“支付宝个人账单隐私保护事件”,吉利控股的李书福曾发表了“微信天天盯着我们的聊天记录看”的言论让腾讯面临了一场不大不小的公关危机,江苏省消保委则是因数据隐私问题对百度提起消费民事公益诉讼,百度只能在法庭上自证清白。
BAT三个巨头不约而同在新年第一周遭遇类似的问题,着实让人感慨,中国互联网基础设施没那么好当。
大数据也成了互联网的“PX项目”——有点年纪的人可能都知道“宁波PX项目事件”,公众因为对这种石油炼化一体化项目存在认知误解,导致相关项目在国内迟迟无法推进。
BAT三家都成了冤大头
事实上,BAT三家在公众对数据隐私的敏感性面前,都成了冤大头。
1月2日,用户查看支付宝年账单,因为某些项目会涉及芝麻信用的数据,需要事先同意《芝麻服务协议》。
但同意按钮非常小,网络上讨伐支付宝的声音愈演愈烈。后来芝麻信用出来道歉称,此做法初衷没错,但用了非常傻逼的方式,愚蠢至极,并已经调整了页面,取消默认勾选。
1月4日,吉利控股李书福在正和岛新年论坛上说, “微信天天盯着我们的聊天记录看”。
1、微信不留存任何用户的聊天记录,聊天内容只存储在用户的手机、电脑等终端设备上;
2、微信不会将用户的任何聊天内容用于大数据分析;
3、因微信不存储、不分析用户聊天内容的技术模式,传言中所说“我们天天在看你的微信”纯属误解。
2018年1月5日,江苏省消费者权益保护委员会则是发布消息称,江苏省消保委于2017年12月11日对北京百度网讯科技有限公司涉嫌违法获取消费者个人信息及相关问题提起消费民事公益诉讼。2018年1月2日,南京市中级人民法院正式立案。
对此,百度详细地回应了这场诉讼中江苏省消保委对百度产品功能权限获取的误读,并通过亲自演示应用安装过程来进行自证清白——在安卓机上安装“手机百度”APP时每一步操作都会出现授权弹窗提醒,用户可自行决定是否接受百度获取其定位和存储等权限,百度APP没有出现越权行为。
完成“监听”要费九牛二虎之力,尤其是当前6.0以上版本的安卓操作系统对安卓手机权限的申请更加严格,手机权限申请由手机系统决定,手机APP根本没有机会进行越权操作。在手机旁边说话就能实现监听的情况,在技术上根本没办法实现。
坦率说,“被同意《芝麻服务协议》”这件事情中,蚂蚁金服有自己的小心思,某些做法确实比较鸡贼,在道德上确实诟病很多,但程序上总体是合法的。至于腾讯和百度两家,则是因为公众对技术缺乏了解,以至于造成了误会。
公众认知的几个误区
不管怎样,这一轮涉及BAT三家的数据隐私舆论危机都证明了一个问题:
公众对大数据隐私的认知非常迫切,对大数据环境下个人隐私的保护也非常重视。
但是,这种认知有时候存在误区。最简单的说,上次某媒体微博发布了极光大数据里有关王者荣耀用户画像的一则消息。
下面有一则评论和回复非常具有代表性:
评论说——我只是想问,腾讯哪里来的这么详细的数据,实名认证认证的不仅仅是年龄吗?难道知道身份证号之后就要把别人的隐私调查个底朝天,然后做成数据在洋洋得意的公布出来?
下面有个懂大数据的朋友则是回复这位网友说——这是粗颗粒的数据,早就脱敏过了。只有群像,没有单一的个体数据。评论之前最好去读一读数据相关的文章和资料。
大数据的采集、挖掘、提炼与分析本身是个技术壁垒很深,而且逻辑非常复杂的产业,大数据产业对公众认知设立了高高的技术门槛,以至于经常会产生误解。
简单来说,对大数据的认知必须把握这几个基本准则。
1、对于所有互联网公司来说,都必须遵守所在国的法律规定。滥用数据必然会遭遇法律制裁,对BAT这样的企业来说,法律永远是制约数据使用的绳索,触犯法律拿用户隐私进行商业分析,随时都会面临法律监管。
2、大数据的使用时要进行脱敏的,对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。没有任何一家互联网企业敢直接拿着用户数据就拿来使用。
3、大数据环境下的数据匿名技术也是大数据环境下的普遍使用的数据处理技术。个人其实在大数据面前早已经被分解成了一个个标签的颗粒,单人的整体数据不可能会被提取。
4、大数据使用早已经进入了不触及用户隐私的阶段。基于数据失真的技术通过添加噪音等方法,使敏感数据失真但同时保持某些数据或数据属性不变,仍然可以保持某些统计方面的性质。阻塞与凝聚、差分隐私保护等技术能够让用户在可以保证隐私的同时,使得大数据同时可以使用。
人们对大数据滥用的担忧的确有必要性,这对巨头来说,是一种必要的制约,但是过渡担忧的话,则是有些杞人忧天。
大企业还需普及常识
这次接二连三的事件,其实给了笔者很深的触动。
因为很多在技术领域可能算是常识的问题,在公众面前,由于对技术缺乏了解,形成了“大数据隐私恐慌”。结果很多时候公众会不分青红皂白,通过愤怒的方式去保护自己的权益。
这种心态值得理解,但是也需要企业去做引导,普及更多有关大数据隐私的常识。
可惜的是,现在很多公司忌疾畏医,看到公众的恐慌反而更畏首畏尾,在有关大数据使用这个问题上,三缄其口躲躲闪闪。
此前和某家BAT级别云计算业务负责人沟通时,提到说大数据采集、利用的问题,这家负责人摆手不谈,称容易会引发舆论危机。私下交流才发现,这位负责人认为大数据隐私的问题太过敏感,公众对技术并不了解,容易造成误解,多说无益。
但这种鸵鸟策略实际上并无太多好处,反而容易加深误解。
就像是当年盛极一时的“宁波PX项目事件”,公众因为对这种石油炼化一体化项目存在认知误解,认为对人体健康会造成恶劣影响。当地政府又躲躲闪闪不敢回应,造成了双方误解不断加深。最后PX项目在全国范围内遭到抵制,每去一个地方都会造成当地恐慌,随之而来的则是群体性事件要求PX项下马。
后来随着产业技术人员、专家不断普及PX项目的信息,公众对其环保忧虑才逐渐淡化。
大数据利用就像是互联网公司的PX项目,这次有关数据隐私的问题在开年就找上门来,也说明冰冻三尺非一日之寒。不过不管是百度这次法庭自证清白,还是腾讯对李书福公开回应都对传播大数据相关知识起到了重要作用。某种意义上来看,这对公众跟深刻了解大数据隐私保护,会起到正向作用。
大数据几乎是潮流。事实上,在未来,大企业还需要更多向公众普及常识,消除公众对大数据使用的恐慌。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16