京公网安备 11010802034615号
经营许可证编号:京B2-20210330
几乎每一刻我们都在为大数据作出“应有的贡献”
这是我们大多数人司空见惯的一天:早上起床后抓起手机看当天天气预报,然后是查询上班路线,再接下来打开汽车导航,上班后通过互联网查询资料,并不时用手机与外面联系,下班后通过手机APP订餐、购买电影或演出票,回家后通过互联网电视收看节目……“不论你喜欢与否,你的生活已经受控于技术”。在《大数据时代的隐私》一书的作者看来,几乎每一刻我们都在为大数据作出“应有的贡献”。当然,就是这样看似再寻常不过的日常生活,我们一天的行踪、偏好(哪怕有时仅仅只是一个闪念),早就暴露无遗,某种意义上,我们越来越像是一个没有私密可言的“透明人”。
技术就是这样一把双刃剑,既会给你带来诸多便利,同时也会在悄无声息中肆意“偷”走你的信息,根本不在乎你的情绪,这正是本书所要阐明的核心所在。书中每一章都展示了人们在家庭和工作中的日常活动如何成为大数据收集的一部分。或因第一作者本人有过白宫首席信息官的特殊经历,对大数据接触较多,对信息技术更为敏感,所以本书能够针对性提出个人避免隐私泄露的实操举措。此外,本书对改进公共监管举措、完善法律的思考亦不乏真知灼见。
上世纪九十年代,我们曾慨叹生活在一个信息爆炸的年代,今天我们则像是生活在一个数据爆炸甚至过剩的年代。资料表明,全球数据正在迅速增长,大约每18个月翻一番。有专家估计,到2020年全球将会有240亿台连接设备,其中一半是可移动的。届时,全球年数据产生量将会达到2009年的45倍。美国统计学家纳特·西尔弗也在《信号与噪声》一书中指出,在大数据时代,人类一天创造的内容甚至超过人类有史以来的所有内容。在本书作者看来,大数据越是这样蓬勃发展,对公众私密生活的威胁越可能“雪上加霜”。
大数据不仅改变了我们,还“战胜”了我们。2016年的“人机大战”无异于大数据对人类智商的一次不经意“嘲弄”:由谷歌公司研造的人工智能系统阿尔法围棋,挑战世界围棋冠军李世石,最终以4:1获胜。就此,中国科学院院士徐宗本一言以蔽之——人工智能的胜利其实就是大数据的胜利。素以智慧自居的人类败给了自己亲手创造的大数据,这是多么大的讽刺!
“悖论”远不止此,我们甚至还没有大数据更了解自己。举个许多人碰到但又不曾留意的例子。当你在互联网上偶尔点开一本书,你可能很快就会发现,你的电脑页面虽然与别人的大体相同,但你点过的那本书,或者与其关联的信息总会及时出现在页面一角。你原本没什么特别感觉,经这么反复刺激,你很可能在潜移默化中慢慢改变原来的看法,至而生成购买欲。还有,当我们打开APP,刚打出一个字,后面常常会联想出一串信息。这些信息绝非空穴来风,要么因为上了热搜榜,要么因为我们曾经浏览过,或者关注过关联的信息。
大数据蕴含无限商机。“数据挖掘的概念已经存在了至少20年”,“一项数据业务预测2020年企业持有的数据量将超过2012年收集量的30倍”。另一方面,近年来关于大数据泄露公众个人信息的案例屡见不鲜。如果数据的获取没有规则边界,那么就只剩下“裸奔”的利益。媒体多次披露,互联网上的个人信息贩卖已经形成黑色利益链。
内幕触目惊心。商业机构在“盗取”公众个人信息后,常常又以投其所好的方式出现在消费者面前。许多消费者只是觉得越来越方便,而很难意识到这种“贴心”服务是建立在自己信息被泄露基础之上。“我们需要越来越多的数据来满足无止境的欲望,然而我们还从未公开探讨哪些个人信息可以被收集以及如何被利用”。事实上,“信息收集和挖掘技术已经远远超出政府的能力范围,以致难以深思熟虑地通过一项兼顾商业和隐私保护的法律。正因如此,商业公司不知道它不可以做什么,而民众也没有得到保护”。
两位作者郑重指出,在大数据漫天飞舞的今天,只要我们使用手机、电脑、身份证、护照、社保卡、车载卫星定位等,个人信息就一定存在泄露风险。就此,本书从日常生活角度逐一提供技术防范举措。当然,这些举措未必一定确保个人信息的万无一失,但至少可以加上一道密级更高的锁,大大提升泄密的难度。
值得警醒的是,紧步商业机构后尘,一些国家的公共机构亦借大数据技术之利对公民信息“巧取豪夺”。《大数据时代》作者舍恩伯格曾称,“信任是大数据可持续发展的 货币 ”。这里的信任其实应加上引号,因为大多数数据的采集并没有经过被采集者的同意或者授权。2013年,美国中央情报局技术分析员斯诺登向英国《卫报》和美国《华盛顿邮报》泄露了美国国家安全局和联邦调查局启动的一个代号为“棱镜”的秘密监控项目,这也就是至今仍在发酵的“棱镜门”事件。根据斯诺登披露的文件,美国国家安全局可以接触到大量个人聊天日志、存储的数据、语音通信、文件传输、个人社交网络数据。
现实尚且如此,那是否意味,在可预见的未来,随着可穿戴技术和眼球捕捉技术等高科技的突飞猛进,届时无所不在的数据采集会否更令公众束手无策呢?有一点或无疑问,相较而言,今天的数据采集还显得粗放原始。这也就是说,虽然困难很大,从现在开始改进保护个人信息法律,这远比坐等日后数据采集更加泛滥时再纠偏更为容易。想必这也是本书两位作者的良苦用心所在。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在互联网运营、产品优化、用户增长等领域,次日留存率是衡量产品价值、用户粘性与运营效果的核心指标,更是判断新用户是否认可产 ...
2026-05-09相关性分析是数据分析领域中用于探究两个或多个变量之间关联强度与方向的核心方法,广泛应用于科研探索、商业决策、医疗研究、社 ...
2026-05-09 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-05-09在数据驱动运营的时代,指标是连接业务目标与实际行动的核心桥梁,是企业解读业务现状、发现问题、预判趋势的“量化标尺”。一套 ...
2026-05-08在存量竞争日趋激烈的商业时代,“以客户为中心”早已从口号落地为企业运营的核心逻辑。而客户画像作为打通“了解客户”与“服务 ...
2026-05-08 很多数据分析师每天与Excel打交道,但当被问到“什么是表格结构数据”“它和表结构数据有什么区别”“表格结构数据有哪些核 ...
2026-05-08在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-05-07在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28