京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代下用户隐私安全挑战何时休
大数据正在改变个人隐私,而且并不是以人人平等的方式进行。我们越来越依赖技术,而技术又反过来需要我们的个人信息才能发挥作用。这种互惠关系使得人们难以明智地决定,应该对哪些信息进行保密。
大数据时代下用户隐私安全挑战何时休?
1、面对提供相同互联网服务的两家供应商,一家在隐私保护上做得较好,但价格高,而另一家则习惯于侵犯个人隐私,但价格低,那么大多数消费者还是会选择后者。这项研究还发现,如果两家公司以同样的价格提供一款产品,更注重保护隐私的那家公司将胜出。
2、大数据带来了一大挑战,即价值可能并不明确,数据收集者的动机(更不用说其身份)可能被隐藏,个人的预期可能混乱不清。
3、大数据经济的发展不仅应该促进隐私保护,还应该促进对社会凝聚力和广泛平等至关重要的礼仪规则。
或许更为重要的是,不同的人有不同的隐私考虑,具体则取决于一个人的社会经济地位。社会和政策制定者,尤其是后者,必须认识到个人在保护自身数据方面所承受的不同负担。
1.隐私的价值
关于隐私的种种标准,在定义社会和个人生活方面都发挥着重要作用,无论是对穷人还是富人而言都是如此。耶鲁法学院院长罗伯特·波斯特(RobertPost)在其关于隐私法社会基础的论文中写到,隐私支撑着社会的礼仪规则,而礼仪规则创造了“某种只存在于群体规范怀抱中的人类尊严和自主”。他提醒说,如果社会和公共关系被个人与大型监视机构的互动所取代,那么这些好处就会受到威胁。
如今,隐私已经变成一种可以买卖的大宗商品。虽然很多人把隐私视为宪法权利,甚至是基本人权,但大数据时代已经把隐私贬低成了一堆阿堵物。现在已经有很多人在做着量化隐私价值的事情,这既是危险的,也是愚蠢的。像Privacyfix这样的浏览器插件就试图让用户知道自己能为企业提供多大的价值,而一项研究显示,免费的互联网服务向用户提供了2,600美元的价值,以换取他们的数据。有意思的是,这个数字与美国著名法官亚历克斯·科津斯基(AlexKozinski)的一个说法相差无几。他说,他愿意每年花费2,400美元保护其家人的在线隐私。还有一个叫费德里科·扎内尔(FedericoZannier)的小伙子,是个程序员,他在Kickstarter网站上发起了一个有趣的众筹项目,决定挖掘自己的隐私数据,然后看看能值多少钱。扎内尔记录了他所有的在线活动,包括鼠标指针的位置、网络监控探头的图像资料和每天2美元的GPS定位数据,最后得出的结果是2,700多美元。
“隐私货币化”已经变成了当今数据经济的法宝。我们看到了付费社交网络的出现,还有那些以保护用户在线隐私为招牌的服务提供商大行其道,但这些服务都不便宜。在隐私保护方面,价格敏感性常常决定了个人的隐私选择。由于保护一条信息的“价格”远远高于出售那条信息的价格,因此人们在保护自己的隐私方面可能会感到左右为难。显然,隐私具有经济价值,花钱保护隐私的人比愿意出售隐私换取产品或服务的人更少。
欧洲网络与信息安全局(EuropeanNetworkandInformationSecurityAgency)最近进行的一项研究显示,面对提供相同互联网服务的两家供应商,一家在隐私保护上做得较好,但价格高,而另一家则习惯于侵犯个人隐私,但价格低,那么大多数消费者还是会选择后者。这项研究还发现,如果两家公司以同样的价格提供一款产品,更注重保护隐私的那家公司将胜出。有些人把这作为重视隐私保护的商业模式可以成功的证据,但这也预示着,在一切条件相同的情况下,企业可以选择不像竞争对手那样收集那么多的信息,只是为了让自己能贴上“重视保护隐私”的标签。而这将抹杀掉大数据经济本来可以带来的很多好处。
2.大数据挑战
大数据的基石在于收集尽可能多的原始信息,即使我们不知道能够从那些信息中得出怎样的见解。因此,由来已久的公平信息实践原则(FairInformationPractices),比如收集限制和目的限制,越来越被视为时代错误,很多机构和企业协会都呼吁隐私保护应该更多地聚焦于如何使用数据,而不是限制哪些数据可以被收集。争论的话题已经从结构性限制转向了机构和企业能够如何通过透明度来赢得用户的“信任”。另一种看法是建立一种商业模式,更直接地与个人分享数据的好处。在线数据仓库就是一个潜在的例子,哈佛大学伯克曼中心(HarvardBerkmanCenter)的“ProjectVRM”项目则提出要重新思考该如何为用户赋权,让他们能够利用自己的数据并控制其数据的访问权限。这种对个人隐私的认识变化或许不可避免,也可能大有裨益,但我们必须弄清楚这将给普通人带来什么影响。
《哈佛商业评论》最近的一篇文章认为,人们只应该“在价值明确的情况下出售(他们的)隐私”。作者解释道:“这个问题需要你做些功课。你必须弄清楚对方和你交易的动机,以及对方能从中得到什么。这些必须符合你的期望,使你不至于在放弃自己的隐私后感到不安。”更好地匹配数据持有者与其客户的利益是有可能的,这能使数据的处理与变现同时服务于企业和个人。然而,大数据带来了一大挑战,即价值可能并不明确,数据收集者的动机(更不用说其身份)可能被隐藏,个人的预期可能混乱不清。而且,就连最基本的名誉管理和数据隐私工具也要求用户付出时间或金钱,这可能让普通消费者和贫困人群难以承受。
3.大数据和阶级
越来越多的数据收集与分析,有可能加剧阶级分化。数据收集与分析将会提高市场效率,而市场效率有利于富裕的有产阶层。虽然数据经济的好处将会惠及整个社会,但有钱又有高学历的人更有可能成为那种能够利用大数据的成熟消费者。他们拥有良好的信用和理想的消费者形象,能够确保对他们隐私的任何侵犯都会对他们有利。因此,他们想要隐藏的信息要少得多,也没理由担心数据收集者的动机。要是有钱人希望保护自己的隐私,他们也处于最有利的位置,能够利用那些迎合其需求的隐私保护工具和隐私管理服务。从实际情况来看,有钱人可以更加从容地接受每月支付一笔隐私保护费。科津斯基法官或许愿意且有能力每月支付200美元来保护自己的隐私,但普通消费者可能会觉得这笔买卖不划算。
下层民众从大数据上感受到的负面影响可能是最大的。穷人向来没有什么隐私可言,毕竟城堡和高墙是为富人准备的。然而,即使是当今时代,穷人也是最先失去基本隐私保护的群体。克里斯托弗·斯洛博金(ChristopherSlobogin)教授就指出了美国宪法第四修正案中的“贫穷除外条款”问题,他认为,我们在预想隐私问题时所采用的界定方式,本身就让穷人的隐私和自主权更容易遭受政府的非法侵犯。大数据则加剧了这个问题。我们对大数据的种种最大担忧,诸如歧视、侧写、追踪、排外,大部分都会对穷人的自决权和自主权造成最大的威胁,而非其他的阶层。就算假定穷人能够获知自身隐私的价值,他们也无法拿出钱来保护自己的隐私,或者将其用作获得优惠价格的筹码,哪怕这会将他们置于非常不妙的境地。
大数据的本质就是分门别类。不管是什么人的数据,只有在汇总起来,或好或坏地加以利用时,才会变得有用。数据分析利用大量数据来建立详尽的机制进行分类和组织。归根结底,与其说我们担心个人信息被收集,不如说我们担心个人信息被归入错误或不利于我们的类别。例如,亚特兰大有一位居民,他度完蜜月回来后发现,他的信用卡额度从10,800美元被砍到3,800美元,就因为他在一些可能曾有其他人出现过不良还款记录的地方使用了他的信用卡。
一旦所有人都被分类归入详尽细致的社会经济类别,我们就踏上了通往透明社会的道路。社会礼仪规则被信息效率所取代。虽然这种变化可能会带来很多非常重要的社会和公共好处,但这些好处不会平等地落在所有人头上。纽约大学教授海伦·尼森鲍姆(HelenNissenbaum)解释道:“富有的政府机构和工商企业的需求对信息产品及服务的推动力要远为有力得多,从而导致整个市场环境远远称不上均衡。”大数据或许能实现信息的普及,但总的来说,信息在权势者手中可以发挥更大威力。
因此,分门别类可能会对中产阶级和穷人的隐私造成挤压。越来越多的人没有办法或能力来控制自己的数据被如何使用。鼓励人们思考他们的信息可能会被作何用途,还有如何能够最好地保护自己的隐私,是十分积极的一步,但要为此开展一场公共教育活动,虽然值得称道,却恐怕并不现实。社交网络、手机和信用卡是大数据经济的命脉,也是现代生活的必需品,就算让一般阶层放弃使用这些东西确有实际意义或者颇有裨益,那些工作过度、在经济上缺乏安全感的中产阶级却没有这个时间和精力来优先考虑他们仅存的隐私。
目前,隐私变现的另一个选择是赋予人们利用自己信息赚钱的权利。经营在线隐私管理网站Reputation.com的迈克尔·菲蒂克(MichaelFertik)认为,允许企业将“其终端用户数据的潜在价值”进行变现,籍此“与终端用户联手释放巨大价值”,在将来一定大有可为。Personal等初创公司则试图把自己塑造成量身定制的信息仓库,人们可以把自己的信息交给企业来换取价格折扣。这些都是值得探索的项目,但它们要求企业和个人之间高度信任,二者的利益也高度一致。然而,我们依然不可能建立一对一的数据交易所。费德里科·扎内尔在自己的实验中,将自己的个人数据以每天2美元的价格出售给任何愿意购买的人,但普通人恐怕永远无法真正地靠出售个人数据赚钱。一条个人信息连一分钱都卖不了,而且无名之辈的个人资料并不值钱,除非被收集后与其他来自相近社会经济类别的个人资料汇总在一起加以利用。
结论:
虽然应该鼓励数据保护和隐私创业,但不应该让人们必须付钱才能保护隐私或者获得优惠券作为补偿。如果我们想要我们的经济和法律框架从数据收集转向数据使用,就必须开始讨论我们希望摈弃哪些数据使用方式。一些实际发生的价格歧视或者不利雇佣决定就是很好的切入点,但我们还应该关注数据使用将如何影响不同的社会阶层。大数据经济的发展不仅应该促进隐私保护,还应该促进对社会凝聚力和广泛平等至关重要的礼仪规则。
如果不把普通人面临的现实挑战纳入考量,大数据反而会不利于社会平等的促进。届时我们将以各种各样的方式被分门别类,只有价值最高的那些类别才会获得数据所能提供的最大裨益。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22