京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代下,数据使用与隐私保护的博弈
3月5日《南方都市报》的一则报道引起了关注《我们仔细看了50家APP和网站的隐私协议,发现你同意了很多可怕的条款……》。这些可怕的条款包括,没有隐私保护、把个人的健康数据给一款阅读软件、把个人的信息分享给第三方网站和网站认为必要即可公开个人的私密信息等。这些信息不仅包括非个人信息,也包括个人信息,如个人的住址、职业以及敏感的健康信息等。
信息时代,网络服务商提供的软件(APP)和网站,所收集的无数信息成就了海量的大数据,商家和科技公司在通过大数据服务于每个人的同时,既可赚取大量的利润,同时也必然涉及另一个问题,有意和无意泄露个人隐私。如何在大数据时代保护个人隐私,在中国显得特别严重和紧迫。
主要表现为,商家以隐瞒和挟持的手段迫使用户放弃隐私保护。即便一些商家推出表面的隐私协议,要求用户签字,也表现为霸王条款。用户同意才能使用其软件,不同意就不能使用,而且只要使用了网站的任一服务,就表示使用者同意商家的隐私权政策。但这个政策只是商家个人的定义。
在信息时代,一方面,每个人的信息汇聚为大数据时当然不仅是为商家带来财富,也为公共利益,如攻克疾病、研发药物和反恐防恐提供了方便。根据Wikibon的报告,美国大数据产业的市场规模在2017年将达到500亿美元,这其中就包括医药公司利用基因检测软件分享个人数据,并以此为基础研发药物和新产品获取的利润。在中国,每年利用大数据获得的利益也早就超过100亿元人民币。正在召开的“两会”上,百度董事长兼首席执行官李彦宏的第一个提案就是“利用人工智能和大数据技术,帮助解决走失儿童问题”,这也是利用大数据推进和支持公益活动的具体体现。
即便大数据能解决人们生活和发展中的许多问题,而且也将是未来社会发展的一个基石和动力,但并不意味着个人隐私不需要保护。恰恰相反,大数据时代更需要保护个人隐私,才能让信息时代的技术最大化地有利于每个个体,也体现社会的公平和公正。
不过,在中国,保护个人隐私的第一个难题是,如何定义个人隐私,以及如何保护大数据涉及的隐私。中国的法律当然提及了公民个人隐私,并提出,“公民的个人数据不得非法搜集、传输、处理和利用”。但是, 中国的《民法通则》并未将隐私权作为一项独立人格权利加以保护,在隐私权方面,中国的现行立法并不清晰和明确。正因为如此,众多的网络服务商才可以在其软件和网络服务中强行以商家的规则来搜集并使用公民的隐私信息。
对此,应当根据中国的具体情况和参照发达国家对大数据时代提出的公民隐私权的解释,进行立法,以兼顾大数据的合理使用和个人隐私的保护,至少在二者之间寻求一种平衡。
美国对隐私权的规定大致有:公民个人享有秘密或者寻求隐匿的权利,同时保护公民个体的隐私权从住宅扩大到所有私人谈话与通讯过程;公民个人有匿名表达权,特别在政治意见领域;禁止某些运用公民私人信息的消极结果,如防止基因检测信息泄漏而遭到歧视;在私人信息脱离本人排他所有权之后,控制他人接触这些信息;个人有做出私人决定而不受政府干涉的权利,主要包括个人的健康、生育和性生活领域。
美国保护个人隐私既有传统,又看重现实的信息技术发展现状。1974年美国通过了《隐私法案》,2012年2月奥巴马政府又宣布推动《消费者隐私权利法案》,2015年3月美国白宫公布了《2015年消费者隐私权法案》草案。此外,针对上述公民隐私权利的内容也有许多具体的法律,如2008年出台的《基因信息非歧视法案》。
具体到个人隐私权利保护草案,也是一种妥协的结果。一方面,草案关注保护个人隐私,另一方面,又给予商家很多利用个人信息或大数据的权利。例如,草案的一个基本规定是,数据持有商必须要在透明度报告中提供更多关于其用户数据收集的信息;同时,个人访问商家储存的个人数据拥有更多的权利。但另一方面,草案也规定,商家可自行制定隐私政策。而且,如果消费者的要求被商家裁定为无理取闹的行为,商家可以选择无视这些要求。
对此草案,美国最大的信息技术公司微软表态称,微软支持《2015年消费者隐私权法案》,但并不意味着它完全认同法案里的每一项条款。微软首席隐私官布兰登•林奇(Brendon Lynch)认为,对于草案有些人反对,有些人赞同,但不管怎样这都是好消息,因为人们开始为之对话了。
从发达国家的情况看,大数据时代的信息利用和个人隐私保护一直存在博弈,中国现在的情况还达不到这一步,只是处于商家和权力机构强势获取个人信息并加以利用的阶段,公民隐私权的承认和保护还处于空白期,这种不平衡的状况也必将造成广泛的社会负面影响。对此,除了公众要将诉求通过两会代表传达到立法机构外,还需要政府的干预,才能形成大数据的合理应用与个人隐私有效保护的双赢结局。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18