
大数据规制有哪些难点,别忘了你的隐私
个人数据搜集是大数据发展的源泉, 也是隐私风险的源泉, 对于该环节的规制是隐私保护正本清源的关键。但是,在规制过程中存在以下难点:
(1 ) 优化服务与隐私保护的两难选择。
大数据市场中的各个主体均面临着服务优质化和个人信息记录保密的两难选择。从GVM的角度来看,过多的保护隐私,大数据的产业发展和技术革新将面临数据源泉的瓶颈;忽视隐私保护,将危及个人利益,甚至动摇社会信用体系。从企业的角度来看, 免费提供优质的服务是建立在用户提供其个人数据的基础之上的,没有个人数据,难以优化服务和获取利润;有了个人数据,需要承担泄露用户隐私的风险。从个人来看, 一方面受益于服务提供商免费提供的高效、优质服务,另一方面却不得不向其提供一些敏感的个人信息。例如, Amazon的 Silk浏览器为了优化用户体验, 会记录用户浏览的历史数据于“云”上,并对其进行分析,从而找出用户的使用习惯,提前将可能会浏览的页面存储在“云”上。通过这一技术, Silk浏览器大大加快了页面的加载速度和用户响应时间。诸如此类的为实现某种服务优化,需要对特定的人或物的相关信息进行搜集,意味着不得不去接触个人的敏感信息。社交网络在这方面体现得尤为明显。据此,美国、欧盟等国家(地区)均开始尝试对个人信息记录进行监管,但同时却存在着对GVM过多介入而导致阻碍技术革新的担心, 并遭到了部分互联网企业的反对 。
(2)个人数据搜集企业的机会主义行为。
企业在捜集个人数据时,为了规避责任,或者诱导用户l''4J, 可能存在以下投机行为:
一是没有隐私条款。按照当前的法律规定,在搜集个人数据时,应有?用户隐私权保护和个人信息利用政策?(简称隐私条款)相关的说明文件,使用户对数据的用途有知情权。目前,国内不少网站在搜集个人数据时,隐私条款设置不完备,甚至没有设置隐私条款L''S1 。
二是隐私条款中有一些免责条款。例如,某知名门户网站的隐私条款如下,该声明将隐私定义为姓名、身份证号、联系方式、家庭住址,将其他个人数据排除在外,这实际是一种免责条款。同样, x x公司将不会向除上述关联公司外的任何其他方公开或共享用户注册资料中的姓名、个人有效身份***号码、联系方式、 家庭住址等个人身份信息, 也就意味着可以向其他公司提供其他个人数据 。
専重用户个人陰私是XX 公司的-一项基本政策.一隐私”是指用户在注册 XX通行证厳号时提供给 XX公司的个人身份信息.包括用户注册资料中的姓名、个人有效身份***号码、联系方式、家庭住址等. Xx公司一贯积极地采取技术与管理等合理清施保障用户账号的安全、有效; XX公司将善意使用搜集的信息,采取各项有效且必要的措施以保护您的隐私安全,并使用商业上合理的安全技术措施来保护您的隐私不被未经授权的访问、 使用或泄橋。
因业务所需, XX公司需与 XX公司的关联公司杭州雷火网络有限公司、 XX (杭州)网络有限公司、 )CX宝有限公司、北京XX 有道计算机系统有限公司、XX有道信息技术(北京) 有限公司共享用户注册信息, XX公司及上述关联公司承诺将善意使用其个人信息, XX公司将不会向除上述关联公司外的任何其他方公开或共享用户注册资料中的姓名、 个人有效身份***号码、 联系方式、家庭住址等个.人身份信息.但下列情况除外:! {% J( n W* T; x4 O
(1)用户成用户监f·人授权 XX公司披露的;! u$ s6 H: O1 L. `4 c+ z9 { I, x
(2)有关法律要求 XX公1li]被露的;
(3) 司法机关或行政机关基f法定程序要求 XX公司提供的;
(4) XX 公司为了维护白己合法权益而向用户提起诉讼或者仲裁时;2 z2 P7 r4 j% J2 N# O2 V& C3 @: j
(5 ) 应用户监护人的合法要求而提供用户个人身份信息时。
(3)用户漠视隐私风险。
用户漠视隐私风险主要表现在以下两方面。
一是轻视了隐私风险,没有在意,最典型的做法是不看隐私条款。2012年第三方机构互联网协会(The Intemet Society)在全球范围内就互联网以及在线用户行为进行了一次调査①。 调査报告显示, 当用户清楚他们正与某网站或服务分享个人信息时, 绝大部分用户(80%)不太会去阅读隐私条款,而相当一部分调査对象(12%)承认他们从来都不阅读隐私条款。
二是侥幸心理, 为了尽快获取服务或者优惠, 明知有风险, 也懒于防范。互联网协会的调查显示, 19%的调査对象知道个人信息有时候会被用到他们意料不到的地方上去。但是,他们中的一部分人仍然不去阅读隐私条款。而且,登录在线服务的用户中只有一半会主动登出 。
(4)公共利益与个人隐私的冲突。
为维护公共利益,个人数据经常被直接或者强制搜集。搜集以后,由于各种原因,不一定起到「维护公共利益的作用,却实实在在侵犯了个人隐私。 此二者之间的冲突也影响了个人数据捜集的隐私规制 。
一是公共场所的录像资料。20l3年6月网上曝出了轰动一时的“上海高院法官涉嫌集体招嫖”事件。上海法院4名法官在受邀外出用餐时,在惠南镇衡山度假村内的夜总会包房娱乐,接受异性陪侍服务。被人获取了酒店监控资料并在网上公布,使4名当事人被撤职或被免职。 这种个人数据的曝光成「反腐的利器。 而与此同时的另一条消息却引发了争议。 河南省出台有关条例称, 擅自传播公共场所的监控视频将被处罚 。 在摄像头通布街头的今天,公共场所的录像资料既事关个人隐私保护,也事关公共利益。目前还没有权威的法律,规制其搜集、处理和使用。
二是实名制的推广。 中国实名制应用的领域堪称全球之最,通信、交通、金融、医疗、社保、旅游住宿等领域,没有身份证寸步难行。 个人在身份信息公开的情况下变得透明, 随之失去了保持独处和宁静的权利,安全感受到损害,其结果就会导致个人活动和人格的萎缩。更有甚者,实名制产生的各种数据已经成为一种商品, 被采集并存储到大型数据库中, 供他人有偿或无偿的使用。 为了某个目的搜集的信息, 经常在没有征得当事人同意的情况下, 用于实现其他日的, 这是对个人人格权以及隐私权极大的侵犯,数字化使GVM的管理变得越来越便利, 但随之而来的是大量的个人信息被公用化,个人偏好、通讯记录、疾病记录、性格倾向、信用记录、违法记录、雇佣信息等诸如此类的信息被录入GVM数据库中 。 这些数据库的使用并没有制定科学的限制规则, 这就给雇主、GVM机构或其他使用者提供了选择的依据,而这种选择可能因为这些信息的原因而带有歧视性 。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09