
大数据时代的用户数据须区别保护_数据分析师
大数据时代,是物联网的时代,随着云存储和云计算的发展,以智能手机、智能家电、可穿戴设备为代表的智能终端的普及,通过各种智能终端上传和收集的用户数据将越来越多,对用户数据的分析和挖掘及利用,将是大数据的商业价值所在,蕴藏和巨大价值的用户数据的性质及使用规则是我们值得思考的问题。
用户数据的“区分所有权”构想
提到用户数据,我们首先想到的是用户的“隐私权”。民法大家王利明教授在其主编的《人格权法新论》一书中提到:隐私权是自然人享有的对其个人的与公共利益无关的个人信息、私人活动和私有领域进行支配的一种人格权。可见隐私权是一项“个体”权益,强调权利的身份和人格的属性。
用户数据的商业价值核心并不是“个人”的人格权益,其必要条件是具备足够多的用户个体样本,其更强调“集合”的权利,单个用户数据的商业价值是有限的。而用户数据的核心价值在于通过对云端存储的海量的用户个人状况、行为、需求的样本分析和挖掘,一方面为上游硬件商提供产品的开发依据,另一方面对用户的消费、生活提供“量身打造”的服务,从而形成物联网的全产业链循环,实现更高效的管理社会资源并创造更多的价值。
可见,虽然用户数据来源于“个体”数据,但最终使社会获益的是用户的“集合”数据。因此,在界定用户数据的性质方面,笔者建议根据单个数据是否具有身份属性,将用户数据分为身份数据和样本数据,并对这两类数据加以区别保护。
用户的身份数据是指可以通过单一的个体数据,即能锁定特定用户的数据。如姓名、身份证号、各种账号信息、联系方式等。比如我们通过一个电话,就能联系到一个特定的用户。因此,此类信息具有较强的身份属性,须定义为“隐私权”的范围,其权利主体应为用户个人所有,其使用和经营,须经过用户的许可,否则将被判定为侵权。现行法律法规如《全国人民代表大会常务委员会关于加强网络信息保护的决定》、工信部出台的《电信和互联网用户个人信息保护规定》以及消费者权益保护法、《网络交易管理办法》中规定的个人信息,当属于用户的身份数据范畴。
样本数据是指通过个体数据汇聚成的用户个人状况、行为、需求的数据库以及通过分析和挖掘以上数据获得的相关数据。此类数据的所有权应为用户和数据收集方共有,但经营使用权建议应掌握在能够发挥其价值的数据收集者手中。将所有权和经营权区分开来,既能从法律上保证用户的个体权益,又符合经济学的原理。
样本数据的经营规则
用户身份数据的使用规则可以依据现有的法律法规执行。我们仅需要通过立法明确以上法律所适用的数据的范围,并在执行层面的政策上制定可操作的保护用户身份数据和隐私权的规章制度。
对于样本数据的使用和经营规则,现有法律并没有明确依据。根据上文的阐述,笔者已将其所有权拟定为用户和数据收集者共有,经营使用权则建议应掌握在能够发挥其价值的数据收集者手中。这样设计的目的在于,一是保留用户的“被遗忘权”;二是发挥物尽其用的作用。
首先,保留用户的“被遗忘权”是用户数据使用的基础。
大数据时代到来,人们最担心的是自己将被暴露得一览无余,没有隐私可言。因此,个体信息是否公开,公开的程度,需要个体能够掌控,即用户自主决定其向外界公开的个人信息的广度和深度,也可随时自行或要求收集数据方,删除其掌握的任何关于用户个体的数据。用户要求收集者删除其样本信息时,须提供可以辨识其个体信息的依据(一般须为身份信息),以证明其要求删除的信息是属于自己的样本信息。
其次,数据收集者在收集样本数据时,须向用户群体公示其收集途径和方式,以及用户删除自己样本信息的途径和方法。只有这样,用户才能知晓其被收集者收集的数据是什么,以及自己的样本信息被经营者使用的状况是否安全,从而判断其是否愿意继续使用数据收集者的产品,并将自己的样本信息交给数据收集者经营。一旦用户选择使用某一数据收集者的产品,数据收集者将与用户共有其收集的用户样本数据。
第三,数据收集者在遵守法律对用户隐私保护前提下,无需用户授权,可自由地使用和经营其收集到的用户的样本数据,直至用户自行或要求其删除样本数据。
当前,各数据收集者之间进行不同程度的共享和授权数据的需求已是大数据的发展趋势。云与云的互联互通才能使数据样本变得足够庞大,使数据分析和挖掘的结果更有价值,使用户不同智能终端之间的连接变得可能,从而真正的实现大数据的物联网。
样本数据的共享和授权中涉及到大量个体信息,如果用户此类活动需要经过个体用户的授权,将会极大地阻碍商业效率,其数据和信息的收集是随时随地的,要求单个用户对单个的样本授权,也会影响用户的体验。因此最现实的方式是数据的收集者在经营和使用其收集的数据时,无需个体用户的单独授权。
最后,数据收集者通过样本数据所获取的收益,个体用户须有分配权。
个体用户对数据经营的收益分配权容易理解。数据的源头是个体,个体是样本数据的所有者,因此其理所应当得到经营数据的利益。分配的方式和数量可由数据收集者确定并公示,一旦用户使用特定数据收集者的产品,即表明其同意以此对价获取收益。当然,用户领取收益的前提是提供可以辨识其个体信息的依据(一般须为身份信息),以证明其是对应个体样本数据的提供者。CDA数据分析师培训官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23