
大数据时代,如何规范使用数据
在最近的一个活动上,一家连锁药店的运营总监向我们描述了大数据时代的一个场景:当一个客户进入他们的门店之后,药店的会员数据中心就可以告诉营业员,这个客户是一个什么样类型的人,曾经买过什么、喜欢什么、不喜欢什么等详细的数据,来针对性地为这名客户提供服务。
他甚至提出了一个更“完美”的场景:摄像头放在门口,通过人脸识别技术,用户还没进店营业员就可以获得这些信息。营业员会根据数据中心推荐的数据进行营销,在完成收款之后,所有用户的收款信息都会直接进入会员数据中心,同时也会把相关的消费信息、积分变动等推送给用户。根据用户累积的消费数据,后台会知道每一位用户的偏好,有针对性地发送一些优惠券, 甚至于健康关怀等等,完成这样一个闭环。
从商家的角度来说,这样的“闭环”看上去确实很完美,但是对用户来说,当你甚至没有跨进一家商店的门槛,自己的购物历史、习惯、偏好等信息都已经尽在商家的掌握之中,而且这还是一家连锁药店,这就非常可怕了。
从生产和销售的企业的角度来说,通过大数据预测用户的需求,然后合理地安排生产和上市,对整个社会资源配置来说是有积极意义的,药店根据用户的偏好去推荐产品也无可厚非。但是,对个人用户来说,搜集具体的某个人的个人数据就是另外一个层面的事情了。药店知道顾客的疾病情况可能更有利于向用户推荐合适的药品,然而大多数人显然并不会希望自己的疾病信息如此轻易地被人知道,即使只是被药店的销售员知道而已,即使并不是什么“隐疾”。在这个药店“完美”的场景中,用户的隐私被彻底地忽略了。
缺少法律保障
在这样一个大数据泛滥的时代,如何保护自己的隐私,如何限制企业去使用用户的个人数据是非常重要的问题。
数据显示,2016 年,全国公安机关共侦破网络侵犯公民个人信息案件2100 多起,查获公民个人信息500多亿条,抓获犯罪嫌疑人5000多人,而这可能还只是冰山一角。
最近,监管层也开始对大数据乱象出手,开始清理行动,多家大数据公司被列入调查名单。国内互联网黑色产业链一直非常发达,相对欧美国家,国内在欺诈、黑客层面因为违法犯罪成本很低,形势更为严峻。对个人用户来说,个人信息安全意识觉醒目前主要是在一二线城市少数的公民是有个人信息保护意识的,广大农村乡镇区域对此并不敏感,甚至会随意出借身份证等个人证件。
在法治层面上,中国信息安全立法也一直相对滞后。在民法中,并没有个人信息权的概念, 对个人信息的民法保护依据主要见于民法关于人格权、名誉权、隐私权以及侵权责任法等方面的规定。
在2012 年的《全国人大关于加强网络信息保护的决定》发布后,中国网络安全与信息化立法开始加速,对个人信息安全的保护也开始逐步提升。
今年5 月9 日,最高人民法院和最高人民检察院合发布《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》,对《刑法》二百五十三条作出了详细说明,并从“公民个人信息范围”、“情节严重认定标准”、“严打内鬼”、“非法购买”、“收受个人信息获利”等方面对该条款作出详细解释。
此次发布的司法解释首先明确了“公民个人信息”的范围,是指以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人身份或者反映特定自然人活动情况的各种信息,包括姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等。
今年6 月1 日正式实施的《网络安全法》仅仅用了两年半时间从列入立法计划到正式出台;在传统法律的制定、修订工作中,也给予网络空间前所未有关注。
如何规范使用数据
虽然目前还存在不少问题,但是大数据行业的发展却也是大势所趋,问题的关键在于大数据行业如何规范化发展。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
KS 曲线不光滑:模型评估的隐形陷阱,从原因到破局的全指南 在分类模型(如风控违约预测、电商用户流失预警、医疗疾病诊断)的评 ...
2025-08-19偏态分布:揭开数据背后的非对称真相,赋能精准决策 在数据分析的世界里,“正态分布” 常被视为 “理想模型”—— 数据围绕均值 ...
2025-08-19CDA 数据分析师:数字化时代的价值创造者与决策智囊 在数据洪流席卷全球的今天,“数据驱动” 已从企业战略口号落地为核心 ...
2025-08-19CDA 数据分析师:善用 Power BI 索引列,提升数据处理与分析效率 在 Power BI 数据分析流程中,“数据准备” 是决定后续分析质量 ...
2025-08-18CDA 数据分析师:巧用 SQL 多个聚合函数,解锁数据多维洞察 在企业数据分析场景中,单一维度的统计(如 “总销售额”“用户总数 ...
2025-08-18CDA 数据分析师:驾驭表格结构数据的核心角色与实践应用 在企业日常数据存储与分析场景中,表格结构数据(如 Excel 表格、数据库 ...
2025-08-18PowerBI 累计曲线制作指南:从 DAX 度量到可视化落地 在业务数据分析中,“累计趋势” 是衡量业务进展的核心视角 —— 无论是 “ ...
2025-08-15Python 函数 return 多个数据:用法、实例与实战技巧 在 Python 编程中,函数是代码复用与逻辑封装的核心载体。多数场景下,我们 ...
2025-08-15CDA 数据分析师:引领商业数据分析体系构建,筑牢企业数据驱动根基 在数字化转型深化的今天,企业对数据的依赖已从 “零散分析” ...
2025-08-15随机森林中特征重要性(Feature Importance)排名解析 在机器学习领域,随机森林因其出色的预测性能和对高维数据的适应性,被广 ...
2025-08-14t 统计量为负数时的分布计算方法与解析 在统计学假设检验中,t 统计量是常用的重要指标,其分布特征直接影响着检验结果的判断。 ...
2025-08-14CDA 数据分析师与业务数据分析步骤 在当今数据驱动的商业世界中,数据分析已成为企业决策和发展的核心驱动力。CDA 数据分析师作 ...
2025-08-14前台流量与后台流量:数据链路中的双重镜像 在商业数据分析体系中,流量数据是洞察用户行为与系统效能的核心依据。前台流量与 ...
2025-08-13商业数据分析体系构建与 CDA 数据分析师的协同赋能 在企业数字化转型的浪潮中,商业数据分析已从 “可选工具” 升级为 “核 ...
2025-08-13解析 CDA 数据分析师:数据时代的价值挖掘者 在数字经济高速发展的今天,数据已成为企业核心资产,而将数据转化为商业价值的 ...
2025-08-13解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-08-12MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-12PyTorch 中 Shuffle 机制:数据打乱的艺术与实践 在深度学习模型训练过程中,数据的呈现顺序往往对模型性能有着微妙却关键的影响 ...
2025-08-12Pandas 多列条件筛选:从基础语法到实战应用 在数据分析工作中,基于多列条件筛选数据是高频需求。无论是提取满足特定业务规则的 ...
2025-08-12人工智能重塑 CDA 数据分析领域:从工具革新到能力重构 在数字经济浪潮与人工智能技术共振的 2025 年,数据分析行业正经历着前所 ...
2025-08-12