
大数据从业者表示信息贩卖这个“黑锅”我不背
11月21日,中国青年政治学院互联网法治研究中心与封面智库联合发布国内首份基于百万问卷调研的《中国个人信息安全和隐私保护报告》(以下简称《报告》)。《报告》抽取104.86万份调查问卷为样本,梳理中国个人信息及隐私的泄露现状,其概括为“触目惊心”。
多达81%的参与调研者经历过对方知道自己的姓名或单位等个人信息的陌生来电;53%的人因网页搜索、浏览后泄露个人信息,被某类广告持续骚扰;租房、购房、购车、车险、升学等信息泄露后被营销骚扰或诈骗高达36%等。
由于个人信息获取、存储和利用的环节众多,线下和线上传播具有隐蔽性和复杂性,追本溯源成本很高,发现、查处难度大,处罚、赔偿力度小,同时获利空间巨大,也为黑色产业链提供了巨大的投机空间。有专家认为,应该构建统一的立法框架、加大司法打击力度、确立顺畅维权渠道。把关注的焦点从事后的惩处转移到事前的防范上来,从非法数据产业链的源头堵住数据泄露的可能性,才有希望从根本上治愈这一顽疾。
很多普通人无法界定“大数据”还是信息贩卖黑色产业链,因此,这对于大数据从业人员来说,不仅要敢于站出来对民众承诺保护他们的信息安全,也要从自身出发,严于律己,严防死守信息泄露,成为居民信息的捍卫者,而非被误会成贩卖者。对于获得了合法经营资格、严格守法自律的数据处理企业,政府有关部门应当进行充分的肯定和鼓励。
实际上,已经有一部分有此意识的大数据从业人员开始这项工作。很多从业人员明确表示,在用户数据采用之前,必须进行“脱敏处理”,这样才能在获取数据的同时保护用户的信息安全。关于大数据导致信息泄露的说法,不少大数据从业者应该明确站出来表示这个“锅”不能背,也应该再次对大数据的应用进行深入浅出的科普。
《报告》的课题组专家建议,根据芝麻信用等征信机构形成的实践样本,提高征信机构和数据信息行业的准入门槛,建立个人信息分类保护、全面落实用户授权机制、严格规范内部管控流程、完善泄露危机应急预案。并且这一套流程应该形成标准,在日后的大数据应用中加以推广。
据《报告》披露,芝麻信用对合作伙伴的信息管理建立了“合作机构黑名单”制度,进行多渠道的数据舆情监测,一旦发现合作商户存在任何信息泄露或者违法违规采集或者贩卖用户信息,立即终止合作。
此外,包括芝麻信用在内的一部分大数据企业,还在内部建立严格规定,在信息采集中,不可采用聊天、通话等个人隐私信息,也不能跟踪用户在社交媒体上的言论信息。
互联网法治研究中心执行主任刘晓春表示,不能因为存在违法的数据黑色产业链,就对数据行业“谈虎色变”,应当建立完善的市场信息和信誉机制,避免劣币驱逐良币的恶性竞争,促进数据产业的健康、良性、有序发展。
因此,尽管大数据从业人员不用背数据泄露的“锅”,但却必须同时背负起保护居民信息的责任。应该看到,一个先于时代发展的朝阳产业,必须有这样的自觉和社会责任感。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23