京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代,拿什么终结信息乱象
高考考生即将迎来填报志愿环节,也是教育骗局最猖獗之时。个人信息泄露,早就不是新鲜事。但值得关注的是,随着移动互联技术的快速发展,信息泄露已呈全方位态势。
日前,广东省教育厅发布《广东省普通高等学校一览表》,并曝光带“广东/广州”字样的12所假冒大学。羊城晚报记者据此调查发现,与“虚假大学”“野鸡大学”联系密切的考生个人信息买卖现象依然嚣张。在以“高考名单”“招生资源”等为名的QQ群中,有群主称千元就可买到汕尾3万多名考生的信息,其所发截图的13则信息中,有10则能联系到相关考生。
此类事件不单单是诈骗案件问题,涉及到更深层次的大数据时代个人信息泄露及其防范与管控等社会性问题。
一般认为个人信息是一切可以识别自然人的信息的总和,这些信息包括了一个人生理的、心理的、智力的、个体的、社会的、经济的、文化的、家庭的等等方面。6月1日实施的《中华人民共和国网络安全法》对个人信息作了明晰的界定。然而,随着大数据技术的普及,个人信息内涵发生了极大的扩展。
大数据是指以多元形式,自许多来源搜集而来的庞大数据组。经过行业信息化建设,医疗、交通、金融等领域已经积累了许多内部数据,构成大数据资源的“存量”。
而移动互联网和物联网的发展,大大丰富了大数据的采集渠道,来自外部社交网络、可穿戴设备、车联网、物联网及政府公开信息平台的数据都成为大数据增量数据资源的主体。
当前,移动互联网的深度普及,为大数据应用提供了丰富的数据源。这些看似不相干的个人行为信息,经过大数据公司的云处理分析,却互相关联,极具社会价值和商业价值。比如,登录各种吃喝玩乐软件的账号,需要手机认证甚至实名认证,原本分散的信息就这么被串联了起来;再比如,打车软件的行车记录,结合时间就能精确定位出你的家、单位、常去地点。
这些数据对于商家来说,无异于金矿,它可让商家快速精准地找到自己的用户,把产品或服务推销出去。但另一方面,不法分子有了获取不当利益的技术手段。这也是中国地下数据黑市规模不断壮大的根本原因。个人信息趋于数据化、网络化和社会化,也使得个人信息更容易被非法获取和买卖。
一些技术先进的大数据公司隐藏在利益链条上,游走在灰色地带,通过产业链以贩卖、加工、销售数据的方式获取暴利。如某些数据公司,成立子公司,负责收购黑市数据,数据汇总后,再经过清洗和挖掘,出售给其他公司;再如,一些公司通过正规渠道和价格,获得数据接口,但调用数据的时候,会在“本地设备”上形成一个“缓存库”,当数据积累到一定程度后,就将这些“缓存库”再拿出去二次销售。
近日,监管部门正对数据乱象出手,开始清理行动,15家大数据公司被列入调查名单。这似乎是国家介入以规范数据行业的重大信号。
中国大数据产业仍处于非常早期的阶段。大数据交易乱象折射出大数据市场野蛮生长的主要矛盾,即大数据的产业化利用与个人隐私保护之间的矛盾。《网络安全法》首次在法律层面规定了个人信息保护的基本原则,明确指出,收集适用信息应经用户明示同意,不得收集无关信息,不得向他人提供个人信息,经过处理无法识别特定个人且不能复原的除外,不得非法出售个人信息。
但总体上,中国大数据产业的信息安全和数据管理体系尚未建立。迄今为止,有关公民个人信息保护的法律法规总体较为分散,尚未形成系统、有效的有关公民个人信息保护的法律框架体系,这使得在日新月异的大数据技术面前,普通民众根本无力抵御外界对个人信息的侵犯。在这种情况下,通过立法保护个人隐私数据信息应是必由之路。
在此基础上,要建设数字隐私权基础设施,推动相关立法进程打造良性的信息生态,以期建立兼顾安全与发展的数据开放、管理和信息安全保障体系。对于公民个人而言,在享受大数据时代所带来个性化服务的同时,应当加强风险防范意识,在有可能留下隐私数据的情形下要充分考虑隐私暴露而可能带来的不良后果,并采取相应的防范措施。
保护数据的隐私信息是数据搜集者和分析者应当具备的基本道德和责任。
随着监管趋严,大数据行业的整合在所难免,但总的趋势将有利于一些具有正规牌照、合法行业数据源,同时一直规范经营的优质企业脱颖而出。
根据中国信息通信研究院对国内800多家企业的调研来看,企业内部数据仍是大数据主要来源,但对外部数据的需求日益强烈。当前,有32%的企业是通过外部购买来获得数据。信息安全、开放共享等标准规范缺乏,技术安全防范和管理能力不够。如何促进大数据资源建设,提高数据质量,推动跨界融合流通,也是遏制数据黑市的关键问题之一。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21