京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代,拿什么终结信息乱象
高考考生即将迎来填报志愿环节,也是教育骗局最猖獗之时。个人信息泄露,早就不是新鲜事。但值得关注的是,随着移动互联技术的快速发展,信息泄露已呈全方位态势。
日前,广东省教育厅发布《广东省普通高等学校一览表》,并曝光带“广东/广州”字样的12所假冒大学。羊城晚报记者据此调查发现,与“虚假大学”“野鸡大学”联系密切的考生个人信息买卖现象依然嚣张。在以“高考名单”“招生资源”等为名的QQ群中,有群主称千元就可买到汕尾3万多名考生的信息,其所发截图的13则信息中,有10则能联系到相关考生。
此类事件不单单是诈骗案件问题,涉及到更深层次的大数据时代个人信息泄露及其防范与管控等社会性问题。
一般认为个人信息是一切可以识别自然人的信息的总和,这些信息包括了一个人生理的、心理的、智力的、个体的、社会的、经济的、文化的、家庭的等等方面。6月1日实施的《中华人民共和国网络安全法》对个人信息作了明晰的界定。然而,随着大数据技术的普及,个人信息内涵发生了极大的扩展。
大数据是指以多元形式,自许多来源搜集而来的庞大数据组。经过行业信息化建设,医疗、交通、金融等领域已经积累了许多内部数据,构成大数据资源的“存量”。
而移动互联网和物联网的发展,大大丰富了大数据的采集渠道,来自外部社交网络、可穿戴设备、车联网、物联网及政府公开信息平台的数据都成为大数据增量数据资源的主体。
当前,移动互联网的深度普及,为大数据应用提供了丰富的数据源。这些看似不相干的个人行为信息,经过大数据公司的云处理分析,却互相关联,极具社会价值和商业价值。比如,登录各种吃喝玩乐软件的账号,需要手机认证甚至实名认证,原本分散的信息就这么被串联了起来;再比如,打车软件的行车记录,结合时间就能精确定位出你的家、单位、常去地点。
这些数据对于商家来说,无异于金矿,它可让商家快速精准地找到自己的用户,把产品或服务推销出去。但另一方面,不法分子有了获取不当利益的技术手段。这也是中国地下数据黑市规模不断壮大的根本原因。个人信息趋于数据化、网络化和社会化,也使得个人信息更容易被非法获取和买卖。
一些技术先进的大数据公司隐藏在利益链条上,游走在灰色地带,通过产业链以贩卖、加工、销售数据的方式获取暴利。如某些数据公司,成立子公司,负责收购黑市数据,数据汇总后,再经过清洗和挖掘,出售给其他公司;再如,一些公司通过正规渠道和价格,获得数据接口,但调用数据的时候,会在“本地设备”上形成一个“缓存库”,当数据积累到一定程度后,就将这些“缓存库”再拿出去二次销售。
近日,监管部门正对数据乱象出手,开始清理行动,15家大数据公司被列入调查名单。这似乎是国家介入以规范数据行业的重大信号。
中国大数据产业仍处于非常早期的阶段。大数据交易乱象折射出大数据市场野蛮生长的主要矛盾,即大数据的产业化利用与个人隐私保护之间的矛盾。《网络安全法》首次在法律层面规定了个人信息保护的基本原则,明确指出,收集适用信息应经用户明示同意,不得收集无关信息,不得向他人提供个人信息,经过处理无法识别特定个人且不能复原的除外,不得非法出售个人信息。
但总体上,中国大数据产业的信息安全和数据管理体系尚未建立。迄今为止,有关公民个人信息保护的法律法规总体较为分散,尚未形成系统、有效的有关公民个人信息保护的法律框架体系,这使得在日新月异的大数据技术面前,普通民众根本无力抵御外界对个人信息的侵犯。在这种情况下,通过立法保护个人隐私数据信息应是必由之路。
在此基础上,要建设数字隐私权基础设施,推动相关立法进程打造良性的信息生态,以期建立兼顾安全与发展的数据开放、管理和信息安全保障体系。对于公民个人而言,在享受大数据时代所带来个性化服务的同时,应当加强风险防范意识,在有可能留下隐私数据的情形下要充分考虑隐私暴露而可能带来的不良后果,并采取相应的防范措施。
保护数据的隐私信息是数据搜集者和分析者应当具备的基本道德和责任。
随着监管趋严,大数据行业的整合在所难免,但总的趋势将有利于一些具有正规牌照、合法行业数据源,同时一直规范经营的优质企业脱颖而出。
根据中国信息通信研究院对国内800多家企业的调研来看,企业内部数据仍是大数据主要来源,但对外部数据的需求日益强烈。当前,有32%的企业是通过外部购买来获得数据。信息安全、开放共享等标准规范缺乏,技术安全防范和管理能力不够。如何促进大数据资源建设,提高数据质量,推动跨界融合流通,也是遏制数据黑市的关键问题之一。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21