京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据产业面临三大难题 导致安全漏洞难补
“大数据隐私的保护难度较其他安全问题更为突出,不仅需要从技术、产业与管理维度来进行多方保障,还需要从人才、法规等方面给予支持。”中国工程院院士、中国互联网协会理事长邬贺铨日前在一个论坛上提出,在大数据给人们带来便捷生活的同时,如何保护用户隐私,日益成为大数据发展的重大挑战。
“大数据时代”隐私何在
许多人都有过这样的烦恼,工作或者生活中,冷不丁的常接到陌生电话,追问自己大到买房卖房,小到餐桌地毯购置的“近期计划”。这种烦恼的源头,可能仅因为你在一次毫不在意的产品咨询会上留下了自己的联系方式。
这种所谓的行业“连锁服务”,与其说是跟踪服务,不如说是莫名困扰。究其原因,其实是大数据行业的数据滥用。
“现在就大数据来说,人的任何行为尤其是我们作为用户和消费者,任何的消费习惯、消费数据,包括交易信息,都可能存在网络上,而这个网络又不是绝对安全的。”中国电子商务研究中心研究员董毅智律师在接受《中国企业报》记者采访时说,美国的社交网站,包括中国一些社交网站都爆出过大面积的用户信息泄露事件,给每个用户造成了很大的威胁。这就意味着,在“数据滥用”的背后,一方面是对用户隐私的不尊重,一方面暴露了国家法规监管的空白。因为用户需要的服务,是精准定位而不是“精准骚扰”。
董毅智由此认为,大数据的爆发式发展,凸显出了信息安全的重要性和迫切性。
据介绍,我国的相关法律,对于互联网规范化运营作出相应规定。不过,业内外人士一直追问的是,如何让这些互联网企业自觉遵守法律,如果出现问题,对违规、违法者如何进行及时、有力的约束和惩治。对此,董毅智认为,“只有解决了法治问题,才可能解决数据滥用问题。”
数据产业的难点
解决大数据时代的信息安全,显然时不我待。对此,赛迪顾问电子信息产业研究中心分析师向阳博士在接受记者采访时表示,目前,国内大数据市场的运营与管理,有亟待解决的三个难点。
第一,缺乏国家层面的统一开放数据库。北京、上海、无锡等地,已经出现政府数据开放平台,但地方采用开放格式的比例均偏低,同时,开放程度在各地的统计口径上不尽一致,这也导致数据价值偏低。此外,在数据使用权利上,无法确保数据永久免费开放,数据提供的基本元、数据发布时间不明确等一系列问题,导致数据不能及时、有效地交流反馈,也成为大数据发展的巨大障碍。
再就是企业开放的数据,均存在变现途径少、利益归属不明晰的问题。企业在部署大数据时,越来越看重来自外部的数据源。但是很多企业受困于数据本身,大量的数据,其时间跨度久远、内容形式多样、体量庞大繁复,这就意味着,它很难将其真正地转化成对企业或社会有价值的“数据资产”。在数据交易过程中,价值归属的不明确和定价机制的不成熟,也是企业在交易市场徘徊不前的原因之一。
难点之三就是,大数据的4V特征,使得监管更加困难。非结构化数据的大量涌入,数据之间的关联性更加复杂,数据4V特征中的量大、多样性、实时性等特性,无一不对安全监管提出了严峻挑战。
面对新兴事物的快速发展,政府和企业能否在监管政策和技术升级上及时跟进,将直接决定数据安全的保障力度。
各方联手共治共防
大数据产业在发展中出现的“肠梗阻”,当然引起了政府重视。在不久前召开的“第十三届中国信息港论坛”上,工信部网络安全管理局局长赵志国表示:我国正在积极推进《电信法》立法进程。若进程顺利,有望于2016年出台“网络安全法”。
对公众历经约10余年漫长期待的《电信法》,有关方面表示,其对大数据的法治将有所体现,至于新法接下来如何规范和完善大数据安全问题,主要从面临的四个问题出发:第一是黑客攻击,第二是病毒渗透等传统网络问题向大数据领域渗透,第三是数据滥用、数据窃取、核心技术缺乏自主可控和数据权属等问题。
向阳在接受《中国企业报》记者采访时表示,建立完善的政策法规是数据开放的重要保障,在数据开放的初期,由于政府各个环节对未来风险的不可知性,应该建立健全政府数据资源共享的政策措施、标准体系和规章制度,强化政府数据资源开放共享的组织协调、统筹规划和监督管理,减少数据泄密的可能。
“大数据信息安全不仅仅依靠国家的立法保护。”董毅智告诉记者,除了法律法规的保障,还需要发挥企业在整合组织数据、融合互联网数据上的安全脱敏技术和经验优势,利用一流的技术能力构建安全之门,共同建设大数据平台,保障大数据流通的可靠性。
为让大数据产业做到安全运营,企业的作用越来越重要。对此,董毅智认为,由于互联网的迅猛发展,法律法规的出台显得有一定的滞后性,法律规定跟现实的监管是有很大差异性的,很难及时满足互联网发展的需要。他建议专家团队,可以从两点向数据产业提供帮助:一是通过法律方面的专家,向国家或行业提供一些立法建议,让法律规范完善起来。二是提倡培养公民的自我保护意识、保护手段以及保护措施。由此可见,对信息安全的重视,实际上是公民自我保护意识的加强和国家法制的完善。
注重信息安全,并不意味着拒绝大数据给人们的生活和工作带来便利,隐私安全需要得到重视但不应该过度夸大,单个的人士是无法独立于数据世界之外的。对此,向阳表示:在个人可承受的意愿范围内,你对外界提供的数据越多,获得优质荒可能性也就越高,同时也有利于减少“重复广告”的骚扰。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18