京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据产业面临三大难题 导致安全漏洞难补
“大数据隐私的保护难度较其他安全问题更为突出,不仅需要从技术、产业与管理维度来进行多方保障,还需要从人才、法规等方面给予支持。”中国工程院院士、中国互联网协会理事长邬贺铨日前在一个论坛上提出,在大数据给人们带来便捷生活的同时,如何保护用户隐私,日益成为大数据发展的重大挑战。
“大数据时代”隐私何在
许多人都有过这样的烦恼,工作或者生活中,冷不丁的常接到陌生电话,追问自己大到买房卖房,小到餐桌地毯购置的“近期计划”。这种烦恼的源头,可能仅因为你在一次毫不在意的产品咨询会上留下了自己的联系方式。
这种所谓的行业“连锁服务”,与其说是跟踪服务,不如说是莫名困扰。究其原因,其实是大数据行业的数据滥用。
“现在就大数据来说,人的任何行为尤其是我们作为用户和消费者,任何的消费习惯、消费数据,包括交易信息,都可能存在网络上,而这个网络又不是绝对安全的。”中国电子商务研究中心研究员董毅智律师在接受《中国企业报》记者采访时说,美国的社交网站,包括中国一些社交网站都爆出过大面积的用户信息泄露事件,给每个用户造成了很大的威胁。这就意味着,在“数据滥用”的背后,一方面是对用户隐私的不尊重,一方面暴露了国家法规监管的空白。因为用户需要的服务,是精准定位而不是“精准骚扰”。
董毅智由此认为,大数据的爆发式发展,凸显出了信息安全的重要性和迫切性。
据介绍,我国的相关法律,对于互联网规范化运营作出相应规定。不过,业内外人士一直追问的是,如何让这些互联网企业自觉遵守法律,如果出现问题,对违规、违法者如何进行及时、有力的约束和惩治。对此,董毅智认为,“只有解决了法治问题,才可能解决数据滥用问题。”
数据产业的难点
解决大数据时代的信息安全,显然时不我待。对此,赛迪顾问电子信息产业研究中心分析师向阳博士在接受记者采访时表示,目前,国内大数据市场的运营与管理,有亟待解决的三个难点。
第一,缺乏国家层面的统一开放数据库。北京、上海、无锡等地,已经出现政府数据开放平台,但地方采用开放格式的比例均偏低,同时,开放程度在各地的统计口径上不尽一致,这也导致数据价值偏低。此外,在数据使用权利上,无法确保数据永久免费开放,数据提供的基本元、数据发布时间不明确等一系列问题,导致数据不能及时、有效地交流反馈,也成为大数据发展的巨大障碍。
再就是企业开放的数据,均存在变现途径少、利益归属不明晰的问题。企业在部署大数据时,越来越看重来自外部的数据源。但是很多企业受困于数据本身,大量的数据,其时间跨度久远、内容形式多样、体量庞大繁复,这就意味着,它很难将其真正地转化成对企业或社会有价值的“数据资产”。在数据交易过程中,价值归属的不明确和定价机制的不成熟,也是企业在交易市场徘徊不前的原因之一。
难点之三就是,大数据的4V特征,使得监管更加困难。非结构化数据的大量涌入,数据之间的关联性更加复杂,数据4V特征中的量大、多样性、实时性等特性,无一不对安全监管提出了严峻挑战。
面对新兴事物的快速发展,政府和企业能否在监管政策和技术升级上及时跟进,将直接决定数据安全的保障力度。
各方联手共治共防
大数据产业在发展中出现的“肠梗阻”,当然引起了政府重视。在不久前召开的“第十三届中国信息港论坛”上,工信部网络安全管理局局长赵志国表示:我国正在积极推进《电信法》立法进程。若进程顺利,有望于2016年出台“网络安全法”。
对公众历经约10余年漫长期待的《电信法》,有关方面表示,其对大数据的法治将有所体现,至于新法接下来如何规范和完善大数据安全问题,主要从面临的四个问题出发:第一是黑客攻击,第二是病毒渗透等传统网络问题向大数据领域渗透,第三是数据滥用、数据窃取、核心技术缺乏自主可控和数据权属等问题。
向阳在接受《中国企业报》记者采访时表示,建立完善的政策法规是数据开放的重要保障,在数据开放的初期,由于政府各个环节对未来风险的不可知性,应该建立健全政府数据资源共享的政策措施、标准体系和规章制度,强化政府数据资源开放共享的组织协调、统筹规划和监督管理,减少数据泄密的可能。
“大数据信息安全不仅仅依靠国家的立法保护。”董毅智告诉记者,除了法律法规的保障,还需要发挥企业在整合组织数据、融合互联网数据上的安全脱敏技术和经验优势,利用一流的技术能力构建安全之门,共同建设大数据平台,保障大数据流通的可靠性。
为让大数据产业做到安全运营,企业的作用越来越重要。对此,董毅智认为,由于互联网的迅猛发展,法律法规的出台显得有一定的滞后性,法律规定跟现实的监管是有很大差异性的,很难及时满足互联网发展的需要。他建议专家团队,可以从两点向数据产业提供帮助:一是通过法律方面的专家,向国家或行业提供一些立法建议,让法律规范完善起来。二是提倡培养公民的自我保护意识、保护手段以及保护措施。由此可见,对信息安全的重视,实际上是公民自我保护意识的加强和国家法制的完善。
注重信息安全,并不意味着拒绝大数据给人们的生活和工作带来便利,隐私安全需要得到重视但不应该过度夸大,单个的人士是无法独立于数据世界之外的。对此,向阳表示:在个人可承受的意愿范围内,你对外界提供的数据越多,获得优质荒可能性也就越高,同时也有利于减少“重复广告”的骚扰。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06