京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据安全分析不容忽视的三个真相
大数据分析工具与分布式数据库确实蕴藏着巨大潜力,有可能改变安全监控与调查工作的执行方式。然而这些与汇总安全数据并加速分析流程的创新途径也会带来很多不必要的麻烦。
这不仅是因为比起供应商们的卖力宣传,这些工具与服务其实很难被纳入业务流程当中,而且它们还会给不加批判使用这类方案的安全部门带来大量潜在风险。这一结论来自Rapid7公司首席研究官兼安全研究员H.D.Moore本周早些时候在本届于波士顿举行的联合国安全大会上的发言。
根据Moore的观点,大数据很可能给“攻击者与防御者双方的根本机制带来变化”。而且安全部门尤其需要从以下三个角度理解Moore在本届大会上的发言。
1. 大数据绝非魔法
根据Moore的论断,如今以大数据为核心的炒作之声甚嚣尘上,这一术语已经成为所有类型安全分析工具的必备宣传口号。安全业界几乎把它作为一句咒语来膜拜,似乎只要有大数据存在,安全性的美梦就能最终实现。
“人们往往认为如果我们把所有数据都安置在一起,就能魔术般地实现安全性诉求。这当然只是种误解,”他指出。“在海量数据面前,我们可以通过深入钻研找到有价值的内容,从而获得显著的安全提升效果,但整个分析过程绝不可能手到擒来。”
如果没有专门的管理者打理执行流程、编写正确的查询指令并询问符合实际的安全问题,大数据其实根本无法带来什么实质性效果。“因此,请注意您的投资方向,并确保在向某款数据分析工具投资之前、至少已经有一家其它厂商也向其投过资。再有,我们的投资数额不要超过对方,”他指出。
2. 把所有鸡蛋放在同一个摇摇欲坠的篮子当中
更令Moore感到忧心的是,虽然大数据安全分析工具层出不穷(包括自主研发与第三方提供),但这些工具本身的安全性其实并没有保障。
“我们看到众多以大数据工具包为核心创造出的方案——例如Mongo以及Cassandra——但这些工具中往往并没有加入安全机制,”他表示。举例来说,MongoDB在默认状态下并不支持SSL,而且与更加成熟的传统数据库相比、其安全级别还远远达不到要求、也没有提供类似的管理工具。“这实际上非常可怕,在默认情况下这些工具毫无安全性可言,但它们如今却已经被打包出售并充当大数据服务的后端。”
此同时,企业则将大量安全元数据、日志文件等等聚合在一起从而实现大规模分析,这种做法进一步加深了安全风险出现的可能性。
“企业正竭尽全力将所有能够获取到的数据集中起来保存在同一位置,”他解释道。“对于恶意人士来说,这种集中式存储方式无疑是最唾手可得的财富宝库。面对过去那些可怕的密码泄露事故,每位管理者都会感到不寒而慄。然而与未来可能由于大数据汇总所引发的TB级别数据泄露相比,过去那些事故简直不算什么。”
企业放置敏感安全数据的篮子不仅太大,而且放得也不太稳,这一切当然会令人忧心忡忡。
3. 依平均概率推算,分析服务供应商的违规事故即将出现
在多数情况下,鸡蛋篮子的倾覆普遍基于外部原因。随着大数据安全分析服务供应商逐步加入战团,企业如果不认真审查自己的供应商、其面临的风险状况将持续恶化,Moore警告称。
“安全服务供应商所处理的数据总量以及数据类型非常关键,”Moore进一步解释称。“大家会发现包括电话通话日志(谁打给谁、用户何时登陆等)以及其它敏感信息在内的数据都会被纳入到日志文件当中来。”
Moore认为,随着服务供应商在市场价值上的逐步拓展,他们使用的相关产品中不安全因素也将持续增加。供应商手中掌握的重要客户数据清单一天天膨胀,而这最终会导致大规模数据泄露事故——这一天已经不会很远。
“明年几乎必须会出现大问题,我们很可能看到某家大型分析服务供应商——无论是安全性、日志数据还是其它业务——遭遇违规事故,”他指出。“这与个人意见无关,而只是平均概率带来的必然结果。如今有很多家伙正努力打造产品与服务,虽然我们并不了解他们的具体执行流程,但数据泄露的出现将只是时间问题。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01在数据驱动决策的时代,企业与从业者每天都会面对海量数据——电商平台的用户行为数据、金融机构的信贷风险数据、快消品牌的营销 ...
2026-04-01在数字化转型的浪潮中,企业数据已从“辅助运营的附属资源”升级为“驱动增长的核心资产”,而一套科学、可落地的企业数据管理方 ...
2026-04-01在数字化时代,每一位用户与产品的交互都会留下可追溯的行为轨迹——电商用户的浏览、加购、下单,APP用户的注册、登录、功能使 ...
2026-03-31在日常数据统计、市场调研、学术分析等场景中,我们常常需要判断两个分类变量之间是否存在关联(如性别与消费偏好、产品类型与满 ...
2026-03-31在CDA(Certified Data Analyst)数据分析师的职场实战与认证考核中,“可解释性建模”是核心需求之一——企业决策中,不仅需要 ...
2026-03-31多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30在TensorFlow深度学习实战中,数据集的加载与预处理是基础且关键的第一步。手动下载、解压、解析数据集不仅耗时费力,还容易出现 ...
2026-03-30在CDA(Certified Data Analyst)数据分析师的日常工作中,“无监督分组、挖掘数据内在聚类规律”是高频核心需求——电商场景中 ...
2026-03-30机器学习的本质,是让模型通过对数据的学习,自主挖掘规律、实现预测与决策,而这一过程的核心驱动力,并非单一参数的独立作用, ...
2026-03-27在SQL Server数据库操作中,日期时间处理是高频核心需求——无论是报表统计中的日期格式化、数据筛选时的日期类型匹配,还是业务 ...
2026-03-27