京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据将有效应用于安全、身份和欺诈管理
21世纪以来,互联网、移动互联网、云计算、物联网导致计算环境发生重大变化,企业和组织投入大量资源改善IT安全基础设施,安全边界变得模糊和脆弱。但是各类安全事件层出不穷,国内外多起严重数据泄漏事件不断挑战安全意识底限。“恐惧源于无知”应用在信息安全领域同样适用,当各种复杂的防御机制也无法阻挡恶意入侵,当著名安全组织不断爆出安全漏洞,业内人士也在思考问题的症结。现有安全体系类似古代城堡,将重要资产(如企业内网等)使用高高的城墙(如防火墙等)团团围住。实际上,安全的边界变得模糊和脆弱,黑客攻击也具有系统化、长期化和经济利益驱动等特点,甚至有国家背景支持,城堡式安全体系已经无法适应新兴攻击技术的发展。国际安全会议RSA 2015年的主题“变化:挑战当前的安全理念”也正反应出安全界转换理念的共识。
预测攻击影响 提供主动防御
大数据的兴起为新一代安全技术提供思路,大数据开放组件为各类安全数据(如事件日志、数据包等)提供海量存储、实时处理和数据挖掘等功能,为安全厂商快速、有效建立数据分析平台提供便利。大数据技术在数据规模、数据易变性以及非结构化处理具有明显的优势,应用于安全领域主要体现在安全管理、身份管理和欺诈管理三大领域。
在安全管理方面,针对传统的威胁,防御和检测技术通常以特征检测为主,新型威胁更多利用0Day漏洞进行攻击。由于无法提前明确特征信息,导致防御侧已有SIEM系统及检测技术失效。企业和组织需要从被动防御转换到主动防御。根据多种渠道数据来源,威胁情报(Threat Intelligence)基于大数据处理和分析技术实现预测攻击影响以及识别未知威胁。通过威胁情况,安全人员在第一时间了解IT资产面临的新漏洞、新型攻击方法和工具,威胁环境变化等,在威胁溢出之前阻断攻击者。2013年以来,威胁情报一直保持北美安全技术发展的热点。此外,安全企业和组织也积极共享威胁情报信息,采用“群防群控”方式提升资源的利用率并将安全损失最小化。威胁情报共享以来数据的标准化和规范化,美国相关工作主要由政府部门和安全企业共同推动。2014年,Fortinet、Palo Alto等安全公司建立网络威胁联盟(Cyber Threat Alliance),共享威胁情报,全面提升威胁态势感知能力。美国将网络威胁情报信息共享视作提升其联邦政府信息系统安全的必要手段之一,NIST发布NIST SP 800-150网络威胁信息共享指南的草案,将信息共享、协调、协同扩展至计算机安全事件响应生命周期。
颠覆传统认证方式 识别欺诈特征
身份认证是信息系统中确认操作者身份的过程,也是授权操作的基础。传统的认证方式通过用户知道的秘密(口令等)、用户拥有的凭证(短信验证码等)和用户所属的特性(指纹等)来鉴别用户。上述技术面临以下问题:(1)数据泄漏严重,密码不可靠;攻击者通过泄漏数据、社工等方式很容易获得账号、密码;(2)作为常用的二次认证方式,短信验证码同样面临被截取的风险;U盾具有安全性优势,但使用不便;(3)生物认证的用户体验好,但适用范围受到限制,只能在支持生物特征识别的设备上运行。新型身份认证技术需要安全性和易用性的平衡。基于大数据的身份认证通过收集用户、设备等行为数据,分析获得用户和设备的行为特征,并判断当前认证是否满足已有特征,如不满足则叠加多种认证方式。因此也被称为自适应(Adaptive)或基于风险(Risk-based)认证。大数据身份管理的核心是风险的判定,依赖于用户行为(例如时间、IP)和设备行为(例如设备号、失败次数),通过安全策略控制认证方式,黑客可能窃取账号、密码之后也无法完成认证。同时,对于绝大多数正常用户可以简化认证流程。
反欺诈是大数据安全应用的另一类场景,例如Yahoo和Thinkmail利用大数据分析技术过滤垃圾邮件,DataVisor提供恶意账户识别技术帮助Yelp减少虚假评论。这类欺诈行为跟业务流程直接相关,用户的刷单、刷奖类营销欺诈,盗卡类交易欺诈以及商户和用户串谋欺诈等场景识别不尽相同。通过收集设备数据、用户数据和业务数据,结合机器学习技术,欺诈管理可以识别欺诈特征,提升欺诈成本。
当然,大数据作为新型安全技术也带来多方面挑战。首先是数据的可信度,大数据安全的效果严重依赖数据质量,低质量的数据可能导致错误的结论。机器产生数据的可靠性具有保障,但也无法完全避免伪造或刻意制造的数据。因此需要从数据来源的真实性、数据传播途径和数据处理过程等多方面确保数据的可信。其次,用户隐私保护也成为各方关注焦点,通过数据碎片还原出有价值的信息,可能属于数据拥有者不愿意被披露的敏感数据。大数据安全也需要从大数据存储、搜索和计算等多方面全面考虑用户的隐私保护问题。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】报表、数据源、客户、营销、业绩、销售、时效性、函数、可视化、运营、数据分析、数据报表、业务部门、数据运营 ...
2026-06-30在数据分析、商业预测、经济统计、运维监控等领域中,绝大多数业务数据都具备时间连续性特征,例如月度销售额、日度客流量、季度 ...
2026-06-30 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-06-30在 SQL Server 安装、服务启动、数据库文件操作等场景中,经常会遇到 “实例已在使用” 类报错,不同触发场景的原因与处理方式差 ...
2026-06-29在Excel数据统计、财务核算、销售复盘、库存盘点等办公场景中,经常需要在数据透视表中实现一列数据乘以另一列数据的计算需求, ...
2026-06-29在数据分析中,指标是连接业务与数据的核心语言。它并非一个简单的数字,而是一个将模糊的业务需求(如“提升用户粘性”)转化为 ...
2026-06-29【核心关键词】大数据、零售商、消费者、供应链、运营、企业、产品、客户、数据模型、大数据平台、数据开发、系统运维、业务逻 ...
2026-06-26在物流配送、供应链履约、终端供货等业务场景中,送货率是衡量企业履约能力、服务质量、供应链稳定性的核心业务指标,直接关联客 ...
2026-06-26 很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度” ...
2026-06-26在数字化管理与数据化运营体系中,指标是连接原始数据与业务决策的核心载体。零散的原始数据只是无意义的数值堆砌,无法直接反映 ...
2026-06-25在Excel数据汇总、财务统计、业务复盘等日常办公场景中,经常需要完成逐行相乘、整体汇总求和的计算需求,最典型的场景就是:单 ...
2026-06-25 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-06-25【核心关键词】主数据、资产、供应商、现金流、企业、精细化、集团、数字化、中国、数据质量、数据管理、经营管理、地产行业、 ...
2026-06-24在数据分析、假设检验、AB测试、学术研究等统计场景中,显著水平(α)与P值(P-value)是判断统计结果是否具有统计学意义的两个 ...
2026-06-24小李刚入职了一家互联网公司的运营部门。第一次参加业务复盘会,运营主管问了一个看似简单的问题:“这个月新用户留存率下降了5 ...
2026-06-24在数字化转型全面渗透的产业背景下,数据分析已成为互联网、金融、零售、制造等几乎所有行业的核心岗位能力。很多初学者对数据分 ...
2026-06-23在企业并购、股权定价、投融资评估、资产核算等资本市场核心场景中,市场法是应用最广泛、市场认可度最高的企业价值评估方法。传 ...
2026-06-23 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-06-23【核心关键词】运营、证书、金融、客户、产品、软件、销售额、量化、科技、数据分析、金融行业、证券类软件、业务流程、金融机 ...
2026-06-22在企业方案选型、产品迭代评审、供应商筛选、运营效果复盘等决策场景中,单一指标的优劣判断往往无法支撑科学决策。一套转化效果 ...
2026-06-22