京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据仓库必须保障可访问性和可用性
大多数人都理解企业数据破坏造成的负面效果。在解决数据仓库的安全性方面,有两个特别重要的问题。第一是,数据仓库必须能够控制数据访问权限(数据权利)。第二是,提供业务持续性和灾难恢复(数据可用性)。
在数据访问权限方面,系统需要给一些用户分配权限,同时拒绝其他用户访问。在大型数据仓库中,有大量的数据需要保护,并且通常还有大量不同的用户组。系统需要支持端到端作业方式--从分段表到运营数据存储、分析和报表结构。
此外,敏感数据也存在问题,如个人身份信息(PII)、HR数据和企业敏感信息。相对于其他类型的信息而言,这些数据需要更严格的保护和更仔细的审核,并且会混合到数据仓库的数据结构中。它可能需要进行加密,才能实现足够的保护要求。
将所有这些重要数据保存在一个位置是非常危险的,因为攻击者可以轻松收集到所有数据。然而,安全性是不固定的活动目标。人们可以来,也可以走。他们会改变工作职责。保持安全性一直是一个挑战。要在多个系统上实现安全性难度就更大。
注:如果一个来源的信息都很难保证安全,那么想要保证多个来源的信息安全性,难度就更大了。例如,用户可能能够查看人力报告系统的信息,但是无法查看HR系统记录的员工计时工资。尽管如此,这些信息都存储在数据仓库中,所以可以对人力成本进行分析。
如果一个数据仓库系统能够管理整个数据链,那么它就能够提供最容易管理的数据安全性。单个安全系统更容易维护和更新。保存唯一真实数据的大型数据仓库可以实现最安全的配置。PII可以进行加密或散列化,从而保护各个信息的保密性。此外,数据也可以进行汇总,使任意个体的信息都保持隐藏,且可以在分析过程中使用。
数据可用性变得越来越重要,因为一旦数据仓库成为企业报表数据的主要来源,那么它就成为企业中不可或缺的组件。这会对几个方面造成影响。首先,它会影响数据备份和恢复。大型数据仓库系统在为用户保证性能时,还必须同时运行备份过程。虽然单个大型系统的备份难度要大于一组小型系统的备份,但是它在备份操作管理和数据保护方面更简单一些。
注:如果可用时间较短,那么执行大型数据集合的备份和恢复是很困难的。在设计一个大型数据仓库系统时,这些操作所需要的时间必须仔细斟酌。
其次是可用性。单独的内聚系统可能会成为单一故障点。然而,在大多数情况中,系统可以设计消除这个故障点。这是一个必须认真考虑的问题。首先,数据仓库系统本身要具备应付内部故障的能力。其次,如果远程位置灾难恢复机制适合这种数据仓库,那么系统必须支持远程站点操作。远程站点数据的同步是一个严重的问题,它会随数据仓库的数据量增加而加剧。为了支持大型数据仓库,必须认真对待这些问题。
再次强调,单一系统的优点在于简化管理。如果一个系统设计良好,拥有清晰的可用性维护过程和流程,那么其24 × 7可用性保持难度会远远小于多个系统。从IT角度看,维护一个系统的难度通常会小于多个小型系统的维护。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】大数据、零售商、消费者、供应链、运营、企业、产品、客户、数据模型、大数据平台、数据开发、系统运维、业务逻 ...
2026-06-26在物流配送、供应链履约、终端供货等业务场景中,送货率是衡量企业履约能力、服务质量、供应链稳定性的核心业务指标,直接关联客 ...
2026-06-26 很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度” ...
2026-06-26在数字化管理与数据化运营体系中,指标是连接原始数据与业务决策的核心载体。零散的原始数据只是无意义的数值堆砌,无法直接反映 ...
2026-06-25在Excel数据汇总、财务统计、业务复盘等日常办公场景中,经常需要完成逐行相乘、整体汇总求和的计算需求,最典型的场景就是:单 ...
2026-06-25 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-06-25【核心关键词】主数据、资产、供应商、现金流、企业、精细化、集团、数字化、中国、数据质量、数据管理、经营管理、地产行业、 ...
2026-06-24在数据分析、假设检验、AB测试、学术研究等统计场景中,显著水平(α)与P值(P-value)是判断统计结果是否具有统计学意义的两个 ...
2026-06-24小李刚入职了一家互联网公司的运营部门。第一次参加业务复盘会,运营主管问了一个看似简单的问题:“这个月新用户留存率下降了5 ...
2026-06-24在数字化转型全面渗透的产业背景下,数据分析已成为互联网、金融、零售、制造等几乎所有行业的核心岗位能力。很多初学者对数据分 ...
2026-06-23在企业并购、股权定价、投融资评估、资产核算等资本市场核心场景中,市场法是应用最广泛、市场认可度最高的企业价值评估方法。传 ...
2026-06-23 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-06-23【核心关键词】运营、证书、金融、客户、产品、软件、销售额、量化、科技、数据分析、金融行业、证券类软件、业务流程、金融机 ...
2026-06-22在企业方案选型、产品迭代评审、供应商筛选、运营效果复盘等决策场景中,单一指标的优劣判断往往无法支撑科学决策。一套转化效果 ...
2026-06-22 很多数据分析师掌握了Excel函数、会写SQL查询,但当被问到“数据从哪里来”“数据加工有哪些步骤”“如何使用分析工具连接数 ...
2026-06-22【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17