京公网安备 11010802034615号
经营许可证编号:京B2-20210330
你需要知道的四类数据环境
詹姆斯·马丁提出“数据环境”概念,就是为了进行数据的有序化管理工作。他在《信息工程》和《总体数据规划方法论》中将计算机的数据环境分为4种类型,要求我们清楚地了解它们之间的区别和各自的特征。

第一类数据环境:数据文件。早期的数据处理还没有出现数据库管理系统(实际上是一种操纵数据库的软件),系统分析员和程序员根据应用的需要,用程序语言分散地设计实现各种数据文件。这是一种数据组织技术简单、相对容易实现的数据环境。但随着应用程序增加,数据文件数据剧增,会导致很高的维护费用,并且一小点应用的变化都将引起连锁反应,使修改又慢又贵,并很难进行。
第二类数据环境:应用数据库。后来,虽然出现了数据库管理系统,但系统分析员和程序员根据报表的原样“建库”。由于没有在数据分析和组织上下功夫,为分散的应用设计分散的“数据库”实际上并不具备数据库的品质,不能支持数据的共享,因此叫做“应用数据库”。实际上,这种数据环境中的信息系统像数据文件环境一样,随着应用的扩充,应用数据库也在剧增。在这种数据环境中的信息系统,其维护费用仍然很高,有时甚至高于第一类数据环境。该类数据环境还没有发挥使用数据库的主要优越性。
第三类数据环境:主题数据库。这是一种真正意义上的数据库,经过科学的规划与设计,其结构与使用它的处理过程是独立的。各种面向业务主题的数据,如顾客数据、产品数据或人事数据,通过一些共享数据库被联系和体现出来。这种主题数据库的特点是:经过严格的数据分析,建立模型需要花费时间,但其后的维护费用很低。最终(但不是立即)会使应用开发加快,并能使用户直接与这些数据库交互使用数据。建立这种数据环境,需要改变传统的系统分析方法和整个数据处理的管理方法,如果不善,也会蜕变成第二类(或者可能是第一类)数据环境。
第四类数据环境:信息检索系统。建立这种数据环境的目的是保证信息检索和快速查询的需要,以支持高层管理和辅助决策,而不是大量的事务管理。后来,称这种数据环境为数据仓库,它是面向主题的、单一的、完整的和一致的数据存储。数据从多种数据源获取,经过加工成为最终用户在一定程度上可理解的形式。可以说数据仓库是主题数据库的集成,是深加工的信息。
主题数据库与企业中的各种业务主题相关,而不是与具体的计算机应用程序相关。企业中需要建立的典型的主题数据库有:产品、客户、零部件、供应商、订货、账户、员工、文件资料、工程规范等。各种应用程序是使用这些主题数据库的,有的应用程序只存取一两个主题数据库,有的应用程序要与多个主题数据库打交道。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26