数据建模是什么意思?在创建过程中需要注意什么?
2020-07-06
9190
数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。
在数据分析与挖掘中,我们通常需要根据一些数据建立起特定的模型,然后处理。模型的建立需要依赖于算法,一般,常见的算法有分类(有明确类别)、聚类(无明确类别)、关联、回归等。
数据分类主要处理现实生活中的分类问题,一般处理思路如下:
(1)首先明确需求并对数据进行观察;
(2)其次,确定算法;
(3)确定步骤;
(4)编程实现。
数据建模的目标
确保准确表示数据库所需要的所有数据对象。
数据模型有助于在概念、物理和逻辑层面设计数据库。
数据模型结构有助于定义关系表、主键和外键以及存储过程。
提供了基本数据的清晰图像,数据库开发人员可以使用它来创建物理数据库。
有助于识别缺失项和冗余数据。
虽然在开始阶段,数据建模费时费力,但从长远来看,可以是我们的基础架构易于升级和维护。
数据建模的原则:
1. 保证系统中的数据都是干净、有效的,异常和错误数据不能存在。
2. 最好将所有信息尽可能完整、完全记录下来,以防丢失重要历史信息。
3. 使系统具有可扩展性,这样不仅能容易满足以后的需求变动,而且又能使变动前后的数据格式相兼容。