DA弯道超车

2022-06-02   阅读量: 1550

数据分析师 数据库 Mysql

星型模型、雪花模型、星座模型——数据模型看这篇文章就够了。

扫码加入数据分析学习群

记住下面的总结就够了。

星型——中间事实表,周围维度表

雪花——中间事实表,周围是维度表,维度表再分出来维度表

星座——星型拓展,多个事实表共用某个维度表

==========================================

为了加深印象,详述如下。

星型模型

星型模型中只有一张事实表,以及0张或多张维表,事实表与维表通过主键、外键相关联,维表之间不存在关联关系,当所有维表都关联到事实表时,整个图形非常像一种星星的结构,所以称之为“星型模型”。

image.png

星型模型是最简单最常用的模型。星型模型本质是一张大表,相比于其他数据模型更合适于大数据处理。其他模型可以通过一定的转换,变为星型模型。


星型模型的缺点是存在一定程度的数据冗余。因为其维表只有一个层级,有些信息被存储了多次。比如一张包含国家、省份、地市三列的维表,国家列会有很多重复的信息。



雪花模型

当一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型是对星型模型的扩展。它对星型模型的维表进一步层次化,原有的各维表可能被扩展为小的事实表,形成一些局部的"层次"区域,这些被分解的表都连接到主维表而不是事实表。

image.png


其优点是通过最大限度地减少数据存储量以及联合较小的维表来改善查询性能,避免了数据冗余。其缺点是增加了主键-外键关联的几率,导致查询效率低于星型模型,并且不利于开发。



星座模型

星座模型也是星型模型的扩展。区别是星座模型中存在多张事实表,不同事实表之间共享维表信息,常用于数据关系更复杂的场景。其经常被称为星系模型。

image.png


添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
52.4036 3 0 关注作者 收藏

评论(0)


暂无数据

推荐课程