CDA持证人阿涛哥

2022-05-30   阅读量: 654

数据分析师 统计学

CDA L1学习笔记 维度 度量 与指标

扫码加入数据分析学习群

城市 人口 /人 面积 /平方千米 人口密度/人每平方千米

上海 2400万 6300 3800

北京 2300万 16300 1400

image.png


维度,度量,指标这三个是一种相对概念


维度:
说明数据,多是分类型数据,非数值型数据 维度是指可指定不同值的描述性属性或特征。常见的就是时间维度和空间位置维度。例如上图中的“城市名称”这个维度字段,本质上就是一个空间位置维度,这个维度字段的值可以为“旧金山”、“柏林”或“新加坡”。


度量:

数据对象自身带有的数值,多是连续性数据,数值型数据。例如上表中的“人口”字段和“面积”字段,他们的字段值都是连续性的数值。


指标:

通过对数据对象的维度和度量或者度量与度量进行组合加工后计算出的某种值。例如,维度“城市”可以关联指标“人口”,其值为具体城市的居民总数。“城市“,“人口“与“面积”可组合成某城市人口密度这个指标。


有些时候我们不区分维度与指标,只把数据分成维度字段与度量字段,这时候维度字段就是字段值为分类型数据,非数值型数据的字段,度量字段就是字段值为连续性数据,数值型数据的字段。


维度和指标的关系:
虽然维度和指标可以独立使用,但常见的还是相互结合使用。维度和指标的值以及这些值之间的关系,使数据具有了意义。
为了挖掘尽可能多的深层次信息,维度通常与一个或多个指标关联在一起。例如,维度“城市”可以与指标“人口”和“面积”相关联,有了这些数据后,系统还可以创建“人口密度”等比值指标,带来有关这些城市的更详细的深入信息。


度量:
事实表和维度交叉汇聚的点,度量和维度构成OLAP的主要概念,这里面对于在事实表或者一个多维立方体里面存放的数值型的、连续的字段,就是度量。这符合上面的意思,有标准,一个度量字段肯定是统一单位,例如元、户数。如果一个度量字段,其中的度量值可能是欧元又有可能是美元,那这个度量可没法汇总。在统一计量单位下,对不同维度的描述。


指标与度量的关系:这就得说到指标,我愿意表述为"它是表示某种相对程度的值"。区别于上面的度量概念,那是一种绝对值,尺子量出来的结果,汇总出来的数量等。而指标至少需要两个度量之间的计算才能得到,例如收入增长率,用本月收入比上上月收入。当然可能指标的计算还需要两个以上的度量。


学习更多数据分析知识欢迎访问 https://www.cda.cn/member.html?utm_source=weitao


240.0012 2 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子