想入门大数据分析？先来认识数据吧-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读想入门大数据分析？先来认识数据吧

想入门大数据分析？先来认识数据吧

2017-04-11

想入门大数据分析？先来认识数据吧

正确认识数据是数据分析的第一步，云途君带你认识数据的4种分类和不同类别数据的解读方法。

以云途君为例，对应四种不同类型的数据，可以这样做自我介绍：

国籍：中国-------- 定类数据（Nominal）

健康状况：良好---- 定序数据（Ordinal）

体温：36.2度------- 定距数据（Interval）

体重：56公斤------ 定比数据（Ratio）

以上的四个数据分别对应了4种不同类型的数据，每种类型的数据具有其自身的特征也对应着不同的解读方法。

1、定类数据（Nominal）

用于代表不同类别的事物，各个类别之间没有等级次序之分。例如：颜色，红色和蓝色没有优劣之分只是类别不同。

这类数据通常使用字符或者数字代号标示，例如电话号码区号010是北京的区号，021是上海的区号。

定类数据在数据分析中较为常见的应用场景是用户分群，将用户数据标签化，再按照不同的标签对用户进行分群，相同的标签表明具有相同属性的一类人群。

例如不同支付方式的性别分群，男性有55人，女性有60人分别占47.83%和52.17%，定类数据的类别较少时建议使用饼图，且“饼图”能表达出不同类别的占比情况。

但是“饼图”不适用于类别较多的情况。例如要分析56个民族不同人群的支付方式就不适合使用饼图，通常多个类别使用柱状图展示分析结果。

如下图是服装零售商的商品类别统计图：

定类数据在数据分析中通常被视作维度是离散型数据，也就是我们常说的观测数据的视角，用于对事物定性，并且对于定类数据只能进行计数运算，不能进行加减乘除操作。

2、定序数据（Ordinal）

不仅能够代表事物的分类，还能代表事物按照某种特性的排序，各个类别之间存在等级次序之分，等级之间差距不易衡量。

例如： “健康状况”，健康状况“良”与健康状况“良好”到底差距有多大，不太容易衡量，但是 “良好”肯定优于“良”。

这类数据通常也是使用字符或者数字代号标示，仍然用健康状况举例，使用1代表好、2代表良好、3代表良，但是用1除以2得出的0.5并不代表任何含义。所以定序数据与定类数据一样，他们只能进行计数操作不能参与加减乘除的运算。

通常定序数据也被视为数据分析中的维度数据是离散型数据，分析方法与定类数据的分析方法基本相同。

定序数据最重要的意义代表了一组数据中的某种逻辑顺序。

3、定距数据（Interval）

没有绝对零点，“0”是尺度上的一个点，不代表“不存在”，可以比较大小，两个值的差有实际意义，通常以数值形式标示。例如： “温度”，0度不代表没有温度，云途君的体温36.2度，相对于37度，云途君体温低但依然是正常体温。

定距数据进行计算后，可衍生出一组新的定类数据，比如，百分制考试成绩，分值之间的间隔设定为10分，即60~70分为一档，70~80分为一档，80~90分为一档。

定距数据只能进行加减运算，不能进行乘除运算。例如，某同学的期末考试成绩数学70分，物理80分，80除以70得出的数据是没有意义的，但是我们可以说物理成绩比数学成绩高10分，这个数据是有意义的，至少代表了这次物理考试比数学考试考得好。

定距数据在数据分析中通常被称为度量，用于对某一维度的定量描述。

思考一下

全班期中考试的数学平均分是多少分，这个命题如何计算？其中，会用到哪些数据，这些数据都是什么类型的数据？定距数据不能参与乘除运算为什么还要计算平均数？

4、定比数据（Ratio）

有绝对0点，“0”表示没有或者不存在，通常以数值形式标示是连续型数据，一般来说定比数据不可能取负值或零值。例如：体重、身高。体重50公斤与51公斤之间的差距是相对于1公斤进行放大的多少倍，所以在数据分析中，定比数据可以进行加减乘除运算，其天然的带有倍数关系。

例如下图中的营业额和订单量，同比的概念就使用了倍数关系。

以上4个不同的数据之间可以通过运算进行相互转换，但当数据具有绝对的某种数据特征时要注意是否恰当的使用了某种运算对数据进行分析。

此外，前文例举的都是数据特征较明显的情形，但是在实际数据分析过程中某些数据的特征辨识度较低，需要不断的练习才能准确的对数据用恰当的方法进行分析。

小结

定类数据：有类无序，计数，离散，维度

定序数据：有类有序，计数，离散，维度

定距数据：数字，0有意义，连续，加减，度量

定比数据：数字，无0无负，连续，加减乘除，度量

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

数据分析特征柱状图大数据

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇图论在大数据分析中的作用！

下一篇CDA认证再升一档！与国家共同推进大数据人才培养标准教育事业！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

想入门大数据分析？先来认识数据吧

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】SQL Server 提示“实例已在使用”：常见 ...

【CDA干货】Excel数据透视表两列相乘：正确计算方法 ...

从“模糊需求”到“精确标尺”：CDA数据分析师视角 ...

CDA持证人专访：冯卓基谈大数据平台搭建与行业数字 ...

【CDA干货】基于月度数据的送货率提升专项数据分析 ...

从“样本均值”到“总体真相”：CDA数据分析师视角 ...

【CDA干货】指标：量化业务的核心衡量标准与设计指 ...

【CDA干货】Excel透视表计算字段：先乘法后求和汇总 ...

从“杂乱”到“有序”：CDA数据分析师视角下的数据 ...

CDA持证人专访：崔爱军谈地产行业数据治理与数据中 ...

【CDA干货】显著水平与P值的核心区别、关联关系及实 ...

为什么统计是数据分析师的“底层语言”？ ...

【CDA干货】数据分析核心技能体系：从工具落地到业 ...

【CDA干货】企业价值市场法价值比率与线性回归分析 ...

从“零散明细”到“多维洞察”：CDA数据分析师视角 ...

CDA持证人专访：赵君研谈金融行业数据分析与运营岗 ...

【CDA干货】多维度对比评估：分析逻辑与可视化效果 ...

从“静态数据”到“动态资产”：CDA数据分析师视角 ...

CDA持证人专访：贺译册谈产品经理的市场洞察力与数 ...

【CDA干货】多维度对比评估：分析逻辑与可视化效果 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载