登录
首页精彩阅读SPSS-数据处理-数据变量
SPSS-数据处理-数据变量
2017-03-04
收藏

SPSS-数据处理-数据变量

spss工具中”行“用【个案】表示,“列”用【变量】表示。变量其实也就是我们在数据库中称之为字段的概念。但是在统计学中,我们称之为变量。

接下来主要介绍两点有关变量的基础知识:一、变量的数据类型         二、变量的尺度

一、变量的数据类型

从所周知,变量分为不同的数据类型,分别是:a:数值型数据、b:字符型数据、c:日期型数据。

a:数值型数据:直接使用自然数或度量单位进行计量的数值数据。例如:收入、年龄、体重、身高这几个变量均为数值型数据。可以直接用算术运算方法进行汇总和分析,这是区分是否是数值型数据的重要特征

b:字符型数据:也成为文本数据,由字符串组成,它是不能进行算术运算的文字数据类型。它包括中文字符、英文字符、数字字符(非数值型)等字符。例如姓名、性别、省份这几个变量均为字符型数据。字符型数据是一种分类数据,例如性别可以分为男、女两类。省份可以分为好多省,我们可以通过对这些分类数据进行分类研究,从而更全面的掌握事务特征


c:日期型数据:用于表示日期或时间数据,它可以进行算术运算,所以它是一种特殊的数值型数据。主要应用在时间序列分析中。

二、变量的尺度

上面介绍的数据类型主要是数据库中的语言,有的时候仅用数据类型不能准确的说明变量的含义和属性。为了更好的说明变量的含义和属性,在统计学中就采用了变量尺度这个概念。举例:

职业变量,1代表白领、2代表蓝领、3代表金领,这时1、2、3只是个标记,属于并列关系,没有次序关系。

职级变量,1代表初级、2代表中级、3代表高级,这时1、2、3不只是个标记,还有次序关系。

年龄变量,1代表1岁、  2代表2岁、 3代表3岁,  这时1、2、3不只是个标记,还有次序、大小关系,可以做算术运算。

职业职级年龄三个变量的数据类型都是数值型,但数值的集体含义不同,适用的统计方法也不同,这时就必须给数据变量增加一个测量尺度属性。

尺度属性从低到高分为四个层级:a:定类尺度、b:定序尺度、c:定距尺度、d:定比尺度。

a:定类尺度:是对事物类别和属性的一种测度。               特点:其值只能代表事物的类别和属性,不能比较各类别之间的大小,例如性别、职业这两个变量。spss中用【名义(N)】表示。

b:定序尺度:是对事物之间等级或者顺序的一种测度。   特点:其计算结果只能排序,                    不能进行算术运算,                 例如学历、职级这两个变量。spss中用【序号(O)】表示。

c:定距尺度:是对事物次序之间间距的一种测度,只可以进行加减运算、不能进行乘除运算,不仅能对事物进行排序,还能准确计算次序之间的差距是多少,例如温度、时间这两个变量。spss中用【度量(S)】表示。

d:定比尺度:是测量两个测量值之间比值的一种测度。它能够进行加减乘除运算,例如收入、用户数这两个变量。它与定距尺度最大的区别在于它有一个固定的绝对“0”值,而定距尺度没有。在定距尺度中“0”不表示没有,它只是一个测量值;而在定比变量中“0”就表示没有。spss中用【度量(S)】表示。数据分析师培训


数据分析咨询请扫描二维码

客服在线
立即咨询