登录
首页精彩阅读R语言案例分析:多元数据的基本统计分析
R语言案例分析:多元数据的基本统计分析
2017-02-22
收藏

R语言案例分析:多元数据的基本统计分析

我们利用该数据集中的Case1来完成下面的R语言操作:

 

> options(digits = 4) #输出结果位数
> par(mar=c(4, 4, 2, 1) + 0.1, cex=0.8) # 图形修饰
> case1 <- read.csv("clipboard", header=T, sep = "\t") #复制表中的数据,直接创建case1
> head(case1)

地区 性别 教育程度   观点 年龄 月收入 月支出
1    A   女       中 不支持   55   2299   1423
2    A   女       低 不支持   39   3378   2022
3    A   女       中   支持   33   3460   1868
4    B   男       高  支持   41   4564   1918
5    B   女       高 不支持   55   3206   1906
6    A   女       中 不支持   48   4043   2233
> summary(case1)

地区    性别     教育程度     观点     年龄          月收入         月支出    
 A:204   男:603   低:319   不支持:628   Min.   : 6.0   Min.   : 637    Min.   : 797  
 B:401   女:597   高:303   支持  :568  1st Qu.:34.0    1st Qu.:2388     1st Qu.:1722  
 C:384          中:578   NA's  : 4   Median :40.0    Median :2978     Median :1993  
 D:211                          Mean   :40.1   Mean   :3006    Mean   :1997  
                              3rd Qu.:47.0    3rd Qu.:3624     3rd Qu.:2262  
                              Max.   :72.0   Max.   :6239    Max.   :3385
# 定性分析
> attach(case1) #绑定数据
> T1 <- table(地区)> T1

地区
A   B   C   D
204 401 384 211
> barplot(T1) #绘制条形图

# 定量分析 > f <- hist(月收入) #直方图

# 定性定量分析 > boxplot(月收入~性别) #箱线图

 

> t.test(月收入~性别) #t检验
Welch Two Sample t-test

data:  月收入 by 性别
t = 0.51, df = 1200, p-value = 0.6
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -75.43 128.49
sample estimates:
mean in group 男 mean in group 女
         3019         2993
# 接受男女的月收入无显著差异的假设(p>0.5)

# 二维列联表分析
> T2 <- table(性别, 观点)
> T2
     观点
性别 不支持 支持
  男    319  282
  女    309  286
> barplot(T2, beside = TRUE) # 条形图

 

> barplot(T2, beside = F) # 条形图

 

# beside=T表示绘制分组条形图,beside=F表示绘制堆叠条形图

# 多维列联表分析
> T3 <- ftable(性别, 教育程度, 观点) # 创建一个紧凑的"平铺"式列联表
> T3
              观点     不支持 支持
性别 教育程度                 
男   低                81   88
    高                78   66
    中                 160  128
女   低                82   68
    高                86   72
    中                 141  146
> barplot(T3, beside = TRUE, col = 3:4) #条形图

 

> T4 <- ftable(教育程度, 性别, 观点)
> T4
                       观点 不支持 支持
教育程度   性别                 
低       男           81   88
        女           82   68
高       男           78   66
        女           86   72
中       男           160  128
        女           141  146
> barplot(T4, beside = TRUE, col = 3:4) #条形图

> detach(case1) #解除绑定

数据分析咨询请扫描二维码

客服在线
立即咨询