2018-11-01
阅读量:
2098
双变量分析 - 分类和数值
带误差线的折线图
带有误差线的折线图将信息显示为由直线段连接的一系列数据点。每个数据点是分类变量的相应类别的数值数据的平均值,其中误差条显示标准误差。这是一种总结信息片段如何相互关联以及它们如何相互依赖的方式(iris_linechart.xlsx)。

组合图
组合图表使用两种或更多图表类型来强调图表包含不同类型的信息。在这里,我们使用条形图显示分箱数值变量的分布和折线图,以显示分类变量中所选类别的百分比。组合图是最好的可视化方法,用于演示预测器(X轴)对目标(Y轴)的可预测性。

Z检验和t检验
Z检验和t检验基本相同。他们评估两组的平均值是否在统计上彼此不同。该分析适用于比较两类分类变量的数值变量的平均值。

如果Z的概率很小,则两个平均值之间的差异更显着。
t检验
当n1或n2小于30时,我们使用t检验代替Z检验。

示例:在两个不同类别的分类变量(O-Ring Failure)中,数值变量(温度)的均值(平均值)之间是否存在显着差异?
O形圈失效 温度
低概率(0.0156)意味着失败的O形环的平均温度与完整的O形环的平均温度之间的差异是显着的。
方差分析(ANOVA)
ANOVA检验评估两组以上的平均值是否在统计学上彼此不同。该分析适用于比较分类变量的两个以上类别的数值变量的平均值。


示例:
在分类变量(Outlook)的三个类别中,数值变量(湿度)的平均值之间是否存在显着差异?






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论