常用的两种相关系数 Pearson相关系数,适用于连续型变量,且要求两变量呈正态分布,或接近正态分布,至少是单峰的对称分布。 Spearman秩相关系数,适用于定序型变量,或者不满足正态分布的连续型变量。
读童话的狼
2020-02-26
进行分箱和哑变量变换都是数据预处理的方法,分箱可以将连续变量变为有序变量,哑变量也称为虚拟变量,一般而言,主要是针对分类变量而言的,例如受教育程度,分为多类的话,为了明确考察教育对被解释变量的影响,如果有n类,生成n-1个哑变量(为了避免完全共线性),引入方程。
读童话的狼
2020-02-26
对于二元逻辑回归来说,y只有两个取值0或1 误差列可以点击转换下的计算变量,通过添加对应的规则,如实测为1,预测为0,误差就定义为1,添加完成后再对这一列的系统缺失值填补为0.
读童话的狼
2020-02-26
R^2低并不一定代表选取的自变量与因变量间显著性差,完全可能在0.01水平上高度显著的。R^2低只是代表可能遗漏了某些重要的解释变量,和变量间的显著性是两回事。 回归模型一般要做两个检验。整体模型检验和回归系数检验。都通过了即使R^2很低也可以接受。
读童话的狼
2020-02-26
设自变量x1,x2,…,xm与因变量y都具有线性关系,可建立回归方程:ŷ=b0 b1x1 b2x2 … bmxm。式中b1,b2,…,bm为相应于各自变量的偏回归系数。表示当其他的各自变量都保持一定时,指定的某一自变量每变动一个单位,因变量y增加或减少的数值。
读童话的狼
2020-02-26
设Logistic回归的偏回归系数为β,则EXP(0.01*β)即为自变量每增加0.01个单位时的OR值,其中EXP表示以e为底数的幂,可在Excel中用=exp()函数获取。
读童话的狼
2020-02-26
odds: 称为几率、比值、比数,是指某事件发生的可能性(概率)与不发生的可能性(概率)之比。用p表示事件发生的概率,则:odds = p/(1-p)。 OR:比值比,为实验组的事件发生几率(odds1)/对照组的事件发生几率(odds2)。
读童话的狼
2020-02-26
两取值分类变量与连续变量之间的关系用独立样本T检验或者非参研究相关性 多取值分类变量与连续变量之间的关系用方差分析或者非参类似方法研究 在SPSS中可以进行相关分析 SPSS---分析---描述统计---交叉表 在出现的对话框里,选择“统计”按钮,在新出现的对话框里,选择Eta
读童话的狼
2020-02-26
这种情况是正常的,是由于分别使用单因素分析和多因素分析造成的。卡方检验相对于Logistic回归而言一次只能考虑一个因素,因此在卡方检验中你的性别、专业是分开做的(单因素分析)。如果在Logistic回归中你也分开做性别、专业(单因素分析),那么结果就会与卡方检验完全一样。 但是,如果你在Logistic回归中同时使用性别、专业等多个因素(多因素分析),那么模型中的各个因素是可以产生相互影响的,有
读童话的狼
2020-02-26
spss中的排序方式与excle类似,首先选中一列,右键选择升序还是降序,样本顺序就会做相应变化,如果想要去除排序效果就选中第一列的ID升序排列。
读童话的狼
2020-02-25