欺诈风险是通过异常索引来度量的,异常索引越大,越有可能欺诈,所以可以吧欺诈索引当成y,其他变量当成x,建立预测模型,预测的y越大,欺诈风险也就越大
这是因为编码问题需要重新设置一下编码,操作如下先保存一下当前数据,建立一个空的数据集,把其他的数据集全部关掉,然后点击编辑下是选项,设置编码格式为中文,如图所示,选择后应用,最后重新载入数据即可
把压缩后的变量当成x放到模型里进行建模就可以,也不用去解释它的实际意义,因为就是通过很多不重要的特征压缩得到的,这一部分变量放到模型中就是为了提高模型的精确度
体现出两个变量的线性关系,统计上的意义就是通过散点图得到两个变量的关系是线性的还是非线性的,预测值是整合了y与x之间的关系,所以预测值可以看做一个综合值,还要解释他的业务有意义
excel中的空值复制到SPSS中也是空值,目前excle和SPSS在识别缺失值上是一致的,雨果遇到某些场景不一致的可以通过变量视图自己将其定义为缺失值
R方为0.273代表低相关,但是分类表的准确率达到81%,这不是矛盾的,因为R方取值是0~1之间,所有R方的起点是从0开始的,但是准确度与R方不同,准确度是从50%开始的