SPSS-数据科学专业问答社区-CDA答疑社区

热线电话：13121318867

登录

读童话的狼

如何计算盈亏平衡点？

盈亏平衡点，也叫零利润点、保本点、盈亏临界点、损益分歧点、收益转折点。通常是指全部销售收入等于全部成本时(销售收入线与总成本线的交点)的产量。一、根据固定费用、产品单价与变动成本计算保本产量的盈亏平衡点：盈亏平衡点=固定费用÷(产品单价-变动成本)二、计算保本产量，根据产量与目标利润计算最低销价为盈亏平衡点：盈亏平衡点=((固定费用维持企业运转的利润) (产量×单位变动成本))÷

0.0000

0

3

0

关注作者

收藏

读童话的狼

如何根据现有模型判断一个新用户是否会有欺诈风险？

欺诈风险是通过异常索引来度量的，异常索引越大，越有可能欺诈，所以可以吧欺诈索引当成y，其他变量当成x，建立预测模型，预测的y越大，欺诈风险也就越大

20.9044

1

1

0

关注作者

收藏

读童话的狼

如果聚类的X变量间有共线性，需要先做处理吗？

从算法角度来说，共线性对聚类的影响不严重，可处理可不处理，尤其是k均值聚类和两阶段聚类，共线性从业务的角度来说有特殊的含义，是需要处理的

2.3285

1

0

0

关注作者

收藏

读童话的狼

SPSS软件可以做到对标签进行每天动态更新吗？

SPSS软件对标签进行动态更新的，动态性质的最好通过python来实现，一般五到六个月才会更新客户画像，动态更新也是十分损耗资源的

0.0000

0

0

0

关注作者

收藏

读童话的狼

二阶聚类的特点与适用范围

1）可以同时对连续变量和分类变量进行处理2）操作简单，可视化效果比较好，不需要提前制定聚类的数目，二阶聚类会自动分析并输出最优聚类数目。3）可以处理比较大的数据集，比如500w左右的数据是没有问题的，但是也不能太大4）对的要求：100列，200列，300列都是可以的，不能用于超高纬度

10.2845

1

5

0

关注作者

收藏

读童话的狼

20%的变量缺失值超过15%如何进行缺失值处理？

20%的列缺失与15%的行缺失都不是太严重，在SPSS中可以通过缺失值分析来填补，如果缺失比例比较大可以用多重插补处理，如果缺失比例在百分之十几可以参考下图中的EM或回归进行填补，数据量小就用回归填补，数据量大就用EM算法

20.9044

1

1

0

关注作者

收藏

读童话的狼

spss软件可以做人形的用户画像吗？

spss软件中暂时还没有这样的功能，可以用python这样的编程语言来做，大部分软件都是需要自己做的

0.0000

0

2

0

关注作者

收藏

读童话的狼

SPSS客户画像的标签如何设置？

在变量视图中可以通过值标签来添加，有几个画像就会有几组标签

20.9044

1

0

0

关注作者

收藏

读童话的狼

SPSS进行二阶聚类时发生意外错误

这是因为编码问题需要重新设置一下编码，操作如下先保存一下当前数据，建立一个空的数据集，把其他的数据集全部关掉，然后点击编辑下是选项，设置编码格式为中文，如图所示，选择后应用，最后重新载入数据即可

20.9044

1

2

0

关注作者

收藏

读童话的狼

非监督可以理解为y对x的约束性吗？

监督方法可以理解为y对x的约束性，非监督方法是只有x没有y的约束，分析的是x之间的关系

0.0000

0

0

0

关注作者

收藏

读童话的狼

主成分分析提取的因子可以理解为建模的常量部分吗？

不可以，主成分就相当于一个回归，当成常量是不对的可以理解为常量加上x的部分，主成分就可以理解为一个回归模型

0.0000

0

3

0

关注作者

收藏

读童话的狼

逻辑回归中log(P1/(1-P1))是y的估计值吗？

逻辑回归中常用P1表示y的估计值，P1可以理解为违约的概率，y的估计值有很多，log(P1/(1-P1))也是y的估计值，

0.0000

0

1

0

关注作者

收藏

读童话的狼

压缩后的变量怎么实际应用呢？

把压缩后的变量当成x放到模型里进行建模就可以，也不用去解释它的实际意义，因为就是通过很多不重要的特征压缩得到的，这一部分变量放到模型中就是为了提高模型的精确度

0.0000

0

2

0

关注作者

收藏

读童话的狼

曲线估算保存的预测值体现了两个相关变量的什么关系？

体现出两个变量的线性关系，统计上的意义就是通过散点图得到两个变量的关系是线性的还是非线性的，预测值是整合了y与x之间的关系，所以预测值可以看做一个综合值，还要解释他的业务有意义

0.0000

0

2

0

关注作者

收藏

读童话的狼

SPSS中的主成分压缩是在哪个菜单？

>分析>降维>因子如果需要保存降维之后的变量，就在因子得分里勾选保存为变量

20.9044

1

1

0

关注作者

收藏

读童话的狼

excel中的空值复制到SPSS可以识别吗？

excel中的空值复制到SPSS中也是空值，目前excle和SPSS在识别缺失值上是一致的，雨果遇到某些场景不一致的可以通过变量视图自己将其定义为缺失值

10.2845

1

3

0

关注作者

收藏

读童话的狼

定义变量集怎么个用法？

定义变量集与使用变量集都是在SPSS主界面下的实用程序下，可以将不同步骤需要的特征放到不同的变量集中使用，既保证的数据的完整性，又能满足每一步的需求，不会受到不相干变量的影响，定义变量集后需使用变量集才可以

0.0000

0

2

0

关注作者

收藏

读童话的狼

逻辑回归中R方为0.273，为什么总体准确率可以达到0.81

R方为0.273代表低相关，但是分类表的准确率达到81%，这不是矛盾的，因为R方取值是0~1之间，所有R方的起点是从0开始的，但是准确度与R方不同，准确度是从50%开始的

0.0000

0

2

0

关注作者

收藏

读童话的狼

如何利用SPSS进行主成分分析？

主成分分析（principal component analysis）　　将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。又称主分量分析。在实际课题中，为了全面分析问题，往往提出很多与此有关的变量（或因素），因为每个变量都在不同程度上反映这个课题的某些信息。但是，在用统计分析方法研究这个多变量的课题时，变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较

0.0000

0

3

0

关注作者

收藏

PGC123

SPSS如何连接MySQL数据库

SPSS如何连接MySQL数据库？答：SPSS连接MySQL数据库使用的连接驱动是ODBC，因此需要明确是否已经安装。安装好之后就可以在SPSS内操作咯。1、新建查询 2、添加数据源编辑数据库的连接信息在后面弹出的窗口点击确定，回到数据库向导页面最后点击完成数据已经导入

25.2827

2

3

0

关注作者

收藏

<1234…26>

CDA考试动态

CDA报考指南