SPSS分类分析：决策树-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读SPSS分类分析：决策树

SPSS分类分析：决策树

2017-11-02

SPSS分类分析：决策树

一、决策树（分析-分类-决策树）

“决策树”过程创建基于树的分类模型。它将个案分为若干组，或根据自变量（预测变量）的值预测因变量（目标变量）的值。此过程为探索性和证实性分类分析提供验证工具。

1、分段。确定可能成为特定组成员的人员。

2、层次。将个案指定为几个类别之一，如高风险组、中等风险组和低风险组。

3、预测。创建规则并使用它们预测将来的事件，如某人将拖欠贷款或者车辆或住宅潜在转售价值的可能性。

4、数据降维和变量筛选。从大的变量集中选择有用的预测变量子集，以用于构建正式的参数模型。

5、交互确定。确定仅与特定子组有关的关系，并在正式的参数模型中指定这些关系。

6、类别合并和连续变量离散化。以最小的损失信息对组预测类别和连续变量进行重新码。

7、示例。一家银行希望根据贷款申请人是否表现出合理的信用风险来对申请人进行分类。根据各种因素（包括过去客户的已知信用等级），您可以构建模型以预测客户将来是否可能拖欠贷款。

二、增长方法（分析-分类-决策树）

1、CHAID.卡方自动交互检测。在每一步，CHAID选择与因变量有最强交互作用的自变量（预测变量）。如果每个预测变量的类别与因变量并非显著不同，则合并这些类别。

2、穷举CHAID.CHAID的一种修改版本，其检查每个预测变量所有可能的拆分。

3、CRT.分类和回归树。CRT将数据拆分为若干尽可能与因变量同质的段。所有个案中因变量值都相同的终端节点是同质的“纯”节点。

4、QUEST.快速、无偏、有效的统计树。一种快速方法，它可避免其他方法对具有许多类别的预测变量的偏倚。只有在因变量是名义变量时才能指定QUEST。

三、验证（分析-分类-决策树-验证）

1、交叉验证：交叉验证将样本分割为许多子样本（或样本群）。然后，生成树模型，并依次排除每个子样本中的数据。第一个树基于第一个样本群的个案之外的所有个案，第二个树基于第二个样本群的个案之外的所有个案，依此类推。对于每个树，估计其误分类风险的方法是将树应用于生成它时所排除的子样本。

1.1、最多可以指定25个样本群。该值越大，每个树模型中排除的个案数就越小。

1.2、交叉验证生成单个最终树模型。最终树经过交叉验证的风险估计计算为所有树的风险的平均值。

2、分割样本验证：对于分割样本验证，模型是使用训练样本生成的，并在延续样本上进行测试。

2.1、您可以指定训练样本大小（表示为样本总大小的百分比），或将样本分割为训练样本和测试样本的变量。

2.2、如果使用变量定义训练样本和测试样本，则将变量值为1的个案指定给训练样本，并将所有其他个案指定给测试样本。该变量不能是因变量、权重变量、影响变量或强制的自变量。

2.3、您可以同时显示训练样本和测试样本的结果，或者仅显示测试样本的结果。

2.4、对于小的数据文件（个案数很少的数据文件），应该谨慎使用分割样本验证。训练样本很小可能会导致很差的模型，因为在某些类别中，可能没有足够的个案使树充分生长

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

决策树降维

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇Excel-漏斗图分析（差异分析）

下一篇大数据分析工程师薪资水平

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

SPSS分类分析：决策树

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】OSM指标体系：自上而下拆解逻辑、搭建流 ...

【CDA干货】选择统计方法前最重要的核心工作：避免9 ...

从“零散明细”到“多维洞察”：CDA数据分析师视角 ...

【CDA干货】问卷效度高与后续因子分析：逻辑关系、 ...

CDA持证人专访：唐一楠谈应届生数据分析就业与学习 ...

从“静态数据”到“动态资产”：CDA数据分析师视角 ...

【CDA干货】SQL统计月度每日夜间数据：口径定义、多 ...

【CDA干货】特征置换重要性分析：原理、计算流程、 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

CDA持证人专访：张继荣谈销售转岗数据分析的追梦路 ...

【CDA干货】Excel卡方检验实操指南：原理、步骤、结 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】Excel透视表数据直接跨单元格相乘：风险 ...

从“行列规范”到“业务洞察”：CDA数据分析师视角 ...

数据分析师就业难不难？薪资待遇如何？考 CDA 证书 ...

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载