
SPSS最优尺度:分类回归
一、分类回归(分析-回归-最佳尺度)
1、概念:分类回归通过为类别指定数值来量化分类数据,从而生成转换后变量的最优线性回归方程。分类回归也用缩写词CATREG来表示(代表categorical regression)。标准线性回归分析涉及使响应变量(因变量)和预测变量(自变量)的加权组合之间的平方差之和达到最小。变量通常是定量的,(名义)分类数据重新编码为二元变量或对比变量。因此,分类变量用于分离个案组,并且该技术估计每个组的独立的参数集。估计的系数反映了预测变量的变化对响应的影响程度。对于预测变量值的任何组合都可以预测响应。
另一种方法需要对分类预测变量值本身进行响应回归。这样,将为每个变量分别估计一个系数。但是,对于分类变量,类别值是任意的。以不同的方式编码类别将产生不同的系数,这样,在对同样的几个变量的分析进行比较时,难度就增大了。CATREG通过同时调整名义、序数和数值变量扩展了标准方法。该过程量化分类变量以使量化反映初始类别的特征。该过程以与处理数值变量相同的方式处理量化的分类变量。使用非线性转换允许在各种级别分析变量以查找最佳拟合模型。
2、示例。分类回归可用于描述工作满意度对工作类别、地理区域和旅行量的依赖程度。您可能会发现高满意度对应于经理和低旅行量。生成的回归方程可用于针对三个自变量的任何组合预测工作满意度。
3、统计量和图。频率、回归系数、ANOVA表、迭代历史记录、类别量化、未转换的预测变量之间的相关性、转换后的预测变量之间的相关性、残差图和变换图。
4、数据。CATREG在类别指示变量上运行。类别指示符应为正整数。可使用“离散化”对话框将小数值变量和字符串变量转换为正整数。
5、假设。只允许一个响应变量,但是预测变量的最大数目为200。该数据必须至少包含三个有效个案,并且有效个案数必须大于预测变量数加一。
6、相关过程。CATREG等效于使用最优尺度的分类典型相关性分析(OVERALS),该分析有两个变量集,其中一个只包含一个变量。将所有变量调整为数值级别对应于标准多重回归分析。
二、规则化(分析-回归-最佳尺度-规则化)
1、方法。规则化方法可以向0方向缩小回归系数估计,以降低其变异性,从而改善模型的预测误差。
1.1、Ridge回归。Ridge回归引入惩罚项以缩小系数,惩罚项等于系数平方乘以惩罚系数的总和。该系数可从0(无惩罚)到1变化;如果指定了范围与增量,过程将搜索“最佳”的惩罚值。
1.2、套索。套索的惩罚项是基于绝对系数的总和,惩罚系数的指定与Ridge回归类似,但套索涉及更密集的计算。
1.3、弹性网络。“弹性网络”简单地组合套索和Ridge回归惩罚,在指定的值网格中搜索以发现“最佳”的套索和Ridge回归惩罚系数。对于给定的套索与Ridge回归惩罚,“弹性网络”的计算量并不比套索多很多。
2、显示规则化图。这些是回归系数与规则化惩罚图。在搜索某个值范围以寻找“最佳”惩罚系数时,它提供了有关回归系数在该范围上如何变化的视图。
3、弹性网络图。对于“弹性网络”方法,由Ridge回归惩罚值产生单独的规则化图。所有可能图使用指定的最小和最大Ridge回归惩罚值所确定范围中的每个值。为部分Ridge惩罚允许您指定由最小和最大Ridge回归惩罚值所确定范围的值子集。只需键入惩罚值的编号(或指定值范围),然后单击添加。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01