京公网安备 11010802034615号
经营许可证编号:京B2-20210330
什么是因子分析
这节我们要说的是:什么是因子分析?我们依旧接着前面的二手车案例来学习回归分析。
因子分析是定量分析哪个因子对目标变量(被说明变量)产生了多大影响,因此需要求影响度。求混台模型(定量数据和定性数据混合的模型)影响度的方法如下所示。
定基数据(回归分析的说明变量数据):t值
定性数据(数量化理论I的因素·项目数据):t值范围
因子分析,首先,根据第一次回归分析的结果,对上节表3进行因子分析。由于是定性数据。因此需要求解t值区域’。
“AC(空调)”的影响度=O.51-0=0.5l
“TV导航”的影响度=0-(-0.87)=0.87
“导航”的影响度=1.69-0=1.69
“SR”的影响度=2.01-0=2.01
“天窗”的影响度=O-(-o.99)=0.99
“空气囊”的影响度=3.15-0=3.15
“LD”的影响度=5.53-0=5.53
“TV”的影响度=O-(-0.59)=0.59
“AW”的影响度=6.01-0=6.01
同样地,根据第二次回归分析的结果,求影响度。“行驶距离”、 “车检”、“评分”是定量数据,所以t值就是影响度。
“颜色”的影响度=17.64-0=17.64
“拍卖会地点”的影响度=3.OO-0=3.00
“行驶距离”的影响度=-5.47
“车检剩余有效月数”的影响度4.56
“评分”的影响度=5.17
表1统计了所有因子的影响度。
表1
根据表1制作柱形图,如图1所示。
图1
从图1可知,“颜色”、 “AW”、 “LD”、 “行驶距离”、 “评分”、 “车检剩余有效月数”的影响度数值较大。比较各个因子的影响度绝对值,数值越大,对二手车价格的影响越强。当影响度是负数时(如行驶距离),是负因子,数值越大,目标变量的数值(如二手车价格)越小。
根据Excel回归分析的限制条件将回归自由度设为16
为了满足Excel回归分析的限制条件“回归自由度的最大上限是16”,分两次进行回归分析。从分析结果中抽取影响度较大的因子进行回归分析。这里从上节表1和表2中抽取影响度较大的因子,将回归自由度限制在16以内。
回归自由度是指回归分析时说明变量的个数,即从各项定性数据中分别删除一列项目之后的说明变量个数。
把项目数量控制在16个以内,抽取出具有较大影响度的因子是“LD”、“AW”、“空气囊”、“颜色”、“拍卖会地点”、“行驶距离”、“车检剩余有效月数”、。评分”等8个因子(表2)。
表2
从表2的各个项目中分别删除一列项目(表3)。
表3
接下来,用表3进行回归分析。操作步骤如下:
①从Exccl的菜单栏中,选择“工具”一“数据分析”。
②在弹出的“数据分析”对话框中,选择“回归”,单击“确定”(图2)。
图2
③在弹出的“回归分析”对话框中,点击“Y值输入范围”的文本框。选择“金额”这一列,包含项目名称。接着,点击“X值输入范围”的文本框,选择从“有LD”到“评分”的范围,包含项目名称。选择“标志”后,点击“确定”(图3)。
图3
回归分析结果,如表4所示。
表4
这节讲的什么是因子,内容比较多,因为此节课程和上节是相联系的,所以这节有引用上节的表,还有需要大家注意的是教程的图片有表和图的区分,不要让这点把大家弄混了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09