【CDA干货】Excel卡方检验实操指南：从数据整理到结果解读，新手也能轻松上手-CDA数据分析师官网

热线电话：13121318867

首页大数据时代【CDA干货】Excel卡方检验实操指南：从数据整理到结果解读，新手也能轻松上手

【CDA干货】Excel卡方检验实操指南：从数据整理到结果解读，新手也能轻松上手

2026-05-18

在数据统计分析中，卡方检验是一种常用的非参数检验方法，核心用于判断两个或多个分类变量之间是否存在显著关联，广泛应用于市场调研、医学统计、社会科学、企业运营等多个领域。例如，分析不同性别对产品偏好的差异、不同营销方案对用户转化的影响、不同年龄段对服务满意度的区别等，都可以通过卡方检验得出科学结论。

很多人认为卡方检验需要专业统计软件（如SPSS、R语言）才能完成，但实际上，Excel作为办公中最常用的工具，无需安装额外插件，通过自带的函数和数据处理功能，就能快速完成卡方检验的全流程操作。本文将从卡方检验的核心概念入手，一步步拆解Excel卡方检验的操作步骤，结合具体案例演示，详解结果解读方法，同时规避常见误区，让新手也能轻松用Excel完成卡方检验，用数据支撑决策。

一、基础认知：先搞懂卡方检验的核心逻辑

在动手操作前，我们需要先明确卡方检验的核心用途和基本原理，避免操作流程正确但解读错误的问题，这也是Excel卡方检验的基础前提。

（一）卡方检验的核心用途

卡方检验的核心是“检验分类变量的关联性”，简单来说，就是回答“两个分类变量之间是否有关联”这个问题。这里的分类变量，指的是只能划分到不同类别、无法进行数值运算的变量，比如性别（男/女）、产品偏好（A/B/C）、满意度（满意/一般/不满意）、营销方案（方案1/方案2/方案3）等。

举个常见场景：某电商平台想知道“性别”与“产品偏好”是否有关联，即男性和女性对不同产品的选择是否存在显著差异，这时就可以通过Excel卡方检验来验证，无需复杂的统计公式，就能得到明确的结论。

（二）核心原理：卡方值与P值的意义

卡方检验的核心逻辑是“对比观测频数与期望频数的差异”：观测频数是我们实际收集到的数据（比如男性选择产品A的人数、女性选择产品B的人数），期望频数是假设两个变量无关联时，理论上应该出现的频数。通过计算两者的差异，得到卡方值（χ²），再结合卡方分布，得出P值，最终判断变量间是否存在显著关联。

关键判断标准（新手必记）：

1. 显著性水平（α）：通常取值为0.05，代表“允许的误差范围”；

2. P值与显著性水平的对比：若P值＜0.05，拒绝原假设（原假设为“两个变量无关联”），说明两个变量存在显著关联；若P值≥0.05，接受原假设，说明两个变量无显著关联，差异可能是偶然因素导致。

无需手动计算卡方值和P值，Excel的自带函数会直接给出结果，我们只需专注于数据整理和结果解读即可。

（三）Excel卡方检验的适用场景

Excel主要支持“卡方独立性检验”（最常用），适用于以下场景：

1. 两个分类变量，均为无序分类（如性别：男/女；产品：A/B/C）；

2. 数据为“频数数据”（即每个类别的计数，如男性选择产品A的有30人）；

3. 样本量足够，且每个单元格的期望频数不小于5（若小于5，需合并分类或增加样本量，否则结果会失真）。

二、Excel卡方检验全流程实操：一步一图，新手零出错

Excel卡方检验的核心流程分为4步：整理观测数据→构建列联表→计算期望频数→使用函数检验并解读结果。全程无需手动计算复杂公式，跟着步骤操作即可，以下结合具体案例详细演示（以Excel 2016及以上版本为例，其他版本操作基本一致）。

（一）案例前提

某市场调研公司收集了190名消费者的调研数据，想验证“性别”（男/女）与“产品偏好”（A/B/C）是否存在显著关联，具体观测数据如下：男性90人，其中选择产品A的30人、产品B的40人、产品C的20人；女性100人，其中选择产品A的25人、产品B的35人、产品C的40人。我们将通过Excel卡方检验，验证两者是否有关联。

（二）第一步：整理数据，构建列联表

列联表（也叫交叉表）是卡方检验的基础，核心是将两个分类变量的观测频数按“行×列”的形式整理，清晰呈现每个类别的交叉计数。

操作步骤：

1. 打开Excel，在工作表中输入列联表的表头，行标题为“性别”（男、女），列标题为“产品偏好”（A、B、C），并添加“合计”列（用于后续计算期望频数）；

2. 填入观测频数，同时计算每行、每列的合计值和总样本数，最终列联表如下（Excel中直接录入，无需手动计算合计，可通过SUM函数自动求和）：

性别产品偏好	产品A	产品B	产品C	行合计
男性	30	40	20	90
女性	25	35	40	100
列合计	55	75	60	190

提示：合计值可通过Excel SUM函数快速计算，比如男性行合计（单元格E2）输入“=SUM(B2:D2)”，产品A列合计（单元格B4）输入“=SUM(B2:B3)”，总样本数（单元格E4）输入“=SUM(E2:E3)”或“=SUM(B4:D4)”。

（三）第二步：计算期望频数

期望频数是“假设两个变量无关联时，每个交叉单元格理论上应该出现的频数”，计算公式为：期望频数 = (行合计 × 列合计) / 总样本数。Excel中可通过公式批量计算，无需手动逐个运算。

操作步骤：

1. 在列联表下方，新建一个“期望频数表”，表头与观测频数表一致（性别、产品A、产品B、产品C）；

2. 输入期望频数公式，以“男性-产品A”单元格（假设为B7）为例，输入公式“=(4)/4”（$符号为绝对引用，确保下拉、右拉时公式不变）；

3. 将公式向右拉至D7（计算男性-产品B、男性-产品C的期望频数），再向下拉至D8（计算女性各产品的期望频数），即可得到完整的期望频数表；

4. 计算结果保留2位小数，本例中期望频数表如下：

性别产品偏好	产品A	产品B	产品C
男性	26.05	35.53	28.42
女性	28.95	39.47	31.58

验证：期望频数表中，每行的合计值应与观测频数表的行合计一致（允许微小误差，因四舍五入导致），比如男性期望频数合计为26.05+35.53+28.42=90，与观测行合计一致，说明计算正确。

（四）第三步：使用CHISQ.TEST函数，完成卡方检验

Excel自带的CHISQ.TEST函数，可直接输入观测频数区域和期望频数区域，返回P值，无需手动计算卡方值，是新手最常用的快速检验方法。

函数语法：=CHISQ.TEST(观测频数区域, 期望频数区域)

操作步骤：

1. 选择一个空白单元格（如B10），作为P值的输出位置；

2. 输入公式“=CHISQ.TEST(B2:D3, B7:D8)”，其中“B2:D3”是观测频数的区域（不含合计行和合计列），“B7:D8”是期望频数的区域；

3. 按下回车键，即可得到P值。本例中，输入公式后返回的P值约为0.17（保留2位小数）。

补充：若想手动计算卡方值，可在Excel中新增一列，输入公式“=SUM((观测频数-期望频数)^2/期望频数)”，对所有交叉单元格的结果求和，即可得到卡方值。但对于新手而言，无需手动计算，CHISQ.TEST函数已能满足需求。

（五）第四步：解读结果，得出结论

结果解读的核心是“对比P值与显著性水平（α=0.05）”，结合案例场景，快速得出结论，这也是卡方检验的最终目的。

本例解读：

1. 已知显著性水平α=0.05，Excel计算得出的P值≈0.17；

2. 对比：P值（0.17）＞α（0.05），因此接受原假设（原假设为“性别与产品偏好无关联”）；

3. 结论：在α=0.05的显著性水平下，没有足够的证据表明“性别”与“产品偏好”存在显著关联，即男性和女性对产品A、B、C的偏好差异，可能是偶然因素导致，而非性别本身的影响。

若本例中P值＜0.05，则拒绝原假设，说明性别与产品偏好存在显著关联，比如女性更偏好产品C，男性更偏好产品B。

三、进阶补充：手动计算卡方值（可选，加深理解）

对于想深入理解卡方检验原理的使用者，可通过Excel手动计算卡方值，步骤如下（基于上述案例）：

1. 新增“(O-E)²/E”列（O为观测频数，E为期望频数）；

2. 对每个交叉单元格，输入公式“=(观测频数单元格-期望频数单元格)^2/期望频数单元格”，比如男性-产品A的公式为“=(B2-B7)^2/B7”；

3. 使用SUM函数，对所有“(O-E)²/E”的值求和，得到卡方值（χ²）。本例中，卡方值≈3.52；

4. 结合自由度（自由度df=(行数-1)×(列数-1)，本例中df=(2-1)×(3-1)=2），通过CHISQ.DIST.RT函数计算P值：输入“=CHISQ.DIST.RT(3.52,2)”，返回结果仍为≈0.17，与CHISQ.TEST函数结果一致。

提示：手动计算的核心是验证函数结果的准确性，日常实操中，直接使用CHISQ.TEST函数即可，无需繁琐计算。

四、常见问题与避坑指南（新手必看）

很多新手在Excel卡方检验中，容易出现操作失误或结果解读错误，结合实操经验，总结4个常见问题及解决方案，避免踩坑。

（一）问题1：数据格式错误，函数返回错误值

表现：输入CHISQ.TEST函数后，返回“#VALUE!”或“#N/A”错误；

原因：观测频数或期望频数区域包含文本、空值，或两个区域的大小不一致（如观测区域是2行3列，期望区域是2行2列）；

解决方案：1. 确保观测频数和期望频数均为数值型数据，无文本、空值；2. 核对两个区域的大小，必须完全一致（行数、列数相同）。

（二）问题2：期望频数过小，结果失真

表现：计算出的期望频数有单元格小于5，此时卡方检验结果不可信；

原因：样本量不足，或分类过于细致，导致部分交叉类别的期望频数过低；

解决方案：1. 增加样本量，确保每个单元格的期望频数≥5；2. 合并相邻的分类（如将“产品C”与“产品B”合并，减少分类数量）；3. 若样本量无法增加，可改用Fisher精确检验（Excel中无自带函数，需手动计算或使用插件）。

（三）问题3：混淆“关联”与“因果”

表现：得出“两个变量存在显著关联”的结论后，误认为“一个变量导致另一个变量”；

原因：对卡方检验的核心逻辑理解不足，卡方检验仅能验证“关联关系”，无法验证“因果关系”；

解决方案：明确结论表述，比如“性别与产品偏好存在显著关联”，而非“性别导致产品偏好差异”，若需验证因果关系，需结合更多数据和实验设计。

（四）问题4：函数参数输入错误

表现：函数返回的P值异常（如大于1或小于0）；

原因：输入的观测频数区域包含合计行或合计列，或期望频数计算错误；

解决方案：1. 观测频数和期望频数区域，均不包含合计行、合计列（仅包含交叉计数的单元格）；2. 重新核对期望频数的计算公式，确保绝对引用正确，计算结果无误。

五、总结：Excel卡方检验，让分类变量分析更高效

卡方检验的核心价值的是“用数据验证分类变量的关联性”，而Excel的实操优势在于“简单、高效、无需专业基础”——无需记忆复杂的统计公式，无需安装专业软件，只需完成“整理列联表→计算期望频数→调用CHISQ.TEST函数→解读P值”四步，就能快速得出科学结论。

无论是市场调研中的偏好分析、企业运营中的差异验证，还是医学统计中的关联研究，Excel卡方检验都能满足基础分析需求。对于新手而言，重点掌握“列联表构建”和“P值解读”两个核心环节，规避常见误区，就能轻松用Excel完成卡方检验，让数据说话，为决策提供可靠支撑。

需要注意的是，Excel卡方检验主要适用于无序分类变量的独立性检验，若涉及有序分类变量（如满意度：非常满意/满意/一般/不满意），则需使用更复杂的统计方法，此时可结合SPSS等工具，但日常办公中，Excel的卡方检验已能覆盖80%以上的分类变量分析场景。

免费加入阅读：https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

市场调研 D3 数据格式卡方分布统计软件交叉表数据统计数据处理

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇【CDA干货】业务本体模型：解码企业业务本质，支撑数字化转型的核心基石

下一篇《CDA一级教材知识手册》——备考通关必备浓缩指南

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

【CDA干货】Excel卡方检验实操指南：从数据整理到结果解读，新手也能轻松上手

一、基础认知：先搞懂卡方检验的核心逻辑

（一）卡方检验的核心用途

（二）核心原理：卡方值与P值的意义

（三）Excel卡方检验的适用场景

二、Excel卡方检验全流程实操：一步一图，新手零出错

（一）案例前提

（二）第一步：整理数据，构建列联表

（三）第二步：计算期望频数

（四）第三步：使用CHISQ.TEST函数，完成卡方检验

（五）第四步：解读结果，得出结论

三、进阶补充：手动计算卡方值（可选，加深理解）

四、常见问题与避坑指南（新手必看）

（一）问题1：数据格式错误，函数返回错误值

（二）问题2：期望频数过小，结果失真

（三）问题3：混淆“关联”与“因果”

（四）问题4：函数参数输入错误

五、总结：Excel卡方检验，让分类变量分析更高效

推荐学习书籍 《CDA一级教材》适合CDA一级考生备考，也适合业务及数据分析岗位的从业者提升自我。完整电子版已上线CDA网校，累计已有10万+在读~ !

免费加入阅读：https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA持证人专访：黄冬谈数字化运营核心与数据中台建 ...

【CDA干货】市场调查、竞品分析、需求调研的核心区 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】MySQL分表如何查询数据在哪张表？实战方 ...

【CAD干货】业务模型与逻辑模型的概念辨析及实战案 ...

从“零件”到“引擎”：CDA数据分析师视角下的指标 ...

CDA持证人专访：宋利宝谈电销行业数据运营与数据分 ...

【CDA干货】ARIMA时间序列分析方法：核心原理、建模 ...

从“通用基石”到“场景利器”：CDA数据分析师视角 ...

【CDA干货】SQL Server 提示“实例已在使用”：常见 ...

【CDA干货】Excel数据透视表两列相乘：正确计算方法 ...

从“模糊需求”到“精确标尺”：CDA数据分析师视角 ...

CDA持证人专访：冯卓基谈大数据平台搭建与行业数字 ...

【CDA干货】基于月度数据的送货率提升专项数据分析 ...

从“样本均值”到“总体真相”：CDA数据分析师视角 ...

【CDA干货】指标：量化业务的核心衡量标准与设计指 ...

【CDA干货】Excel透视表计算字段：先乘法后求和汇总 ...

从“杂乱”到“有序”：CDA数据分析师视角下的数据 ...

CDA持证人专访：崔爱军谈地产行业数据治理与数据中 ...

【CDA干货】显著水平与P值的核心区别、关联关系及实 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

推荐学习书籍《CDA一级教材》适合CDA一级考生备考，也适合业务及数据分析岗位的从业者提升自我。完整电子版已上线CDA网校，累计已有10万+在读~ !