京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据,日期格式混乱,跨表计算反复出错——根源在于没有建立完整的“表格六步法”意识。读数据、取数据、引数据、查数据、算数据、控数据,是从看懂表格到驾驭表格的六门必修课。
”
表格结构数据是指以“行存样本、列储属性”的规范形态组织的数据集合。每一行代表一个业务样本(如一笔订单、一个用户),每一列代表一个属性字段(如订单金额、用户年龄)。参考规范化数据表设计原则,在业务实践中,企业80%以上的结构化数据以表格形态呈现,这是CDA数据分析师最核心的工作载体。
从宏观到微观,表格结构数据有着清晰的层级结构:
工作簿(Book) → 工作表(Sheet) → 单元格区域(Range) → 单元格(Cell)
工作簿是独立的电子表格文件,一个工作簿包含一个或多个工作表;每个工作表由纵横交错的单元格组合构成;单元格区域是矩形连续单元格的集合;而单元格是最基本的操作单元,每个单元格通过“列号+行号”唯一定位。例如,B4单元格表示第2列第4行的交叉位置。
理解这一层级关系,后续讲的引用技巧才能真正落地。
表格结构数据主要分为三种数据类型:
CDA常见陷阱:ID编号虽然看起来是数字,但应作为文本型处理,业务逻辑上不允许求和。同样,日期型常被误存为文本型,导致无法排序或绘图,常见的转化方法是使用数据工具中的日期识别功能。
实操验证
表格结构数据通常来自三大渠道:
关键文件类型区分:CSV/TXT为纯文本文件,仅包含数据本身,不涉及公式、格式或图表;XLSX/ET为电子表格工具文件,可保存公式、多种格式及图表操作记录。在《数据分析概论》中初步提到两种类型文件在实际使用中的一个显著不同点——电子表格文件在处理复杂计算公式和数据展示上更灵活,但数据量大时使用纯文本文件更稳定高效。
引用是表格结构数据处理中最基础也最频繁的操作。
在Excel等电子表格工具中,引用单元格的格式为“=表名!列号+行号”,也可用最简形式“=单元格”访问同工作表中任意单元格的值。例如,=Sheet2!C10表示引用Sheet2工作表中C列第10行单元格的数值。
CDA一级考试要求重点掌握对同一工作表内、不同工作表间、同一工作表内区域、甚至跨工作簿所出现的四种引用情形:
| 引用类型 | 写法示例 | 说明 | 常见场景 |
|---|---|---|---|
| 引用同一工作表单元格 | =A1 |
同表内 | 同一张数据表中取数计算 |
| 引用不同工作表单元格 | =Sheet2!A1 |
跨表引用 | 汇总多个月份报表 |
| 引用单元格区域 | =A1:C10 |
连续矩形区域 | SUM函数求和区域 |
| 跨工作簿引用 | ='[数据.xlsx]'!A1 |
跨文件处理 | 整合不同部门提交的报表 |
引用其他工作表中的单元格时,一般使用感叹号(!)来分隔工作表名称和单元格引用,以确保公式在跨表查询时精准定位目标单元格。
数据查询是表格结构数据处理的高频需求。
Ctrl+F快速查找,适合小规模数据的定位,能在几秒钟内找到目标单元格。
VLOOKUP是考试中最常考查的查询函数,语法为:
=VLOOKUP(查找值, 查找范围, 范围中需要返回数据的列号, 匹配方式)
例如:
引用是针对单元格级数据的直接定位,查询是通过特定函数在数据集中按条件交换信息。但VLOOKUP等查询函数在工作过程中,第一步也是查找和引用其他工作表中特定位置的值,因此二者在逻辑上有重叠,但功能层级存在区别。
VLOOKUP之外的其他查找引用类函数,应用场景也相当广泛:
常用函数分布覆盖范围从SUM、AVERAGE等基础统计,到VLOOKUP、INDEX等查找引用,再到LEFT、RIGHT等文本处理,多方面知识体系需要全面覆盖:
| 函数类别 | 常见函数 | 典型应用 |
|---|---|---|
| 数学/统计 | SUM、AVERAGE、COUNT、MAX、MIN | 明细汇总、均值估算 |
| 统计(中高级维度) | STDEV.P、VAR.P、STDEV.S、VAR.S | 质量波动分析、总体统计量估算 |
| 查找引用 | VLOOKUP、INDEX、MATCH | 跨表匹配、特定行定位 |
| 文本处理 | LEFT、RIGHT、MID、LEN | 字符串截取、数据清洗 |
| 逻辑判断 | IF、AND、OR | 条件分支与多条件组合 |
| 日期时间 | EDATE、EOMONTH | 月度偏移、月度序列生成 |
函数的基本构成是“=”加函数名称、括号包起来的参数组合,以及生成的计算结果。
| 错误类型 | 典型触发场景 | 排查建议 |
|---|---|---|
| #VALUE! | 加减运算中包含文本型数字 | 检查参与计算的单元格中是否为纯数字格式 |
| #DIV/0! | 分母为0或为空 | 核对初始数据中是否分母值缺失或为0 |
| #NAME? | 函数名误拼、Excel无法识别 | 核对函数名拼写是否规范 |
| #N/A | VLOOKUP未找到匹配项 | 确认查找范围的引用列中确实含所需数据,考虑数据是否缺失 |
| #REF! | 引用了不存在的行、列或删除后的单元格 | 核对引用范围是否出现偏移或指向错误区域 |
| #NUM! | 公式涉及无效数值参数(如求负数的平方根) | 检查公式入参是否符合函数定义域要求 |
| #NULL! | 区域运算符使用不当 | 检查引用的单元格区域是否准确 |
这些错误由前文反复应用的引用、查询、计算等模块中的不当操作触发,全流程掌握越熟练,排查效率越高。
数据透视表是必须掌握的汇总分析工具,能够将多行多列的明细数据快速按多维度、多层次分类展示,常用场景包括按地区汇总销量、按月份统计销售额等。
面对大量数据时,通过条件格式实现自动预警,提高分析效率。这是一种极其有效的辅助手段:为数据区域设定阈值条件后,Excel自动将满足好条件的单元格标为绿色、警告标为橙色等,实现数据的自动监控和高亮预警。
目前是六步结成的系统化操作缩影,需要将上文拆解的六个模块穿起来,在几十分钟甚至几秒钟内快速应用。
张伟是某品台数据分析人员,平台业务近期需分析季度数据。他拿到一张订单明细表:订单ID(既有纯文本,又有混合数字)、订单日期存为文本型(2024年1月1日)、订单金额(数值型)、产品名称(文本型)、是否发货(逻辑型)。
第1步:识别数据类型
第2步:数据获取
第3步:引用与查询
第4步:计算衍生指标
第5步:透视分析
第6步:报表生成与数据校验
这就是一套完整的“类型识别 → 数据获取 → 数据引用 → 高级查询 → 多公式计算 → 透视与数据管控”的多重场景实践操作,切合CDA认证中表格数据的全链路管理规范。
”
对于CDA数据分析师而言,表格结构数据的类型、获取、引用、查询、计算以及其他各项功能构成了日常工作的六项必修技能,是贯穿数据处理各环节的基础思维链路。
如果想系统掌握从表格结构数据的基础知识点进阶到全能型数据分析师的核心工具链,可后续关注官方教材对全流程的进一步阐述。每一层技能、每一处细节,都是检验CDA数据分析师专业能力底线的基石。
下一步行动:
=TYPE()快速诊断各列类型数据类型是底色,合理引用是骨骼,精准查询是导航,高效计算是引擎,六关全通才是专业。
”
图文含有广告内容

在互联网运营、产品优化、用户增长等领域,次日留存率是衡量产品价值、用户粘性与运营效果的核心指标,更是判断新用户是否认可产 ...
2026-05-09相关性分析是数据分析领域中用于探究两个或多个变量之间关联强度与方向的核心方法,广泛应用于科研探索、商业决策、医疗研究、社 ...
2026-05-09 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-05-09在数据驱动运营的时代,指标是连接业务目标与实际行动的核心桥梁,是企业解读业务现状、发现问题、预判趋势的“量化标尺”。一套 ...
2026-05-08在存量竞争日趋激烈的商业时代,“以客户为中心”早已从口号落地为企业运营的核心逻辑。而客户画像作为打通“了解客户”与“服务 ...
2026-05-08 很多数据分析师每天与Excel打交道,但当被问到“什么是表格结构数据”“它和表结构数据有什么区别”“表格结构数据有哪些核 ...
2026-05-08在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-05-07在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28