京公网安备 11010802034615号
经营许可证编号:京B2-20210330
作者 | SUNIL RAY
编译 | CDA数据分析师
Simple Yet Powerful Excel Tricks for Analyzing Data
介绍
我一直都很佩服Excel强大的数据分析能力。这款软件不仅能够进行基本的数据计算,还可以使用它来进行数据分析。它被广泛用于许多的领域内,包括财务建模和业务规划等。对于数据分析领域的新手来说,Excel它可以成为一个很好的跳板。
甚至来说在学习R或Python之前,最好先了解一下Excel。将Excel添加到你的技能库中没有什么坏处。Excel具有非常广泛的功能:可视化功能、数组,使你能够迅速的通过数据产生洞察力,否则这些数据将很难看到价值。
当然Excel它也有一些缺点。比如它不能非常有效地处理大型的数据集。相信每个人都已经遇到了这个问题。当你尝试对大约200,000个条的数据进行数据计算的时候,你会注意到excel开始出现问题。当然有一些方法可以解决这个问题并在一定程度上处理这些数据,但是Excel并不是一个处理大数据的工具。在有大型数据集的情况下,R或Python是最好的选择。
我很幸运,我学习的旅程始于Excel。多年来,我学到了许多技巧,学会了许多可以更快处理数据的技巧。Excel具有许多功能。选择最好的一个功能有时会会很令人困惑的。在本文中,将为大家提供一些在Excel的技巧,这样可以节省工作或处理数据的时间。这篇文章比较适合那些热衷于升级其数据分析技能的人们。
需要注意的是:如果你认为自己是数据科学领域的大师级人员,那么你可能觉得这篇文章对你来说不会有任何帮助。对于其他人,我建议你练习这些技巧以对它们有一个具体的了解。
常用函数
1. Vlookup():这个函数有助于在表中搜索值并返回相应的值。让我们看一下下表(Policy和Customer)。在“Policy”表中,我们希望基于公共的字段“Customer_id”从Customer表中找到“City”的名称。在这里,函数vlookup()就可以帮助你完成这项工作。
语法:= VLOOKUP(查找的值,要查找的区域,查找区域的第几列,是否相对匹配)
对于上述问题,我们可以在单元格“ F4”中将公式写为= VLOOKUP(B4,$ H $ 4:$ L $ 15,5,0),这将返回所有客户ID 1的城市名称并将该公式复制到所有的客户ID中。
提示:不要忘记使用“ $”符号锁定第二个表的范围,因为如果不锁定的话,可能会在向下复制公式的时候出现错误。而这就是所谓的相对引用。
2. CONCATINATE():将两个或多个单元格中的文本合并为一个单元格非常有用。例如:我们要基于主机名和请求路径的输入来创建URL。
语法:= Concatenate(文本1,文本2,.....文本n)
那么我们可以使用公式= concatenate(B3,C3)并向下复制公式来解决上述问题。
提示:当然我更喜欢使用“&”符号,因为它比键入完整的“连接”公式要短,并且执行出来完全相同的结果。该公式也可以写为“ = B3&C3”。
3. LEN() 这个函数告诉你单元格的长度,也就是包括空格和特殊字符在内的字符数。
语法:= Len(文本)
例如:= Len(B3)= 23
4. LOWER(),UPPER()和PROPER() –这三个函数分别帮助我们可以将文本更改为小写,大写和句子大小写(每个单词的首字母大写)。
语法:=upper(文本)/lower(文字)/proper(文字)
在数据分析项目中,这些有助于将不同案例的类别转换为单个情况下的类,否则将它们视为给定要素的不同类别。看下面的照片这种,A列有五个类(标签),其中B列只有两个类(因为我们已将内容转换为小写)。
5. TRIM(): 这是一个非常方便的函数,用于清除文本中开头和结尾的空白。通常,当你从数据库中获取数据进行单独存储的时候,你要处理的文本中的一些可能会被填充为空白。而且,如果你不处理它们,它们也将被视为列表中的一条数据,这对你来说肯定是没有帮助的。
语法:= Trim(文本)
6. If():我发现这个函数是excel中最有用价值的函数之一。它使你可以使用条件公式,当某件事为真时,它使用一种计算方式,而当某件事为假时,则进行另一种计算方式。例如,你要将每个销售标记为“高”和“低”。如果销售额大于或等于$ 5000,则标记为“高”,否则标记为“低”。
语法:= IF(条件,条件为真的计算,条件为假的计算)
从数据产生推理
1.数据透视表: 当你处理公司的数据时,你都在寻找问题的答案,例如“北部地区的分公司贡献了多少收入?”或“产品A的平均客户数量是多少?”等等。
Excel的数据透视表可帮助你轻松地回答这些问题。数据透视表是一个汇总表,可以让你根据所选的特征进行计数,求平均值,求和并执行其他计算,即,它将数据表转换为推理表,这有助于我们做出决策。查看下面的图片:
在上面,你可以看到左侧的表具有针对每个客户的销售明细,并提供了区域和产品。在右表中,我们总结了区域级别的信息,现在可以帮助我们生成一个推论,也就是南部地区的销售额最高。
创建数据透视表的方法: 步骤1:单击数据列表中的某处。选择插入选项卡,然后单击数据透视表。Excel将自动选择包含数据(包括标题)的区域。如果没有正确选择区域,请在区域上拖动以手动选择合适的区域。最好将数据透视表放在新的工作表上,因此单击“ 新建工作表”作为位置,然后单击“ 确定”。
步骤2:现在,你可以看到“数据透视表字段列表”的面板,其中包含列表中的字段;你需要做的就是将它们放在面板底部的框框中。完成此操作后,左侧的图表将成为数据透视表。
在上面,你可以看到我们在行中安排了“Region”,在列中安排了“Product id”,并以“Premium”的总和作为值。现在你准备好使用数据透视表了,它显示地区和产品保费总和。您还可以使用计数、平均值、最小值、最大值和其他汇总度量。。
2.创建图表:在excel中创建图表只需要选择要绘制的数据范围并按F11即可。这会创建一个默认图表样式的excel图表,但您可以通过选择不同的图表样式来更改它。如果您希望图表与数据位于相同的工作表上,请按ALT + F1而不是按F11。
当然,无论哪种情况,一旦创建了图表,就可以根据自己的特定需求进行自定义图表,以传达所需的消息。
数据清理
1.删除重复值: Excel具有内置的功能,可以从表中删除重复值。它根据选定的列从给定表中删除重复的值,即,如果你选择了两列,则它将搜索具有两列数据相同组合的重复值。
在上面,您可以看到A001和A002有重复的值,但是如果我们同时选择“ID”和“Name”列,那么我们只有一个重复的值(A002, 2)。请按照以下步骤删除重复值:选择数据–>转到数据功能区–>删除重复项
2.文本分列: 假设你将数据存储在列中,如下图片所示。
在上面,你可以看到值之间用分号“;”分隔。现在要将这些值拆分到不同的列中,我建议在excel中使用“ 分列 ”功能。请按照以下步骤将其转换为不同的列:
基本键盘快捷键
键盘快捷键是快速浏览单元格或更快输入公式的最佳方法。在下面列出了我们的经常会使用的一些快捷键。
注意:这不是一个完全的快捷键列表。你可以在下面的评论部分中随意分享你在Excel中最喜欢的键盘快捷键。实际上,我使用这些快捷方式基本上完成了80%的excel任务。
结语
Excel可以说是有史以来最好的程序之一,它一直是全球几乎所有企业的黄金选择标准。但是,无论你是新手还是高级用户,总有一些东西需要学习。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22