京公网安备 11010802034615号
经营许可证编号:京B2-20210330
Excel中使用SQL语句汇总表格
上一节我们学习了通过Excel数据透视表对多个工作表进行快速汇总,这仅仅是一种特殊的情况。我们在实际工作中经常遇到的情况是,要汇总的每个工作表中有多列文本。但是这些工作表的列数据结构完全相同,也就是列数相同,列数据项目的先后顺序也相同,但是行数可以不同,今天我们来学习下在Excel中使用SQL语句汇总表格。
使用导入数据+SQL数据查询的方法是目前这类问题最好的解决方法之一。这种方法的实质就是将各个Excel工作表当成数据库的表进行连接查询,得到一个查询数据集,这个数据集中保存有各个工作表的所有数据,然后将这个查询记录集的数据保存到工作表,或者以此为基础制作普通的数据透视表,从而得到需要的报表。
需要注意的是,为了能够利用导入数据+SQL数据查询的方法汇总多列文本情况下的多个工作表数据。每个工作表的第一行最好是数据区域的列标题。如果每个工作表的第一行不是数据区域的列标题。就需要先对数据区域定义名称,或者在SQL语句中进行特殊处理。
图1所示为3个城市的销售数据工作表“北京”、“上海”和“天津”,每个工作表保存有不同销售部门的各个产品的销售量和销售额数据。现在要把这3个工作表的数据合并到一张工作表上,或者直接制作数据透视表,以便于进行各种统计分析。
图1
下面是利用SQL数据查询的方法来汇总具有多列文本的多个工作表数据的具体方法和步骤。
1、在任何一个工作表中单击“数据”选项卡,在“获取外部数据一功能组中单击“现有连接”按钮,如图2所示,打开“现有连接”对话框。如图3所示。
图2
图3
2、单击对话框左下角的“浏览更多”按钮,打开“选取数据源”对话框,如图4所示。
图4
3、从保存该工作簿的文件夹中选择该文件,如图5所示。
图5
4、单击“打开”按钮,打开“选择表格”对话框,从表格列表中任选一个表格,并要选择“数据首行包含列标题”复选框,如图6所示。
图6
5、单击“确定”按钮,打开“导入数据”对话框,如图7所示。
图7
6、单击“属性”按钮,打开“连接属性”对话框,如图8所示。切换到“定义”选项卡,在“命令文本”文本框中输入以下SQL命令(如图9所示):
图8
图9
select '北京'as城市,*from[北京$]union all
select '上海'as城市,*from[上海$]union all
select '天津'as城市,*from[天津$]
7、单击“确定”按钮,返回到“导入数据”对话框。
根据需要,可以选择“表”单选按钮或者“数据透视表”单选按钮,并指定数据的保存位置,最后单击“确定”按钮,印可得到需要的汇总表。
图10所示是选择“表”单选按钮后得到的汇总数据清单。
图10
图11
关于SQL语句的小知识:
本节介绍了利用SQL语句对多个具有多列文本工作表数据进行查询汇总的基本方法,下面简要介绍SQL语句的基本知识。
在众多的SQL语句中,SELECT语句是使用最频繁的。SELECT语句主要用来对数据库进行查询并返回符合用户查询标准的结果数据。
SELECT语句有5个主要的子句,而FROM是唯一必需的子句。每一个子句有大量的选择项和参数。
SELECT语句的语法格式如下:
SELECT字段列表
FROM子句
[WHERE子句]
[GROUP BY子句]
[HAVING子句]
[ORDER BY子句]
SELECT语句的各项组成说明如下:
(1)字段列表
字段列表指定多个字段名称。各个字段之间用半角逗号“。”分隔。用星号“*”表示所有的字段。当包含有多个表的字段时。可用“数据表名。字段名”表示,即在字段名前标明该字段所在的数据表。
例如。“select日期,产品编号,销售量,销售额”就是选择数据表中的“日期”、“产品编号”、“销售量”和“销售额”这4个字段。还可以在字段列表中自定义宇段。例如SQL语句“select日期,产品编号,销售量,销售额。“北京'as城市from[北京$]”中,除了查询工作表“北京”中的宇段“日期”、“产品编号”、“销售量”和“销售额外”。还自定义了一个工作表中没有的字段“城市”。并将“北京”作为该宇段的数据。由于“北京”是一个文本。因此需要用单引号括起来。将某个数据保存在自定义字段的方法是利用AS属性词。即“'北京'as城市”。
(2)FROM子句
FROM子句是一个必需子句,指定要查询的数据表,各个数据表之间用半角逗号“。”分隔。
但要注意。如果是查询工作簿中的数据表,就必须用方括号将工作表名括起来,并且工作表名后要有美元符号($)。
例如。“select日期,产品编号,销售量,销售额from[北京$]".就是查询工作表“北京”中的字段“日期”、“产品编号”、“销售量”和“销售额”。
如果要查询的是Access数据库、SQL Server数据库等关系型数据库的数据表,在FROM后面直接写上数据表名即可。
(3)WHERE子句
WHERE子句是一个可选子句,指定查询的条件。可以使用SQL运算符组成各种条件运算表达式。
例如“WHERE部门=“销售部”就表示要查询的部门是“销售部”的数据。
如果条件值是数值,则直接写上数值,如“WHERE年龄>50";如果条件值是字符串。则必须用单引号“'”括起来。如“WHERE部门='销售部'”;如果条件值是日期,则必须用井号“#”或单引号“'”括起来。如“WHERE日期:=#2007-12-22#”。
(4)GROUP BY子句
GROUP BY子句是一个可选子句,指定分组项目,使具有同样内容的记录(如日期相同、部门相同、性别相同等)归类在一起。
例如,“GROUP BY性别”就表示将查询的数据按性别分组。
(5)HAVING子句
HAVING子句是—个可选子句,功能与WHERE子句类似,只是必须与GROUP BY子句一起使用。
例如,要想只显示平均工资大于5000元的记录并按部门进行分组,则可以使用子句“GROUPBY部门HAVING AVG(工资总额)>5000"。
(6)ORDERBY子句
ORDER BY子句是一个可选子句,指定查询结果以何种方式排序。排序方式有两种:升序(ASC)和降序(DESC)。如果省略ASC和DESC.则表示按升序排序。
例如。“ORDER BY姓名ASC"就表示查询结果按姓氏拼音升序排序;而“ORDER BY工资总额。年龄DESC”则表示查询结果按“工资总额”从小到大升序排序,“年龄”按从大到小降序排序。
此外,在实际工作中可能要查询工作簿中的多个工作表或者数据库中的多个数据表。这就是多表查询问题。
多表查询有很多种方法。例如。利用WHERE子句设置多表之间的连接条件。利用JOIN…ON子句连接多个表。利用UNION或者UNION ALL连接多个SELECT语句等。
Excel中使用SQL语句汇总表格时,如果我们要查询多个工作表或数据表的数据,并将这些表的数据生成一个记录集。那么可以利用UNION ALL将每个表的SELECT语句连接起来。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12