京公网安备 11010802034615号
经营许可证编号:京B2-20210330
深入理解SQL大逻辑
1、只要结果不问过程
当我们写出一条SQL语句后,SQL语句是到数据库中去执行的,具体怎么理解和执行SQL是数据库的事,我们关心的事儿就是如何写好SQL语句,别让数据库对我们的SQL产生误解,造成SQL无法执行或者执行错误就好了。
有句古话,叫做“但行好事,莫问前程”,意思是自身要多做义举做好当下,而不要去牵挂往后的发展,这句话套用在SQL上就是“但行好事,莫问过程”,SQL只管告诉数据库,我要的数儿是什么,而不用管数据库是用什么方法把数据给你一行行提取出来的。
从个人经验来看,对与一个以前从未有过编写计算机程序的读者来说,学习SQL反而更加容易一些。这是因为SQL是一种非过程化编程语言。所谓的”非过程化”,是指不要求我们给出SQL查询的执行过程,只需要用户定义出执行后数据的结果,具体的执行过程则由执行该语言的数据库来实现。
如果你对上述叙述感到费解,那么恭喜你,你可能不会遇到以前因为学习过某种计算机编程语言的既有知识带给你学习SQL的困恼。
2. SQL的可视化理解
我们经常看到别人编写的很长的一段SQL语句,分析该语句的执行目的对于SQL初学者往往很困难。在这一节里,我们将结合一个非常具体的案例帮助大家理解SQL语句的执行顺序。
假设在数据库(或者Excel)里有以下两个表格,两个表格分别命名”左表”和”右表”。这两个表格是企业培训系统数据局中常见的数据结构,左表是为企业每个员工设置的他所要参加的培训类别,一个员工可以被指定多个培训类别(或者叫做”培训科目群组”),而每个培训类别包含多个培训项目,具体的培训类别和培训项目对照放在右表中。请仔细了解并弄懂以下两个表格之间的关系,因为,后面的解说全部参照这两个表格中的数据。
现在,结合这两个表格,我们想得到如下一个综合的表格:通过这个综合表格,可以知道每一个员工被指派的”所有具体的培训项目”。我们知道,在这个案例中,即使不用SQL,我们也能以左右两个表格中共有的”培训类别”字段作为关联获得这个结果。
假设我们对SQL还不是很熟悉,还不具备手动书写SQL的能力,请教了一位专家,他帮我们写出的SQL语句如下:
下面的问题是,怎么理解这个SQL语句呢?我们已经知道最基础的SQL语句是由SELECT…FROM…WHERE三段儿组成的,这三段儿的执行顺序如下图所示:
在最基础的SQL语句中,最先执行的是FROM,FROM关键字后面通常是SQL语句所涉及的所有表格名称,在这里涉及两个表格:[左表],[右表] 。
当该SQL语句发送到数据库时,FROM代码段中的两个表格会做一个交叉对接的操作,也就是:用左表的每一行记录和右表的每一行记录对接,形成一行新的记录,执行过程如下图。
FROM代码段的执行结果是在数据库内存中形成下面一个中间结果表格(我们在界面上是看不到的)。
执行完FROM代码段后,第二步执行的SQL语句段儿是WHERE,在案例中的SQL语句中WHERE语句段中的内容是:WHERE[左表].[培训类别]=[右表].[培训类别]
该语句段的作用相当于对FROM代码段的结果执行了一个”筛选”操作。筛选条件是:[左表].[培训类别]=[右表].[培训类别],筛选结果如下:
当整个SQL语句的FROM,WHERE代码段执行完毕后,最后执行的是SELECT代码段,SELECT代码段中的内容是:SELECT [工号],[左表].[培训类别],[培训项目] ,该代码段中的内容很好理解,就是把前面两步执行结果中的特定的列提取出来。我们还知道,如果想提取所有的列,可以把SELECT代码段改写成:SELECT *
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01在数据驱动决策的时代,企业与从业者每天都会面对海量数据——电商平台的用户行为数据、金融机构的信贷风险数据、快消品牌的营销 ...
2026-04-01在数字化转型的浪潮中,企业数据已从“辅助运营的附属资源”升级为“驱动增长的核心资产”,而一套科学、可落地的企业数据管理方 ...
2026-04-01在数字化时代,每一位用户与产品的交互都会留下可追溯的行为轨迹——电商用户的浏览、加购、下单,APP用户的注册、登录、功能使 ...
2026-03-31在日常数据统计、市场调研、学术分析等场景中,我们常常需要判断两个分类变量之间是否存在关联(如性别与消费偏好、产品类型与满 ...
2026-03-31在CDA(Certified Data Analyst)数据分析师的职场实战与认证考核中,“可解释性建模”是核心需求之一——企业决策中,不仅需要 ...
2026-03-31多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30在TensorFlow深度学习实战中,数据集的加载与预处理是基础且关键的第一步。手动下载、解压、解析数据集不仅耗时费力,还容易出现 ...
2026-03-30在CDA(Certified Data Analyst)数据分析师的日常工作中,“无监督分组、挖掘数据内在聚类规律”是高频核心需求——电商场景中 ...
2026-03-30机器学习的本质,是让模型通过对数据的学习,自主挖掘规律、实现预测与决策,而这一过程的核心驱动力,并非单一参数的独立作用, ...
2026-03-27在SQL Server数据库操作中,日期时间处理是高频核心需求——无论是报表统计中的日期格式化、数据筛选时的日期类型匹配,还是业务 ...
2026-03-27在CDA(Certified Data Analyst)数据分析师的能力体系与职场实操中,高维数据处理是高频且核心的痛点——随着业务场景的复杂化 ...
2026-03-27在机器学习建模与数据分析实战中,特征维度爆炸、冗余信息干扰、模型泛化能力差是高频痛点。面对用户画像、企业经营、医疗检测、 ...
2026-03-26在这个数据无处不在的时代,数据分析能力已不再是数据从业者的专属技能,而是成为了职场人、管理者、创业者乃至个人发展的核心竞 ...
2026-03-26在CDA(Certified Data Analyst)数据分析师的能力体系中,线性回归是连接描述性统计与预测性分析的关键桥梁,也是CDA二级认证的 ...
2026-03-26在数据分析、市场研究、用户画像构建、学术研究等场景中,我们常常会遇到多维度、多指标的数据难题:比如调研用户消费行为时,收 ...
2026-03-25在流量红利见顶、获客成本持续攀升的当下,营销正从“广撒网”的经验主义,转向“精耕细作”的数据驱动主义。数据不再是营销的辅 ...
2026-03-25在CDA(Certified Data Analyst)数据分析师的全流程工作中,无论是前期的数据探索、影响因素排查,还是中期的特征筛选、模型搭 ...
2026-03-25在当下数据驱动决策的职场环境中,A/B测试早已成为互联网产品、运营、营销乃至产品迭代优化的核心手段,小到一个按钮的颜色、文 ...
2026-03-24在统计学数据分析中,尤其是分类数据的分析场景里,卡方检验和显著性检验是两个高频出现的概念,很多初学者甚至有一定统计基础的 ...
2026-03-24