动态窗口函数:first_value() / last_value()/nth_value()/聚合函数用于开窗 如没有指定排序和滑动窗口范围,默认计算的是分区内的所有记录。 指定分区和排序后,如没有指定滑动窗口范围,默认计算的是分区内的第一行到当前行。静态窗口函数:row_number() / rank() / dense_rank()/percent_rank() / cume_dist()/
从今天开始不熬夜
2022-08-04
开窗函数的一个概念是当前行,当前行属于某个窗口,窗口由 over关键字用来指定函数执行的窗口范围,如果后面括号中什么都不写,则意味着窗口包含满足where 条件的所有行,开窗函数基于所有行进行计算;如果不为空,则有三个参数来设置窗口:partition by子句:按照指定字段进行分区,两个分区由边界分隔,开窗函数在不同的分区内分别 执行,在跨越分区边界时重新初始化。 order by子句:按照指定
从今天开始不熬夜
2022-08-04
开窗函数和普通聚合函数的区别:聚合函数是将多条记录聚合为一条;而开窗函数是每条记录都会执行,有几条记录执行完还是几 条。 聚合函数也可以用于开窗函数中。
从今天开始不熬夜
2022-08-04
MySQL从8.0开始支持开窗函数,开窗函数是在满足某种条件的记录集合上执行的特殊函数,对于每条记录都要在此窗口内执行函数。开 窗函数的本质还是聚合运算,只不过它更具灵活性,它对数据的每一行,都使用与该行相关的行进行计 算并返回计算结果。
从今天开始不熬夜
2022-08-03
子查询虽然很灵活,但是执行效率并不高。执行子查询时,MySQL需要为内层子查询的查询结果建立一 个临时表,然后外层主查询在临时表上进行查询和筛选。查询完毕后再撤销这些临时表,这里多了一个 创建和销毁临时表的过程。因此,子查询的速度会受到一定的影响,如果查询的数据量比较大,这种影响就会随之增大。
从今天开始不熬夜
2022-08-03
MYSQL中子查询出现的位置,1.出现在select子句中:将子查询返回结果作为主查询的一个字段或者计算值(标量子查询、列子查询)2.出现在where/having子句中:将子查询返回的结果作为主查询的条件(标量子查询、行子查询、列子查询、表子查询)3.出现在from或join子句中:将子查询返回的结果作为主查询的一个表(标量子查询、行子查询、列子查询、表子查询)
从今天开始不熬夜
2022-08-03
多表连接的结果通过三个属性决定: •方向性:在外连接中写在前边的表为左表、写在后边的表为右表 • 主附关系:主表要出所有的数据范围,附表与主表无匹配项时标记为null,内连接时无主附表之分
从今天开始不熬夜
2022-08-02
select语句执行顺序:FROM ---WHERE ---GROUP BY ---HAVING--- SELECT ---ORDER BY--- LIMIT.
从今天开始不熬夜
2022-08-02
where与having的区别:where子句作用于表,having子句作用于组;where条件查询的作用域是针对数据表进行筛选,而having条件查询则是对分组结果进行过滤;where在分组聚合计算之前筛选行,而having 在分组聚合之后筛选分组的行,因此where子句不能使用聚合函数.
从今天开始不熬夜
2022-08-02
MySQL中常用的聚合函数SUM(对一个数值字段求和),AVG(对一个数值字段求平均值),MAX(对一个数值或日期时间字段求最大值),MIN(对一个数值或日期时间字段求最小值),COUNT(对一个或多个字段计数)
从今天开始不熬夜
2022-08-02
• SQL语句可以单行或多行书写,用英文的分号结尾 • SQL关键字之间用空格分隔 • 可以用换行和缩进来增强语句的可读性 • SQL关键字不区分大小写 • 可以用#或-- 进行单行注释,也可以用/* */进行多行注释
从今天开始不熬夜
2022-08-01
• 数据库:存储数据的容器,同一个数据库管理系统中数据库名必须唯一• 表:数据以表的形式存储在数据库中,同一个数据库中表名必须唯一• 字段:数据以字段为单位存储在表中,同一个表中字段名必须唯一 • 记录:一条记录即为一个实体 • 以字段为基本存储和计算单位,每个字段的数据类型必须一致
从今天开始不熬夜
2022-08-01
•int:大整数型,有符号大小-2147483648~2147483647, 无符号大小0~4294967295 • float:单精度浮点型,适合存储对精度要求不高的小数。 • decimal:十进制小数型,适合金额、价格等对精度要求较高的数据存储。默认decimal(10,0),表示最多10位数字,其中0位小数。 • char:固定长度字符串型,长度为1-255。如果长度小于指定长度,右边填充
从今天开始不熬夜
2022-08-01
python中的参数估计: pdf:概率密度函数; pmf:离散数据 cdf:累积分布函数,给定临界值,求下尾概率; ppf:累积分布函数的反函数,给定下尾概率,求临界值; sf:生存函数(1-cdf),给定临界值,求上尾概率; isf:生存函数的反函数:给定上尾概率,求临界值
从今天开始不熬夜
2022-07-31
可视化分析方法:1.比较分析:簇状柱形图、簇状条形图、雷达图 2.构成分析:饼图、圆环图、树状图、旭日图、瀑布图 3.序列分析:折线图、面积图 4.统计分析:直方图、散点图、气泡图、箱型图
从今天开始不熬夜
2022-07-31
帕累托分析可以帮助找重点、关键.步骤:1、计算维度项下的汇总值,并降序排序(簇状柱形图);2、计算维度项下的汇总值的累计百分比(折线图);3、找到累计百分比是80%左右位置的维度项,截至到当前维度项的所有项就是核心/重点.
从今天开始不熬夜
2022-07-30