CDA117556

水一期

数据分析师主要是描述性统计和推断性统计,正态分布。正态分布、标准化、偏度、峰度、中心极限定理、假设检验、线性分析、anova、皮尔逊、斯皮尔曼关联分析、残差分析机器学习方法:sklearn、xgboost、lightGBM、无监督的聚类分析、树模型、偏自然语言、算法所需要的硬性技能:tabular data science CV方向:分割、目标检测、细粒度图像分类、曲面图像、NLP

CDA117556

11小时前

12.9287 2 0
  • 关注作者
  • 收藏

面向对象

/www.cnblogs.com/ideal-20/p/11050146.html 1. 类和对象1.1 什么是面向过程?什么又是面向对象?面向过程——步骤化面向过程就是分析出实现需求所需要的步骤,通过函数(方法)一步一步实现这些步骤,接着依次调用即可面向对象——行为化(概念相对抽象,可结合下面的例子理解)面向对象是把整个需求按照特点、功能划分,将这些存在共性的部分封装成类(类实例化后才是对象),

CDA117556

11小时前

12.9287 2 0
  • 关注作者
  • 收藏

区分sql distinct和 dax distinctcount

(3条消息) 5、DAX的常用表函数之VALUES与DISTINCT_夕枫hhhh-CSDN博客_dax values函数

CDA117556

22小时前

20.5234 4 0
  • 关注作者
  • 收藏

字符串函数,时间日期函数

字符串函数:concat(str1,str2,str3) 合并文本函数instr(str,substr) 返回substr在str的位置,不在返回0left(str,len) 返回str从左边开始len个数right(str,len)返回str从右边开始len个数mid(str,position,[len]) 返回str从position位置开始len个数substring(expression

CDA117556

1天前

17.4828 4 0
  • 关注作者
  • 收藏

用户价值判断逻辑,先提取所有信息表,划定新量纲,做出条件判断评分,求均值,确定高低值,高低判断确定是什么客户?

淘宝案例用户价值分析(推送广告前进行):RFM:-- 用户价值分析-- 每个用户消费时间间隔、消费频次、消费金额select user_id, max(日期) as 最近一次消费日期, timestampdiff(day,max(日期),'2014-12-19') as 消费时间间隔, count(*) as 消费频次, sum(amount) as 消费金额from u

CDA117556

1天前

17.9763 6 0
  • 关注作者
  • 收藏

荣威销售额面试题代码总结

荣威销售额面试题partition by 与 group by 的联合使用, partition在计算单度量值时可以对group取得的表格进行分区,这种情况一般group by 多个字段;老师的:select *from (select store_id, item_id, sum(sales) as 商品销售额, sum(sum(sales)) over(partition by s

CDA117556

2天前

19.0348 6 0
  • 关注作者
  • 收藏

having里不能使用开窗函数,以及开窗函数中order by 用跟不用的区别,累计值要用

8、产品贡献定量分析找到产生购买行为的类别类目按照类目分组产品贡献定量分析(帕累托分析)(累积销售额百分比=累积销售额/总销售额)select item_category, sum(amount) as 销售额, sum(sum(amount)) over(order by sum(amount) desc) as 累积销售额, sum(sum(amount)) over()

CDA117556

2天前

20.8139 7 0
  • 关注作者
  • 收藏

得昂面试题

、关联找出前三名,返回名字和分数的合并值,注意可能有并列存在。表格中学生各科成绩在一列,所有课程名称在一列,学生名称在一列,当然在三个表中。返回结果其实也用到了列转行,但是此题需求更为明显。因为是列转行,用不到limit;我的代码:select t.lesson_id, group_concat(if(排序=1,stu_name,null),score) 第一名, gro

CDA117556

2天前

30.6440 6 0
  • 关注作者
  • 收藏

高德 题目 老师的or表连接 我的 union

高德题目:乘客司机同属用户,信息在一张用户表内,有的用户因故被禁止;订单表乘客id和司机id在两列,其中订单有完成、被司机取消、被客户取消,同一订单时间用户司机共享;我的代码:select client_id, sum(status_type='completed') 完成行程数, avg(status_type='cancelled_by_driver') 被司机取消率from trips

CDA117556

3天前

33.6822 6 0
  • 关注作者
  • 收藏

行为转化中 lag开窗函数

淘宝案例 行为转化分析,分组取出的表中上一行下一行比值,上一行用开窗函数lag() over()-- 2.行为转化分析(转化率=当前行为人数/上一行为人数)select behavior_type, count(distinct user_id) as 用户人数, lag(count(distinct user_id),1) over(order by if(behavior_typ

CDA117556

3天前

33.6822 6 0
  • 关注作者
  • 收藏

group by 和窗口分区的表现区别

select user_id, login_date, max(login_date) over(partition by user_id) 最晚登陆日期 from user_log; select user_id, login_date, max(login_date) over(partition by user_id) 最晚登陆日期 from user_log group by user

CDA117556

3天前

34.0963 6 0
  • 关注作者
  • 收藏

开窗函数 拓展

nth_value() over() 返回窗口第n行的值ntile(n) over() 每组数据分成n个片区装在n个桶里,桶里不能相差超过一,常用于在一列中不同类别前多少名的情况使用percent_rank() over () 分组内当前rank值-1/分组总行-1,可以说是序号占比了cume_dist() over() 分组内累计占比

CDA117556

4天前

40.4992 7 0
  • 关注作者
  • 收藏

连续天数sql

6、-- 选出各城市连续完单天数最长的快车司机 select city_name,driver_id,司机连续完单天数 from (select city_name, driver_id, count(*) as 司机连续完单天数, max(count(*)) over(partition by city_name) as 城市最长连续完单天数 from (select *, row_nu

CDA117556

4天前

8.4984 7 0
  • 关注作者
  • 收藏

上课sql代码总结

缺失值处理 select sum(user_id is null), sum(item_id is null), sum(item_category is null), sum(behavior_type is null), sum(user_geohash is null), sum(times is null), sum(amount is n

CDA117556

4天前

97.7644 8 0
  • 关注作者
  • 收藏

开窗函数

开窗函数:动态窗口函数:聚合函数()over(partiton by order by row/range between and)first()(partiton by order by row/range between and) 第一个last()(partiton by order by row/range between and) 最后一个nth()(partiton by orde

CDA117556

5天前

157.0244 6 0
  • 关注作者
  • 收藏

子查询使用个人总结

需要用子句嵌套where作用于表,having 作用于组;where 不能用聚合函数,但可以嵌套子句;标量子查询 用法:作为单值做判断,where语句中不能直接用聚合函数,但能用标量子查询做判断;行子查询 用法:可以作为where子句里面的判断参照,也可以作为from后边的表或者被连接的表格,也可以作为select 度量值里面的某个参数列子查询 用法: 可以作为where 子句里面 in的判断

CDA117556

2022-01-19

2.9103 6 0
  • 关注作者
  • 收藏

dax

1、dax dateadd 进官网 分类函数在左侧2、distinctcount distinctcountnoblank 去重非空计数时间日期函数:dateadd datemtd3、运算符 <> 不等于 AND且 && OR或|| IN IN在表中是否包含元素 NOT NOT将逻辑求反4、calculate(

CDA117556

2022-01-19

2.9104 7 0
  • 关注作者
  • 收藏

sql总结1

sql 是一种结构化查询语言1、数据库是按照一定数据结构来组织、存储和管理数据的仓库;数据:包含信息的载体都是数据数据库管理系统:DBMS是一个大型复杂的基础软件系统,是用户和操作系统间的一层数据管理软件。能科学地组织和存储数据,高效地获取和维护数据。具有数据定义(DDL data define languiage)、数据组织、存储管理(数据操作语言DML data Manipulation la

CDA117556

2022-01-19

19.8549 5 0
  • 关注作者
  • 收藏

子查询

9、行子查询:select empno, ename,job,deptnofrom empwhere (deptno,job)=(select deptno,job from emp where ename='smith' ) and ename<>'smith';10、子查询操作符:not in() 在/不在其中any 满足其中任意一个a

CDA117556

1周前

31.8368 8 0
  • 关注作者
  • 收藏

子查询

8、标量子查询:select * from empwhere sal>(select avg(sal) from emp);9、行子查询:select empno, ename,job,deptnofrom empwhere (deptno,job)=(select deptno,job from emp where ename='smith' ) and en

CDA117556

1周前

37.6361 8 0
  • 关注作者
  • 收藏
12>