做出连续变量的分布图,单侧检验只看一侧;双侧检验是看两侧,每一侧占一半。使用单侧检验的几种情况:与难度有关,F检验,二项分布,“优于”问题
liting李
2021-05-31
SELECT L.C# As 课程ID,L.score AS 最高分,R.score AS 最低分 FROM SC L ,SC AS R WHERE L.C# = R.C# and L.score = (SELECT MAX(IL.score) FROM SC AS IL,Student AS IM
liting李
2021-05-31
使用row_number()函数。举个例子,假设你你有一个产品表,有一个销量表,你需要提取产品的销量排名的第二条和第三条,则:select * from (select *,row_number()over(partition by a.产品ID order by b.销量 desc) as cn from 产品表 ajoin 销量表 b on a.产品ID=b.产品ID) a where a.c
liting李
2021-05-31
1)去重指定多列去重,这是在dataframe没有独一无二的字段作为PK(主键)时,需要指定多个字段一起作为该行的PK,在这种情况下对整体数据进行去重。Attention:主要用到了drop_duplicates方法,并设置参数subset为多个字段名构成的数组。 >>>import pandas as pd >>>data={'state':[1,1,2,2,1,2,2],'pop':['a'
liting李
2021-05-31
数据库:传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。数据仓库:数据仓库系统的主要应用主要是OLAP(On-Line Analytical Processing),支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
liting李
2021-05-31
limit2,1是跳过2条取出第一条数据,limit后面是从第二条开始读,读取1条信息,即读取第三条数据; limit 2 offset 1是从第一条(不包括)数据开始取出2条数据,limit后面跟的是第2条数据,offset后面是从第1条数据开始读取,即读取2,3条。
liting李
2021-05-30
交叉连接(cross join):显示两张表所有记录一一对应,没有匹配关系进行筛选,也被称之为:笛卡尔积。 完整语法:左表cross join 右表 MySQL语法: 左表join 右表 或 左表,右表
liting李
2021-05-26
卡尔积又叫笛卡尔乘积,是一个叫笛卡尔的人提出来的。简单的说就是两个集合相乘的结果。具体的定义去看看有关代数系的书的定义。直观的说就是集合A{a1,a2,a3} 集合B{b1,b2}他们的笛卡尔积是 A*B ={(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2)}任意两个元素结合在一起
liting李
2021-05-26
Z-score是一维或低维特征空间中的参数异常检测方法。该技术假定数据服从高斯分布,异常值是分布尾部的数据点,因此远离数据的平均值。距离的远近取决于使用公式计算的归一化数据点z i的设定阈值Zthr:其中xi是一个数据点,μ是所有点xi的平均值,δ是所有点xi的标准偏差。然后经过标准化处理后,异常值也进行标准化处理,其绝对值大于Zthr:Zthr值一般设置为2.5、3.0或3.5。
liting李
2021-05-26
异常值分析是检验数据是否有录入错误以及含有不合常理的数据。忽视异常值的存在是十分危险的,不加剔除地把异常值包括进数据的计算分析过程中,对结果会产生不良影响;重视异常值的出现,分析其产生的原因,常常成为发现问题进而改进决策的契机。异常值也称为离群点,异常值的分析也称为离群点分析。
liting李
2021-05-26
转化率低,除了详情页、价格、文案、主图,还有就是流量入口会导致转化率降低:淘宝多个流量入口,不同的流量入口,访客质量以及流量精准度都是不一样的,因为每个入口展示给的人群是不一样的,所以最终的转化也不同。就像手淘推荐的流量,虽然流量大,但是转化都是偏低的,都是根据买家过往测览等行为进行推荐的商品,从首页去找喜欢并且感兴趣的产品,需求度是不高的。要说高转化渠道还是手淘索用户有需求直接搜索,因此搜索需求
liting李
2021-05-26
ASCII编码,只能编码127个字符,所以数量有所限制 GB2312(2个字节)中国用来编写中文并且建立在ASCII码上,不能与ASCII冲突。之后,韩国、日本都有自己的编码 and so on. Unicode编码(2个字节),把所有语言都统一到一套编码里。缺点是2个字节,浪费存储空间。 UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成
liting李
2021-05-26
例如将:1532311689 =》2018-07-23 10:8:9语句如下:select *,FROM_UNIXTIME(time,’%Y-%m-%d %H:%i:%s’) as date from red_packet重点是:FROM_UNIXTIME(addtime,’%Y-%m-%d %H:%i:%s’)
liting李
2021-05-25
Python中的对象包含三要素:id、type、value其中id用来唯一标识一个对象,type标识对象的类型,value是对象的值is判断的是a对象是否就是b对象,是通过id来判断的==判断的是a对象的值是否和b对象的值相等,是通过value来判断的如下代码或许可以帮助你理解。>>> a = 1>>> b = 1.0>>> a is bFalse>>> a == bTrue>>> id(a)12
liting李
2021-05-24
定义和用法DATEDIFF() 函数返回两个日期之间的时间。语法DATEDIFF(datepart,startdate,enddate)startdate 和 enddate 参数是合法的日期表达式。datepart 参数可以是下列的值:datepart 缩写年 yy, yyyy季度 qq, q月 mm, m年中的日 dy, y日 dd, d周 wk, ww星期 dw, w小时 hh分钟 mi,
liting李
2021-05-24
提前在annaconda promt安装pymysql代码: pip install pymysql -i https://pypi.tuna.tsinghua.edu.cn/simple
liting李
2021-05-22
跳出率是指在只访问了入口页面(例如网站首页)就离开的访问量与所产生总访问量的百分比。跳出率计算公式:跳出率=访问一个页面后离开网站的次数/总访问次数
liting李
2021-05-22
1、网站要合理的排版和布局。结构简洁明了的网站会让用户产生如沐春风的感觉,自然愿意多在网站停留一段时间了。2、网站的内容。总的来说,精良的网站内容会让用户停留更多时间。3、合理的导航和适当的内部链接锚文本。导航能让用户从任何页面都能够很轻易的回到其他想去的页面,但是导航切不可盲目的追求美观而去使用一些flash或者其他的搜索引擎难以辨认的内容,实用就行,一般可以直接使用文字导航,这样简洁明了。另外
liting李
2021-05-22