置信水平是随机抽取的m次样本, 计算出的m个置信区间包含总体均值的个数与m的比。但是我们实际只是抽取一次样本,根据其统计量计算置信区间。那么描述这个置信区间的置信水平该怎么理解呢?
liuyong2730
2020-08-07
一直对概率密度函数感到费解,今天在重新看了老师的录播视频,又在网上查了下,终于明白了。概率密度函数是概率函数的导数,有点像物理中物体质量密度的概念。一个物体在某点处的密度,就是质量函数的导数,而密度取值则是该点处导数的极限的值。质量就是对某段区间求的积分,密度越大,对积分的大小(质量大小)的影响越大。质量一定是对空间的体积而言的,一个点是没有质量的。同理,概率是密度函数在某段区间的积分,概率一定是
liuyong2730
2020-07-17
一直对概率密度函数感到费解,今天在重新看了老师的录播视频,又在网上查了下,终于明白了。概率密度函数是概率函数的导数,有点像物理中物体质量密度的概念。一个物体在某点处的密度,就是质量函数的导数,而密度取值则是该点处导数的极限的值。质量就是对某段区间求的积分,密度越大,对积分的大小(质量大小)的影响越大。质量一定是对空间的体积而言的,一个点是没有质量的。同理,概率是密度函数在某段区间的积分,概率一定是
liuyong2730
2020-07-17
自定义函数的语法为: def 函数名(参数): “”“文档内容放在函数内部首行,并加三对引号”“” 函数语句 return 变量名比如自定义一个判断奇数偶数的函数: def num_check(x): if x%2=0: return '偶数' else:
liuyong2730
2020-07-15
感觉还是要多练。上课时老师会给出几分钟时间给我们大家自己试一试。一定要充分利用好这个时间去试一下,不然讲的时候虽然懂了。过一天再去做题目,就会感觉很不确定,因为有好多细节,只有在实践当中才能体会到,实践了之后才会记忆深刻。当然记忆力超群的优秀的同学就不不需要了哈。
liuyong2730
2020-07-15
循环语句主要有for 循环和while。在使用循环时,可以层层嵌套。如果要跳出循环,有如下几种方法:使用continue。 continue 的作用是忽略本次循环中continue后面的语句,直接进行本层循环的下一轮。使用break。Break的作用是跳出本层循环。如果要跳出所有的循环,需要在最外层的循环中使用break。使用布尔变量控制,在循环语句中用if语句判断是否需要把该变量赋值为false
liuyong2730
2020-07-14
行列式其实是一种运算表达式,本质上是一个数值,需要按照行列式的运算规则计算出来。行列式的特点:行列式的行数和列数必须相等计算表达式的每一项是不同行不同列的乘积是n!项的代数和每一项的符号由下标构成的全排列的逆序数的奇偶性确定行列式可以按照计算通式算出结果,但是计算通式的计算量非常大,比如4阶行列式是4!=24项的代数和,5阶就要达到120项,因此实际计算中不可能按照通式计算(计算机对于行列式的处理
liuyong2730
2020-07-11
1,提出假设2,确定适当的统计量3,规定显著性水平4,计算检验统计量的值5,做出决策第一步提出假设是非常重要的,如果提错了,后面的就没有任何意义了。假设分为H0原假设和H1备择假设,两者是对立关系。H0假设----研究者想推翻,但不容易推翻,不能根据对错,好坏,喜欢或者不喜欢提出H0假设。H1假设----研究者想支持但不容易支持的提假设的时候要清楚研究者是谁,然后把旧的,普遍的,稳定的作为原假设,
liuyong2730
2020-07-09
今天试了下excel里的地图,感觉比PowerBI里的好用很多,功能很强大,操作也很方便,还可生成带背景音乐的动画,效果非常不错。以后的工作中如果需要用到这种展示的话,PowerBI就不用考虑了吧。
liuyong2730
2020-07-04
昨天师兄的分享,让我们对数据分析工作有了具体的认识。虽然听的不清楚,不过大概也听懂了很多。脸皮要厚,搞清楚需求,要摸清领导的胃口,要能从数据中发现经验感知不到的信息和知识。以前觉得学好工具就可以了,其实学习分析的方法和思维才能在以后的实际业务中以不变应万变。 今天的交流课上看到了每个组的特点,大家学习的都很认真。对大家分享的案例,印象深刻,感觉很多厉害的小伙伴。不过更
liuyong2730
2020-07-02
在学习课程之前,其实也在经常使用excel。只不过一般都是日常工作中的各种记录,比如加班记录,工作量登记表,供应商投诉记录表等等。一般月底会整理统计,做成报表。不过基本上要花费一天的时间去专门做这个事情,包括记录里的有问题的信息还需要再核对。没有意识到,这是一个数据分析的过程。学习了cda的课程后,意识到原来工作中的表的数据结构不合理,表之间的关系比较混乱,分析使用的方法和指标等还需
liuyong2730
2020-06-30
powerbi里的筛选器函数是非常重要的一类函数,在很多情况下扮演关键角色,如果不能理解他们,很多分析就无法进行。earlier是其中比较让人产生误解和难掌握的一个。earlier字面的意思是更早的,但是实际使用中很难从这个意义上去理解。如果要理解这个函数,就需要对dax函数的底层逻辑有本质的认识。Power BI 中函数处理的对象最小单位是列,意味着每一次计算都是对列中第一行到最后一行的的迭代循
liuyong2730
2020-06-28
在power BI中,维度筛选度量的汇总方式有两种:第一种是传统的类型,维度对度量直接合并同类项计算,这一种很容易理解,不用举例了。第二种是跨表连接的情况下,对维度下的所有连接用关键字段项在度量值所在表里做汇总计算这些关键字段对应的度量值。这一种比第一中多一个步骤,即先找到维度下对应的关键字段,然后再汇总所有这些关键字段在度量值所在表里的度量值。例如下表中订单提成表通过产品表和订单表连接,如果用订
liuyong2730
2020-06-26
在powerBI中有重要的一个工作环节是建立数据模型。数据模型说的有点抽象,其实具体指的就是通过主键连接起来的多个表。表之间只有通过主键关联了起来,才能够实现后面的动态图标,才能从不同维度观测数量。 建模就是指关联表的过程。 表之间有三种对应关系:一对一(主键和主键列匹配),一对多(主键和非主键列匹配)和多对多(非主键列和非主键列匹配)。不同的对应关系对应的连接后结果集中
liuyong2730
2020-06-26
昨天课上介绍了三个时间智能函数:previousmonth、dateadd和totalMTD。我在power BI 里做了测试,感觉dateadd函数比其它两个复杂。先说下昨天的两个思考题:dateadd函数参照时间段时的汇总逻辑:按照指定的参考时间段、方向和偏移量以及单位返回结果时间段,并且参考时间段的起点和终点在偏移后不能跨单位。如:指定时间段为20190329-20190331,方向和偏移量
liuyong2730
2020-06-25
今天课上有一个练习 :查询本周过生日的同学信息。 根据课上的思路:因为有平年和闰年,同月同日在不同年份对应的周序可能是不一样的,先要把学生的生日中的年份替换成2020(当前日期的年份),再判断它是不是在当前周开始和结束日期之间。当前周的开始和结束日期是以今天是一周中的第几天为依据计算出的,而判断今天是当前周的第几天用week()函数就能得出来了。 计算过程
liuyong2730
2020-06-19
数据库中,空值是一种特殊的类型,经过老师的讲解和练习,对于空值我有以下认识。 不能跟任何类型值比较,如select null=null 返回结果是空值,对于空值,只能用is null 或 is not null 来判断,才能返回布尔值。 在多表连接时,如果连接条件里含有空值,不会连接。 在做子查询时候,如果用子查询中含有空值,where 返回的结果是空。 如:查询普通员工工资等级,子查询结果是领导
liuyong2730
2020-06-17