老师,这里得randint是什么意思? 返回从低到高得整数,这个不是很理解,当时老师讲了一个返回从低到高的整数,不是很明白。 答:这是生成随机数的方法,没有顺序,randint的用法如下所示,这里高与低指的是随机数分布在这个范围内。
PGC123
2020-03-15
老师,我问一下fit是训练数据,那fit_transform是什么意思? 答:fit不仅仅用于训练模型、还可用于数据的预处理。scikit-learn中的许多API都是需要先fit然后才能调用的。 例如:你代码的功能其实是用均值填补缺失值,可以通过下图的栗子来理解 fit transform fit_transform的区别与联系
PGC123
2020-03-15
方差分析,什么情况选可重复,什么情况选无重复呀? 答: 重复能估计偶然误差造成的偏差 而不重复,只能估计交互作用和偶然误差的联合偏差 意思说:重复能估计交互作用,而不重复就不能 方差分析用来 说明 因素是否有显著效应,也就是因素效应的显著性检验, 当ab因素 确实是无交互作用的时候,两种方法效果一致,但的确有交互作用的时候,结论就会出差错,显然有重复的是正确的做法
PGC123
2020-03-09
老师用F检验已经有无法拒绝原假设的结论了,为什么还要再算一遍T分布? 答:要理解这个问题只组要理解F检验与T检验区别就可以了 统计推断有三个步骤 计算点估计值 计算点估计的抽样分布标准差 根据以上两个来得到检验统计量,使用t检验时计算t值,使用F检验时计算F值 t检验的t值认定服从t分布,F检验的F值认定服从F分布 先说为啥要进行假设检验(t检验,f检验),而不是仅仅点估计之后就结束
PGC123
2020-03-09
F统计量的P值是怎么算的? 答: p值就是说出现统计量极端值的概率,官方解释就是统计量目前值及更不利于的0假设值的概率这是定义!具体含义是0假设成立时,犯第一类错误的概率
PGC123
2020-03-09
答:这是使用列表的索引时候经常会发生的错误。原因是你的索引超过了列表实际索引长度造成的。由于列表是可变的数据类型,因此在代码中某个列表已经改变了,但是后面的代码还按照之前的索引来使用就会发生问题。
PGC123
2020-03-05
答:列表的切片语法 list[start:stop:step] start:起始索引 stop:终止位置 start 或stop 为负数 代表倒数第几个元素 step:步长 为负数代表反向取值(从右向左)
PGC123
2020-03-05
老师,我这行输入没有输出 答:在ipython notebook 中输出有两种形式:使用print()函数 或者 ipython自动输出。 print()函数只要传参就可以输出了,ipython的自动输出的原则是:输出当前代码的值,比如我们执行一个变量或者执行有返回值的函数都会有输出,并且输出带 OUT 标志。 这里 a=1 b=2 赋值语句没有值,所以不会自动输出。
PGC123
2020-03-05
老师,列表推导式不能应用于元组对吧? 答:列表生成式也可以从[] 变为()。 通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。 所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不
PGC123
2020-03-05
老师,下面那个为什么输出的不对? 答:主要问题在于你代码的第6行 list9[i][j] list10[i][j] 的结果不是一个列表,而是一个求和后是数字,并且 所以得到的结果是错误的。
PGC123
2020-03-05
distinct 报语法错误1064,代码及报错如下: 答:这是distinct的用法不熟练所致,distinct只能在select 之后出现,他可以作用于一个字段之上,也可以作用于多个字段之上 select distinct 字段1 from some_table; 作用于多个字段,如果distinct后方多个字段,去重去的就是3个字段“同时相同”的记录 select distinct
PGC123
2020-03-03
老师,不平衡数据集指的是特征值缺失较多的情况,不是指标签0—1多少之间的不平衡吧 答: 不平衡字面意思就是分布的不均匀的意思,数据集不平衡就是指样本标签0-1 分布不均衡,是对Y变量的描述。如果单独对样本的某一个特征变量来说也可以,表示该字段取值分布不均衡。
PGC123
2020-03-01
为什么我运行create_data.ipynb说找不到这个路径呢?图片就存在这里 答:首先注意文件路径是否正确,这里使用的是绝对路径,路径是否更换为自己的真实路径?经检查代码是按照老师代码过来的,路径未改变所致。
PGC123
2020-03-01
老师这个报错是什么意思呢? 答:这是因为文件类型错误导致的,pickle.load() 用于读取pkl类型的文件,如果给的文件类型不对程序无法解析文件数据所以会报错。 需要注意的是csv pkl都是文件的后缀,从本质上来说,文件的后缀名不重要,重要的是文件本身数据的组织形式。因此找到对的数据此报错就会解除。
PGC123
2020-03-01
老师,帮忙看下,在网上找了原因没找到 答:报错字面意思是函数 最高工资.max不存在。其实很容易可以发现代码中where关键字后面的语句错误,如果想表达子查询中的max(sal) 列需要在子查询中定义别名,否则会引起歧义。 select deptno,max(sal) top_sal from emp group by deptno ## 给max(sal) 起别名 top_sal 其实
PGC123
2020-03-01