詹惠儿

判断分布是哪种类型的目的和使用环节是什么呢?

问: 判断分布是哪种类型的目的和使用环节是什么呢? 答: 判断分布是哪种类型的目的主要是看符不符合检验的前提假设,例如t-检验的假设是检验的数据满足正态分布,小样本不满足正态分布的数据用t-检验就会造成较大的偏差, 一般是在小数据中会考虑这个问题,在大数据中基本不用去判别数据的分布类型,因为大数定理中证明了,样本数>=30时,样本均值的分布可以近似看做正态分布。

詹惠儿

2020-05-25

0.0000 0 2
  • 关注作者
  • 收藏

这个热力图的对角线表示什么?

问: 这个图里面对角线表示什么? 答: 这个热力图点的大小表示x轴与y轴对应的变量的相关性,从下面给出的源代码中可以看出, 绘制热力图前已经进行了筛选,将相关系数<=0.9的点的值变得很小很小,因此图上只显示相关系数>0.9的点。 而热力图上的对角线上的点,分别对应每个变量与自己的相关系数,因为在对角线上的点在x轴与 y轴的取值是一样的,同时这些点的取值都是1,因为每个变量自己与自己肯定是

詹惠儿

2020-05-25

63.3205 4 1
  • 关注作者
  • 收藏

python报错:ModuleNotFoundError: No module named mglearn

问: python报错:ModuleNotFoundError: No module named mglearn 答: mglearn是python第三方包,需要先执行代码进行安装,安装方式如下: 在jupyter上:!pip install mglearn -i https://pypi.tuna.tsinghua.edu.cn/simple 在cmd上:pip install mgle

詹惠儿

2020-05-22

38.1852 3 2
  • 关注作者
  • 收藏

python函数中,有些参数不写的话,机器会默认成什么呢?

问: python函数中,有些参数不写的话,机器会默认成什么呢? 答: python函数的定义中,是可以给参数定义默认值的,当设置了默认值时,调用该函数即使不给该参数赋值也不会报错, 因为系统会自动使用默认值,而当没设置参数默认值时,调用该函数却没有给该参数赋值就会出现报错。在jupyter中, 可以点击shift tab键来查看对应函数的帮助文档,帮助文档中会对该函数的每个参数及参数默认

詹惠儿

2020-05-22

38.0670 2 2
  • 关注作者
  • 收藏

logit和logistic模型有什么联系及区别?

问: logit和logistic模型有什么联系及区别? 答: 二者区别及联系总结如下: (1)二者的根本区别在于广义化线性模型中的联系函数的形式。logit采用对数形式log(a), logistic形式为log(a/1-a)。 (2)应用上,普通logistic的响应变量是二元的,多元logistic的因变量可为多元。logit的 响应变量可以是多元的。 (3)统计软件spss中: logi

詹惠儿

2020-05-22

38.0671 3 1
  • 关注作者
  • 收藏

这段代码运行后有警告但没有结果是怎么回事?

问: 这段代码运行后有警告但没有结果是怎么回事? 答: 这是因为这段代码中最后一句代码是将log. predict (xtest)赋值给变量y_log, 并没有将y_log输出,而在python中,默认是输出一个shell中最后一句代码的结果, 所以执行这段代码是没有输出任何结果的,如果想要看前面几行代码的结果, 可以通过代码设置全部行都能输出来可以查看每一行的结果: from IPyt

詹惠儿

2020-05-21

33.8551 3 2
  • 关注作者
  • 收藏

下面代码用replace函数哪里不对呢

问: 下面代码用replace函数哪里不对呢 答: 这里使用replace函数不是仅把s[i]替换成s[i].lower(),而是会将所有和s[i]一样的字符都替换成s[i].lower(), 例如下面这个例子,会将所有G替换为g,而不仅仅是替换s[1]上的G 这道题的解法可以参考如下做法:

詹惠儿

2020-05-21

33.8469 2 4
  • 关注作者
  • 收藏

fit和fit_transform有啥区别呢?

问: fit和fit_transform有啥区别呢? 答: fit和transform没有任何关系,仅仅是数据处理的两个不同环节,之所以出来fit_transform这个函数名,仅仅是为了写代码方便,会高效一点。 sklearn里的封装好的各种算法使用前都要fit,fit相对于整个代码而言,为后续API服务。fit之后,然后调用各种API方法,transform只是其中一个API方法,所以当你

詹惠儿

2020-05-21

0.3218 1 3
  • 关注作者
  • 收藏

*range(... 那个为什么要加星呢?

问: *range(... 那个为什么要加星呢? 答: 这里如果不加*,[range(0,6),range(32,58)]得到的是类似二维数组的数据 这样不符合dataframe索引的规则,而加了*可以把列表内的数据展开,这样使用data.iloc[,]就可以进行切片取值

詹惠儿

2020-05-21

33.8469 2 6
  • 关注作者
  • 收藏

这个var 里面的元素是什么?

问: 这个var 里面的元素是什么? 答: 这里的第一个参数和第三个参数t,j,是异常值的最小阈值和最大阈值,是根据业务来定的, i是字段名,主要用来对数据进行索引

詹惠儿

2020-05-21

33.8048 2 3
  • 关注作者
  • 收藏

python报错:IndexError :tuple index out of range

问: python报错:IndexError :tuple index out of range 答: 第一个参数为样本的常量,不需要加引号,同时将代码最后多余的[source]去掉即可。

詹惠儿

2020-05-21

33.5251 1 3
  • 关注作者
  • 收藏

python报错:FileNotFoundError:[Errno 2] File drinks. csv does not exist:'drinks. csv'

问: python报错:FileNotFoundError:[Errno 2] File drinks. csv does not exist:'drinks. csv' 答; 这是因为该数据文件没有放在当前jupyter所在的目录地址下,可以使用%pwd查看当前目录地址,然后检查下该地址下有没有存放这个数据文件

詹惠儿

2020-05-21

33.8469 2 4
  • 关注作者
  • 收藏

段‘continent’含‘NA’值,为什么导入数据后没有出现缺失值?

问: 字段‘continent’含‘NA’值,为什么导入数据后没有出现缺失值? 答: 这是因为导入数据时,设置了keep_default_na=False,我们在使用pandas读取文件时,常会遇到某个字段为NaN。 一般情况下,这是因为文件中包含空值导致的,因为pandas默认会将 '-1.#IND', '1.#QNAN', '1.#IND', '-1.#QNAN', '#N/A N/

詹惠儿

2020-05-21

33.5251 1 4
  • 关注作者
  • 收藏

python卸载第三方包时报错:系统无法将文件移到不同的磁盘驱动器

问: python卸载第三方包时报错:系统无法将文件移到不同的磁盘驱动器 答: 这是因为此电脑上的python正在调用对应的库,某些文件被占用导致系统无法卸载,解决方法就是关掉Python,再重新进行卸载就行了。

詹惠儿

2020-05-20

33.3863 3 2
  • 关注作者
  • 收藏

python报错:Impor tError : cannot import name .factorial' from.scipy. misc

问: python报错:Impor tError : cannot import name .factorial' from.scipy. misc 答: 这是因为anaconda自带的statsmodels包里关联的其他包如scipy和此电脑上的版本不一致,需要先把anaconda自带的statsmodels包卸载 然后重新下载statsmodels包,再运行此代码即可。

詹惠儿

2020-05-20

33.3863 3 3
  • 关注作者
  • 收藏

python报错:ImportError :cannot import :name Vq from. scipy. cluster

python报错:ImportError :cannot import :name Vq from. scipy. cluster 答: 这是因为scipy包版本比较低或者包损坏,先运行代码pip uninstall scipy将scipy卸载,再运行代码pip install scipy 重新下载scipy即可

詹惠儿

2020-05-20

33.3863 3 1
  • 关注作者
  • 收藏

热力图上中间那条线是什么意思呢

问: 热力图上中间那条线是什么意思呢 答: 这个图用于显示变量间的相关程度,图上中间的斜线上所有的点都表示是某个变量与其自己作相关比较,自己与自己比较相关系数肯定是1的,所以会显示成一条斜线

詹惠儿

2020-05-20

33.3863 3 2
  • 关注作者
  • 收藏

这个热力图图怎么看

问: 这个热力图图怎么看哇 气体综合 和 烟碱量 答: 这个热力图是把存在高相关关系(相关系数>0.9)的变量显示出来,有显示的点对应的变量就是高相关的变量,如下图所示的5个点: 例如下方的这个点表示变量过滤时效01和变量v3燃料类型存在高相关关系

詹惠儿

2020-05-20

33.4590 4 2
  • 关注作者
  • 收藏

python报错:NameError: name .selector is not defined

问: python报错:NameError: name .selector is not defined 答: select包是已经包装成功了的,这里是因为前面selector=RFE(rfr,n_features_to_select=5).fit(x54_1,y54_1)语句被注释起来没运行, 把前面的#去掉,运行selector=RFE(rfr,n_features_to_selec

詹惠儿

2020-05-20

33.1405 2 3
  • 关注作者
  • 收藏

如果后期想安装其他python第三方包的代码,该上哪里去查呢

问: 如果后期想安装其他python第三方包的代码,该上哪里去查呢 答: pip install 库名,这个是安装python第三方库的语法,需要安装啥包,就把包的名字替换掉, 例如安装missingpy,就是执行pip install missingpy这句代码即可, 又由于安装python第三方库默认使用的是国外镜像源,会比较慢 建议可以在代码中指定镜像源安装,例如可以指定使用清华的镜像源就

詹惠儿

2020-05-20

33.3249 4 3
  • 关注作者
  • 收藏
<1666768165>