数据科学专业问答社区，好文章，一字千金--CDA答疑社区

写代码时自动补全是哪个插件？

安装好插件目录之后，勾选Hinterland,可以实现代码自动补全

读童话的狼

2021-03-19

99.9588 1 0

cart树中，每次划分，所有特征的所有属性组合，都去比较吗？

比如1个特征下面有1，2，3个属性，二分叉，就有 1 2和3，1 3和2，1和2 3三种组合方式去分？分为1和非1,2和非2,3和非3这样三个分隔位置，比较这三个切分位置的基尼系数，最小的作为这个特征的基尼系数，再与其他特征比较

读童话的狼

2021-03-19

239.8645 1 0

sns.factorplot()运行完了就是没东西显示

factorplot()是基于图的高级函数，不能通过轴来设置，所以要把两个图单独画，不能当做子图

读童话的狼

2021-03-19

239.8645 1 0

交叉验证，scoring这个参数还可以设置为accuracy后报错：continuous is not supported

accuracy是分类算法是评估指标，表示的是预测正确的比例，不可以用于回归

读童话的狼

2021-03-19

239.8645 1 0

TypeError: print() takes 0 positional arguments but 1 was given

代码没有问题，在其他电脑上可以运行，换用谷歌浏览器可以正常运行

读童话的狼

2021-03-19

239.8645 1 0

NameError: name 'x' is not defined

x是一个变量，可以将x[1,1]改为x=[1,1]

读童话的狼

2021-03-19

239.8645 1 0

'pipinstall jupyter_ contrib_ nbextensions-ihttps:' 不是内部或外部命令，也不是可运行的程序或批处理文件。

少了空格，pip install jupyter_contrib_nbextensions -i https://pypi.douban.com/simple/

读童话的狼

2021-03-15

68.3351 2 0

若是逻辑回归二分类想画roc曲线第二个参数应该传的是什么代码呢？

样本属于正样本的概率roc_curve和auc的官方说明教程示例：from sklearn.metrics import roc_curve, auc# 数据准备>>> import numpy as np>>> from sklearn import metrics>>> y = np.array([1, 1, 2, 2])>>> scores = np.array([0.1, 0.4, 0.3

读童话的狼

2021-03-15

68.3351 1 0

提取一个有效电话号码的工作，专门转化了列表里面的电话类型，检查了是字符，然后报错，应该怎么改呢

df['电话'].fillna(0).astype('int64').astype('string').str.extract(r"(^1[35789]\d{9}$)")re.match()要传入一个字符串，列表不行的，而且match()之后会有空值，再提取对应的值也比较麻烦

读童话的狼

2021-03-15

68.3351 1 0

Jupyter Lab目录插件安装

以管理员启动anaconda prompt，并且依次运行下面命令1 安装jupyter_contrib_nbextensionspip install jupyter_contrib_nbextensions2 安装javascript和css文件jupyter contrib nbextension install --user3 安装jupyterlab-tocjupyter labexten

读童话的狼

2021-03-15

68.3351 1 0

我改了这3个数之后，in 【87】里面结果没有变化呢

有变化的，上面这个选的2,3,6,9,12列，下面选的是1,6,9,10,12列训练模型用的特征不一样，输出的特征重要性也不一样这个name是一样的，只会选前几个

读童话的狼

2021-03-13

63.1478 1 0

这里是干什么，也没听太懂

.iloc[]里面就是行索引和列索引，这里是获取1,6,9,10,12列的所有数据

读童话的狼

2021-03-13

63.1478 1 0

graphviz.source()这个函数是干什么用的

.source()就是获取生成的决策树代码

读童话的狼

2021-03-13

63.1478 1 0

决策树画好之后，如何查看叶子节点的序号？

训练模型以后，model.apply(Xtest)就可以查看了输出的是每个点属于哪个叶子节点

读童话的狼

2021-03-13

63.1478 1 0

安装目录插件之后，日志窗口提示NotebookApp] Config option template_ path not recognized by TocExporter

执行下面命令降低一下nbconvert版本，版本小于6就不会报错了pip install nbconvert==5.6.1 -i https://pypi.mirrors.ustc.edu.cn/simple

读童话的狼

2021-03-11

47.6492 1 0

语句已经去重了，为啥还是会有重复

这一句得到的是去重后的结果，是一个虚拟表，没有对原表进行更改

读童话的狼

2021-03-11

47.6492 1 0

Error Code: 1290. The MySQL server is running with the --secure-file-priv option so it cannot

先执行set sql_safe_updates=0;然后再执行导入数据的代码

读童话的狼

2021-03-11

47.6492 1 0

什么时候用StandardScaler、什么时候用MinMaxScaler

在分类、聚类算法中，需要使用距离来度量相似性的时候、或者使用PCA技术进行降维的时候，StandardScaler表现更好（避免不同量纲对方差、协方差计算的影响）；在不涉及距离度量、协方差、数据不符合正态分布、异常值较少的时候，可使用MinMaxScaler。（eg：图像处理中，将RGB图像转换为灰度图像后将其值限定在 [0, 255] 的范围）；

读童话的狼

2021-03-11

47.6492 1 0

Table of Contents这个图标在哪里？

安装好目录插件之后，点击这个小按钮左侧就会出现Table of Contents了

读童话的狼

2021-03-11

47.6492 1 0

hexbin()中的reduce_C_function参数是啥意思

这个参数是指定箱体种数据的聚合方式，用来将箱子中的所有值减少为一个数字也就是这个箱子里有很多的值，用聚合后的一个值来代替

读童话的狼

2021-03-11

47.6492 1 0