比如1个特征下面有1,2,3个属性,二分叉,就有 1 2和3,1 3和2,1和2 3三种组合方式去分?分为1和非1,2和非2,3和非3这样三个分隔位置,比较这三个切分位置的基尼系数,最小的作为这个特征的基尼系数,再与其他特征比较
读童话的狼
2021-03-19
accuracy是分类算法是评估指标,表示的是预测正确的比例,不可以用于回归
读童话的狼
2021-03-19
代码没有问题,在其他电脑上可以运行,换用谷歌浏览器可以正常运行
读童话的狼
2021-03-19
少了空格,pip install jupyter_contrib_nbextensions -i https://pypi.douban.com/simple/
读童话的狼
2021-03-15
样本属于正样本的概率roc_curve和auc的官方说明教程示例:from sklearn.metrics import roc_curve, auc# 数据准备>>> import numpy as np>>> from sklearn import metrics>>> y = np.array([1, 1, 2, 2])>>> scores = np.array([0.1, 0.4, 0.3
读童话的狼
2021-03-15
df['电话'].fillna(0).astype('int64').astype('string').str.extract(r"(^1[35789]\d{9}$)")re.match()要传入一个字符串,列表不行的,而且match()之后会有空值,再提取对应的值也比较麻烦
读童话的狼
2021-03-15
以管理员启动anaconda prompt,并且依次运行下面命令1 安装jupyter_contrib_nbextensionspip install jupyter_contrib_nbextensions2 安装javascript和css文件jupyter contrib nbextension install --user3 安装jupyterlab-tocjupyter labexten
读童话的狼
2021-03-15
有变化的,上面这个选的2,3,6,9,12列,下面选的是1,6,9,10,12列训练模型用的特征不一样,输出的特征重要性也不一样这个name是一样的,只会选前几个
读童话的狼
2021-03-13
执行下面命令降低一下nbconvert版本,版本小于6就不会报错了pip install nbconvert==5.6.1 -i https://pypi.mirrors.ustc.edu.cn/simple
读童话的狼
2021-03-11
先执行set sql_safe_updates=0;然后再执行导入数据的代码
读童话的狼
2021-03-11
在分类、聚类算法中,需要使用距离来度量相似性的时候、或者使用PCA技术进行降维的时候,StandardScaler表现更好(避免不同量纲对方差、协方差计算的影响);在不涉及距离度量、协方差、数据不符合正态分布、异常值较少的时候,可使用MinMaxScaler。(eg:图像处理中,将RGB图像转换为灰度图像后将其值限定在 [0, 255] 的范围);
读童话的狼
2021-03-11
这个参数是指定箱体种数据的聚合方式,用来将箱子中的所有值减少为一个数字也就是这个箱子里有很多的值,用聚合后的一个值来代替
读童话的狼
2021-03-11