zhongxn

卡方分箱

分箱的原因:1、模型稳定:在一般情况下建立分类模型是,需要对连续变量进行离散化,离散后的特征能够去除噪声,对异常值不再敏感,使得模型可以更加的稳定。2、简化模型:降低样本中的个别信息对模型的影响,降低过拟合的风险。分箱的目的:1、离散特征的增加和减少很容易,易于模型的快速迭代。2、稀疏向量内积乘法运算速度快,计算结果方便存储,容易扩展。3、列表内容离散化后的特征对异常数据有很强的鲁棒性。【离散化后

zhongxn

2020-08-23

37.4817 3 0
  • 关注作者
  • 收藏

卡方分箱

分箱的原因:1、模型稳定:在一般情况下建立分类模型是,需要对连续变量进行离散化,离散后的特征能够去除噪声,对异常值不再敏感,使得模型可以更加的稳定。2、简化模型:降低样本中的个别信息对模型的影响,降低过拟合的风险。分箱的目的:1、离散特征的增加和减少很容易,易于模型的快速迭代。2、稀疏向量内积乘法运算速度快,计算结果方便存储,容易扩展。3、列表内容离散化后的特征对异常数据有很强的鲁棒性。【离散化后

zhongxn

2020-08-23

37.4817 3 0
  • 关注作者
  • 收藏

机器学习--K-means

K-means思维导图

zhongxn

2020-07-15

13.5999 3 2
  • 关注作者
  • 收藏

字典推导式(python)

字典推导式可以快速生成一个字典,它的表现形式和列表推导式类似。

zhongxn

2020-07-05

34.5288 5 0
  • 关注作者
  • 收藏

各种数据类型的小总结(Python)

有序序列:可索引无序序列:不可索引可变序列:能增删改,也就是该对象所指向的内存中的值可以被改变,即地址改变不可变序列:不能增删改,该对象所指向的内存中的值可以被改变,当改变某个元素时,所指向的值不能被改变,相当于把原来的值复制后改变,指向新地址。

zhongxn

2020-07-05

34.5107 4 1
  • 关注作者
  • 收藏

各种数据类型的小总结(Python)

有序序列:可索引无序序列:不可索引可变序列:能否增删改不可变序列:不能增删改

zhongxn

2020-07-05

34.4641 4 2
  • 关注作者
  • 收藏

确定变量的数据类型或对象类型 (基于Python)

自用笔记,如果误,望指正。

zhongxn

2020-07-03

56.7647 5 1
  • 关注作者
  • 收藏

if.. else 简写方法(python)

#判断两个数那个大a = 1b = 2if a > b: c = aelse: c = b #简写c = a if a > b else b# 值1 if 条件 else 值2 # 如果条件为真输出 值1, 如果为假 输出值2 。

zhongxn

2020-07-01

23.1723 3 4
  • 关注作者
  • 收藏

列联分析(基于spss 25)

假设 HO:一胎的性别对生育二胎无影响 H1:一胎的性别对生育二胎有影响注:从上图可知,总数=30<40,存在0个预期计数<5,所以看费希尔精确检验结果,P值=0.002<0.05,拒绝原假设,故可认为一胎的性别对是否生育二胎有影响。由PHI=0.573可知,一胎的性别与是否生育二胎有较强的相关。操作步骤:step 1:step 2:step 3:step 4:就可得到上面的结果图

zhongxn

2020-06-27

42.1928 8 6
  • 关注作者
  • 收藏

power bi 文本/数字日期转化为日期格式

文本/数字类型的日期不可直接转换,需利用dax函数 step 1:新建列 step 2:利用dax函数转换

zhongxn

2020-06-16

29.9927 4 2
  • 关注作者
  • 收藏

转换身份证上的数字所代表的男女

step 1:添加自定义列,提取身份证第十七位数(索引从0开始) step 2:转换为整数 step 3: 找到信息,选偶数,偶数为TRUE,奇数为FALSE step 4: step 5: 将false替换为男 结果

zhongxn

2020-06-16

29.9927 4 6
  • 关注作者
  • 收藏

查看所有M函数

step 1:新建空查询 step 2: step 3:转换到表,方便筛选

zhongxn

2020-06-16

29.9927 4 2
  • 关注作者
  • 收藏

mysql思维导图

mysql思 维导图

zhongxn

2020-06-06

24.8633 2 2
  • 关注作者
  • 收藏

牛客网数据库61题打卡练习(1-10题)

为更好的展示代码,选择在csdn码字,指路我的csdn博文连接https://blog.csdn.net/weixin_43288829/article/details/106591231 欢迎各位一起交流学习。 注:牛客网的在线编程是基于SQLite的,所以有些地方的语法会与其他的数据库有些许不同之处。

zhongxn

2020-06-06

0.2790 2 4
  • 关注作者
  • 收藏

Excel-筛选与拆分组

筛选与拆分组 原数据 step 1: step 2: step 3: step 4: 结果:筛选销售区域可得到该区域所有销售员的销售业绩情况,而不是只出现第一个单元格内的值

zhongxn

2020-06-03

18.0618 4 5
  • 关注作者
  • 收藏

Excel-二级下拉菜单

制作二级下拉菜单 step 1: step 2: step 3: step 4: step 5: step 6: 结果:

zhongxn

2020-06-02

13.9731 2 3
  • 关注作者
  • 收藏

EXCEL(day2)--学习思维导图

excel第二天学习思维导图

zhongxn

2020-05-31

27.4531 4 5
  • 关注作者
  • 收藏

EXCEL--项目排期表

step1:选择适合的图表 step2:调整数据 step3:调整细节 将数据条起始调至从纵坐标开始 若该项目跨月,则根据实际情况可以修改坐标格式中的格式代码、以及间隔单位

zhongxn

2020-05-31

27.2565 4 5
  • 关注作者
  • 收藏

EXCEL(day1)--学习思维导图

excel模块第一天的思维导图

zhongxn

2020-05-31

27.1812 4 5
  • 关注作者
  • 收藏

EXCEL-字母饼图(第二绘图区的占该分类下的百分比)

step1:选中数据--插入所有图表--选择饼图--选择字母饼图 step2:右击母饼图中任一一个部分--设置数据点格式--第二绘图区改为3 step3:设置你喜欢的颜色 step4:设置辅助列 step4:右击字母饼图--添加数据标签--设置数据标签格式--后面操作按下图所示

zhongxn

2020-05-31

27.2254 4 0
  • 关注作者
  • 收藏