考试中心
CDA网校
CDA社区
CDA竞赛
CDA技术答疑
CDA会员
CDA产品
大数据与人工智能实验室
好学AI
(下一代智能学习产品)
CDA网校
CAIE人工智能工程师认证
文房思宝
热线电话:13121318867
首页
课程中心
就业邦:
CDA数据分析周末就业班2025
CDA数据分析脱产就业班2025
CDA敏捷算法建模周末班
职业技能:
CDA 业务数据分析 LEVEL Ⅰ 实操班
CDA 商业策略分析 LEVEL Ⅱ 集训营
CDA 机器学习与深度学习 LEVEL Ⅲ 集训营
资讯
动态
认证考试
企业内训
搜索
登录
热搜话题:
ai长文生成
Scikit-learn
Python
大数据
数据分析师
统计学
微积分
线性代数
Excel
Power BI
R语言
SPSS
Mysql
快速发帖
我要提问
大魔王泛泛
2020-03-13
阅读量:
888
如图:数据透视表有缺失值,那么原数据也会有吗?
没缺失值的原数据做出的数据透视表可以有缺失值
0.0000
0
1
关注作者
收藏
评论(0)
发表评论
暂无数据
CDA考试动态
考试介绍
考试大纲
考试内容
考试地点
CDA报考指南
报考流程
考试时间
报名费用
联系我们
热门栏目
考试动态
报考指南
复习备考
职业发展
直播公开课
经验分享
推荐帖子
anranhui
2020-06-18
2条评论
决策树中经常用熵作为判别条件而不是基尼不纯度?基尼不纯度是什么?
绝大部分情况下熵(entropy)和基尼指数(Gini Index)在决策树节点分裂时做出的决策都是等价的。 先看一下如何定义节点分裂时的不纯度函数(impurity)有三种(假设有k个类别): 不难看出,三个函数均为凸函数。只不过误分率(函数1)是分段线性函数(piece-wise linear),有时候节点分裂会无法降低不纯度。所以函数2和3一般是常采用的手段,它们的优势如下: 二者
PhilipLiang
2020-06-18
6条评论
决策树剪枝策略及优缺点
预剪枝 在决策树的生长过程中限制其规模,使其较早的停止生长。对每个节点划分前用验证集进行估计,通过比较划分前后的验证集精度来判断是否剪枝。若当前节点的划分不能带来决策树泛化能力的提升,则停止划分并标记当前节点为叶子结点。 优缺点:预剪枝使得决策树的很多分支没有“展开”,降低了过拟合的风险,还能够减少决策树的训练时间以及预测事件开销。但是,有些分支可能当前划分不能提升模型的泛化性能甚至导致泛化性能
PhilipLiang
2020-06-18
7条评论
ID3,C4.5,CART算法对比
ID3 ID3决策树可以有多个分支,但是不能处理特征值为连续的情况。在ID3中,每次根据“最大信息熵增益”选取当前最佳的特征来分割数据,并按照该特征的所有取值来切分,也就是说如果一个特征有4种取值,数据将被切分4份,一旦按某特征切分后,该特征在之后的算法执行中,将不再起作用。ID3算法十分简单,核心是根据“最大信息熵增益”原则选择划分当前数据集的最好特征,信息熵是信息论里面的概念,是信息的度量方式
anranhui
2020-06-18
4条评论
树算法:ID3,C4.5,C5.0和CART¶的相互关系
ID3(迭代二分法3)由Ross Quinlan于1986年开发。该算法创建多路树,为每个节点(即,以贪婪的方式)找到分类特征,该分类特征将为分类目标产生最大的信息增益。将树长到最大大小,然后通常应用修剪步骤以提高树概括未见数据的能力。 C4.5是ID3的后继版本,并通过动态定义离散属性(基于数字变量)来消除要素必须分类的限制,该离散属性将连续属性值划分为离散的间隔集。C4.5将训练后的树(即