291294878

2018-10-19   阅读量: 847

数据分析师 统计学

如何建立规则的分类器?

扫码加入数据分析学习群

建立规则的分类器:

(1)顺序覆盖。直接从数据中提取规则,规则基于某种评估度量以贪心的方式增长,该算法从包含多个类的数据集中一次提取一个类的规则。在提取规则时,类y的所有训练记录被看作是正例,而其他类的训练记录则被看作反例。如果一个规则覆盖大多数正例,没有或仅覆盖极少数反例,那么该规则是可取的。一旦找到这样的规则,就删掉它所覆盖的训练记录,并把新规则追加到决策表R的尾部(规则增长策略:从一般到特殊或从特殊到一般)

(2)RIPPER算法。(和前面那个差不多,只是规则增长是从一般到特殊的,选取最佳的合取项添加到规则前件中的评判标准是FOIL信息增益,直到规则开始覆盖反例时,就停止添加合取项。而剪枝是从最后添加的合取项开始的,给定规则ABCD->y,先检查D是否应该被删除,然后是CD,BCD等)

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
2.4134 1 2 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子