809669515

2018-10-31   阅读量: 788

数据分析师 数据挖掘 机器学习

分类型模型——OneR

扫码加入数据分析学习群

OneR是“一个规则”的缩写,是一种简单但准确的分类算法, 它为数据中的每个预测变量生成一个规则,然后选择总误差最小的规则作为其“一个规则”。 为了为预测器创建规则,我们为每个预测器构建一个针对目标的频率表。已经表明,OneR产生的规则仅比现有技术的分类算法稍微不准确,同时产生了易于人类解释的规则。

OneR算法

对于每个预测变量,

对于该预测变量的每个值,按如下方式制定规则;

计算目标(类)的每个值出现

的频率查找最频繁的类

使规则将该类分配给此预测变量值

计算每个预测变量的规则的总误差

选择总误差最小的预测变量。

例:

使用基于相关频率表的OneR算法找到具有最小总误差的最佳预测器。

最好的预测因素是:

预测者的贡献

简单地说,从频率表计算的总误差是每个预测器贡献的度量。总误差较低意味着对模型可预测性的贡献较大。

模型评估

以下混淆矩阵显示出显着的可预测性。OneR不会产生分数或概率,这意味着评估图表(增益,升力,KS和ROC)不适用。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 1 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子