詹惠儿

2018-12-25   阅读量: 756

数据分析师

如何评估混淆矩阵的精确度?

扫码加入数据分析学习群

无效偏差和剩余偏差

观察的偏差计算为该观察的对数可能性的-2倍。 可以使用其类型进一步理解偏差的重要性:零和残余偏差。 从没有特征的模型计算空偏差,即仅截距。 零模型通过恒定概率预测类。

残余偏差是从具有所有特征的模型计算的。在与线性回归相关的情况下,将剩余偏差视为残差平方和(RSS)和零偏差作为总平方和(TSS)。 无效和剩余偏差之间的差异越大,模型越好。

此外,您可以使用这些指标来比较多个模型:无论哪个模型具有较低的零偏差,意味着该模型很好地解释了偏差,并且是更好的模型。 此外,降低剩余偏差,更好的模型。 实际上,AIC始终优先于偏差以评估模型拟合。

混淆矩阵

混淆矩阵是通常用于评估分类模型的最重要的度量。混淆矩阵是对有监督学习分类算法准确率进行评估的工具。通过将模型预测的数据与测试数据进行对比,使用准确率,覆盖率和命中率等指标对模型的分类效果进行度量

例如,一些实际上是好的客户,我们的模型预测的结果是他为坏,对一些原本是坏的客户,却预测他为好。所以我们需要知道,这个模型到底预测对了多少,预测错了多少,混淆矩阵就把所有这些信息,都归到一个表。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 1 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子