热线电话:13121318867

登录
2018-11-16 阅读量: 9947
如何评估Logistic回归模型的拟合度和准确度?

在线性回归中,我们检查调整后的R²,F统计量,MAE和RMSE,以评估模型拟合度和准确度。 但是,Logistic回归采用了所有不同的指标集。 在这里,我们处理概率和分类值, 以下是用于Logistic回归的评估指标:

1. Akaike信息标准(AIC)

您可以将AIC视为多元回归中调整后的r square的对应物。 这是模型拟合的重要指标。 它遵循以下规则:越小越好。 AIC惩罚模型中越来越多的系数。 换句话说,向模型添加更多变量不会让AIC增加。 它有助于避免过度拟合。

查看一个模型的AIC指标并没有多大帮助。 它在比较模型(模型选择)时更有用。 因此,构建2或3个Logistic回归模型并比较它们的AIC。 具有最低AIC的模型将相对更好。

2.无效偏差和剩余偏差

观察的偏差计算为该观察的对数可能性的-2倍。 可以使用其类型进一步理解偏差的重要性:零和残余偏差。 从没有特征的模型计算空偏差,即仅截距。 零模型通过恒定概率预测类。

残余偏差是从具有所有特征的模型计算的。在与线性回归相关的情况下,将剩余偏差视为残差平方和(RSS)和零偏差作为总平方和(TSS)。 无效和剩余偏差之间的差异越大,模型越好。

此外,您可以使用这些指标来比较多个模型:无论哪个模型具有较低的零偏差,意味着该模型很好地解释了偏差,并且是更好的模型。 此外,降低剩余偏差,更好的模型。 实际上,AIC始终优先于偏差以评估模型拟合。

3.混淆矩阵

混淆矩阵是通常用于评估分类模型的最重要的度量。混淆矩阵是对有监督学习分类算法准确率进行评估的工具。通过将模型预测的数据与测试数据进行对比,使用准确率,覆盖率和命中率等指标对模型的分类效果进行度量

例如,一些实际上是好的客户,我们的模型预测的结果是他为坏,对一些原本是坏的客户,却预测他为好。所以我们需要知道,这个模型到底预测对了多少,预测错了多少,混淆矩阵就把所有这些信息,都归到一个表。

0.0000
4
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子