热线电话:13121318867

登录
2020-02-28 阅读量: 928
有监督分类模型有哪些评估方式

在介绍方法开始首先了解一下四个概念:
TP即True Positive:预测正确的正样本个数。
TN即True Negative:预测正确的负样本个数。
FP即False Positive:将负样本错误的预测成为正样本的个数。
FN即False Negative:将正样本错误的预测成为负样本的个数。

1.Accuracy(准确率):

简单粗暴的方法,直接用 预测正确的个数/总数 x 100% 即(TP+TN)/(TP+FN+FP+TN),但这个评估方法只适用于平衡数据集,即正负样本个数大致相同,若用于非平衡数据集效果会很差。

2.Precision(精确率):

精确率可以告诉我们正样本预测中正确的预测的百分比,即TP/(TP+FP)

3.Recall(召回率):

召回率可以告诉我们预测正确的正样本个数占总正样本个数的百分比,即TP/(TP+FN),通常,精确率和召回率成反比。

4.F score:

Fscore很好的将精确率P和召回率R结合在一起,计算方式:F1 = 2*(PR/(P+R)),当F1=1时情况最好。

5.ROC曲线:

ROC曲线是根据一系列不同的二分类方式(分界值或决定阈),以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线。
其中真阳性率TPR=TP/(TP+FN),假阳性率FPR=FP/(FP+TN)。

6.AUC(area under the curve):

AUC可以说是用单个数字总结模型性能的最好方法,其实就是ROC曲线下方的面积大小。使用AUC值作为评价标准是因为很多时候ROC曲线并不能清晰的说明哪个分类器的效果更好,而作为一个数值,对应AUC更大的分类器效果更好。

0.0000
3
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子