评估机器学习模型的指标：召回率，精确率和F值-CDA数据分析师官网

热线电话：13121318867

首页大数据时代评估机器学习模型的指标：召回率，精确率和F值

评估机器学习模型的指标：召回率，精确率和F值

2020-07-27

机器学习中、完成建模之后，我们需要对模型的效果做评价，而召回率、精确率和F值就是评估机器学习模型的三大重要指标。

一、基本概念

True Positive(真正，TP)：将正类预测为正类数

True Negative(真负，TN)：将负类预测为负类数

False Positive(假正，FP)：将负类预测为正类数误报 (Type I error)

False Negative(假负，FN)：将正类预测为负类数→漏报 (Type II error)

二、召回率

召回率，recall, 也就是正确预测为正的占全部实际为正的比例(真正正确的占所有实际为正的比例)。是针对原样本来说的，其含义是在实际为正的样本中被预测为正样本的概率。

准确率和召回率互相影响，理想状态下肯定追求两个都高，但是实际情况是两者相互“制约”：追求准确率高，则召回率就低;追求召回率高，则通常会影响准确率。

三、精确率

精确率precision，也叫查准率, 也就是正确预测为正的占全部预测为正的比例，(真正正确的占所有预测为正的比例)。针对预测结果而言的，其含义是在被所有预测为正的样本中实际为正样本的概率。

四、F值(F-Measure)

1.精确率P和召回率R指标有时候会出现的矛盾的情况，这样就需要综合考虑他们，最常见的方法就是F值，也就是F-Measure(又称为F-Score)。

F-Measure是一种统计量，又称F-Score,也是精确率(Presicion)和召回率(Recall)的加权调和平均，常用于评价分类模型的好坏。

当参数α=1时，就是最常见的F1.也即

可知F1综合了P和R的结果，当F1较高时则能说明试验方法比较有效。

2.E值

E值表示P和R的加权平均值，当其中一个为0时，E值为1.其计算公式：

b越大，表示查准率的权重越大。

五、P-R曲线

对模型进行评估，不能仅靠精确率或者召回率，最好构建多组精确率和召回率，绘制出模型的P-R曲线。

P-R曲线的横轴是召回率，纵轴是精确率。P-R曲线上的一个点代表着，在某一阈值下，模型将大于该阈值的结果判定为正样本，小于该阈值的结果判定为负样本，此时返回结果对应的召回率和精确率。整条P-R曲线是通过将阈值从高到低移动而生成的。原点附近代表当阈值最大时模型的精确率和召回率。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

召回率机器学习

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇屠杀机器人和无处不在的监控：AI是我们最大的生存威胁？

下一篇你知道如何用python来处理EXCEL表格吗？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

评估机器学习模型的指标：召回率，精确率和F值

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】MySQL分表如何查询数据在哪张表？实战方 ...

【CAD干货】业务模型与逻辑模型的概念辨析及实战案 ...

从“零件”到“引擎”：CDA数据分析师视角下的指标 ...

CDA持证人专访：宋利宝谈电销行业数据运营与数据分 ...

【CDA干货】ARIMA时间序列分析方法：核心原理、建模 ...

从“通用基石”到“场景利器”：CDA数据分析师视角 ...

【CDA干货】SQL Server 提示“实例已在使用”：常见 ...

【CDA干货】Excel数据透视表两列相乘：正确计算方法 ...

从“模糊需求”到“精确标尺”：CDA数据分析师视角 ...

CDA持证人专访：冯卓基谈大数据平台搭建与行业数字 ...

【CDA干货】基于月度数据的送货率提升专项数据分析 ...

从“样本均值”到“总体真相”：CDA数据分析师视角 ...

【CDA干货】指标：量化业务的核心衡量标准与设计指 ...

【CDA干货】Excel透视表计算字段：先乘法后求和汇总 ...

从“杂乱”到“有序”：CDA数据分析师视角下的数据 ...

CDA持证人专访：崔爱军谈地产行业数据治理与数据中 ...

【CDA干货】显著水平与P值的核心区别、关联关系及实 ...

为什么统计是数据分析师的“底层语言”？ ...

【CDA干货】数据分析核心技能体系：从工具落地到业 ...

【CDA干货】企业价值市场法价值比率与线性回归分析 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载