登录
首页精彩阅读召回率越高越好还是越低越好?
召回率越高越好还是越低越好?
2020-05-20
收藏
召回率(Recall),一般指查全率,指从数据库内检出的相关的信息量与总量的比率,是数据挖掘中预测、互联网中的搜索引擎等经常涉及的两个概念和指标之一。

在实际应用中,多数人更喜欢称召回率召回率,因为更能体现其实质意义。召回率绝对值很难计算,只能根据数据库内容、数量来估算。

“召回”在中文的意思是把xx调回来,指检索系统能“回忆”起那些事的多少细节,通俗来讲就是“回忆的能力”,“能回忆起来的细节数” 除以 “系统知道这件事的所有细节”,就是“记忆率”。如果我们希望被检索到的内容越多越好,这是追求“召回率”,即A/(A+C),越大越好。

查准率与召回率之间的关系

利用查准率和召回率指标,可以对每一次检索进行检索效率的评价,为检索的改进调整提供依据。利用这两个量化指标,也可以对信息检索系统的性能水平进行评价。


为了综合查准率与查全率,我们引入了F1指标,这种方法是计算F1值(F1 Score),F1是精度和召回率的调和均值。即:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

这3个指标的取值都在0-1之间,越接近1越好,要评价信息检索系统的性能水平,就必须在一个检索系统中进行多次检索。每进行一次检索,都计算其查准率和召回率,并以此作为坐标值,在平面坐标图上标示出来。通过大量的检索,就可以得到检索系统的性能曲线。

数据分析咨询请扫描二维码

最新资讯
更多
客服在线
立即咨询