你是否正在寻找关于召回率的内容?让我把最实用的东西奉献给你:
版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明
召回率和准确率是搜索引擎(或其它检索系统)的设计中很重要的两个概念和指标。
召回率:Recall,又称查全率;
准确率:Precision,又称精度、正确率。
在一个数据集合中检索文档时,可把集合中的所有文档分成四类:
相关
不相关
检索到
A
B
未检索到
C
D
A:检索到的,相关的 (搜到的也想要的)
B:检索到的,但是不相关的 (搜到的但没用的)
C:未检索到的,但却是相关的 (没搜到,然而实际上想要的)
D:未检索到的,也不相关的 (没搜到也没用的)
通常我们希望:中相关的文档,被检索到的越多越好,这是追求查全率,即A/(A+C),越大越好。
同时我们还希望:检索到的文档中,相关的越多越好,不相关的越少越好,这是追求准确率,即A/(A+B),越大越好。
归纳如下:
召回率:检索到的相关文档 比 库中所有的相关文档
准确率:检索到的相关文档 比 所有被检索到的文档
召回率与准确率虽然没有必然的关系(从上面公式中可以看到),然而在数据集合中,这两个指标却是相互制约的。
由于检索策略并不完美,希望更多相关的文档被检索到时,放宽检索策略时,往往也会伴随出现一些不相关的结果,从而使准确率受到影响。
而希望去除检索结果中的不相关文档时,务必要将检索策略定的更加严格,这样也会使有一些相关的文档不再能被检索到,从而使召回率受到影响,。
凡是设计到数据集合的检索和选取,都涉及到召回率和准确率这两个指标。而由于两个指标相互制约,我们通常也会根据需要为检索策略选择一个合适的度,不能太严格也不能太松,寻求在召回率和准确率中间的一个平衡点。这个平衡点由具体需求决定。
其实,准确率(precision,精度)比较好理解。往往难以迅速反应的是召回率。我想这与字面意思也有关系,从召回的字面意思不能直接看到其意义。
我觉得召回率这个词翻译的不够好。召回在中文的意思是:把xx调回来。比如sony电池有问题,厂家召回。
既然说翻译的不好,我们回头看召回率对应的英文recall,recall除了有上面说到的order sth to return的意思之外,还有remember的意思。
Recall:the ability to remember sth. that you have learned or sth. that has happened in the past.
这里,recall应该是这个意思,这样就更容易理解召回率的意思了。
当我们问检索系统某一件事的所有细节时(输入检索query),Recall就是指:检索系统能回忆起那些事的多少细节,通俗来讲就是回忆的能力。能回忆起来的细节数 除以 系统知道这件事的所有细节,就是记忆率,也就是recall召回率。
这样想,要容易的多了。
以上就是关于召回率的全部内容,相信你一定会非常满意。
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-4808-1.html
给它留个记性免得在来同时也当军演了练练手
小王子加油