亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

圖解精度和召回率

標簽:
Java

下面这个图表示了精度和召回率这两个指标,主要用在于分类问题中。


webp

图片发自简书App



例如有一个二分类问题的算法。

图中的圆圈里面代表算法判定为正的一些样本。

圆圈的外面代表算法判定为负的一些样本。

但实际上算法它是会有一些东西误判的。

例如方形的左边一半,是实际上为正的样本。右边一半,是实际上为负的样本。那除了算法判断正确的,以外,就是判断错误的样本。


可以对照这个图,看一下准确率,精度,和召回率的定义。


右上角是准确率的公式。意思就是,算法的所有预测结果中,预测正确的有多少


左下角为 precision 精度 查准率就是对于所有机器判定为正的里面,有多大的比例是真的正样本


右下角为 recall 召回率 查全率,顾名思义,就是实际的正样本中,有多大比例被检出了


在图中有标记,阴阳,真假。

真/假 阴/阳性中,阴阳性是指的分类器的判断结果是阴性还是阳性,而真假指代的是是否和真是答案相符


不同的问题,他需要用的指标,希望达到的目标是不一样的。

我们根据召回率这个名字,可以考虑一个,召回的例子。

例如有一个汽车公司,他们有一些车发现有问题,

于是就要召回,他们告诉了车主判断问题的方法,

有些车是真的有问题,但是车主没判断出来,

有些车没问题,但车主认为有问题,

这个时候公司就要计算一下召回率,看有问题的车被召回了多少。


精度—召回率 之间存在制衡

随着精度的增加,召回率会降低,召回率增加,精度就会降低。

有时如果需要召回率高,就可以接受较低的精度。


如果我们想要找到精度和召回率的最佳组合,我们可以使用 F1 score 来对两者进行结合。

F1 score 是对精度和召回率的调和平均,有个公式


如果我们想创建一个具有最佳的精度—召回率平衡的模型,那么就要尝试将 F1 score 最大化。


在实际应用时,因为是分类算法,会有一个阈值,当结果高于这个阈值时为一类,低于这个阈值时为另一类。

对每个阈值可以计算相应的 精度 召回率 f1 等指标,


webp

图片发自简书App



通过更改阈值,这些指标都会变化,

如果想要精度和召回率平衡,可以选择最大化 F1 score 时候的阈值

例如上图,基于 F1 score,整体最佳的模型出现在阈值为 0.5 的地方。



作者:不会停的蜗牛
链接:https://www.jianshu.com/p/5cf2aa5bdfbc


點擊查看更多內容
TA 點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
JAVA開發工程師
手記
粉絲
205
獲贊與收藏
1011

關注作者,訂閱最新文章

閱讀免費教程

  • 推薦
  • 評論
  • 收藏
  • 共同學習,寫下你的評論
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消