赞
踩
图:西雅图(Seattle)
Guderian出品
混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示。
在机器学习领域,混淆矩阵用于衡量一个分类器的准确程度。对于二分类问题,将其样例根据真实类别和分类器的预测类别的组合划分为真正例 ( T r u e P o s i t i v e ) \mathrm{(True \, Positive)} (TruePositive)、假正例 ( F a l s e P o s i t i v e ) \mathrm{(False \, Positive)} (FalsePositive)、真反例 ( T r u e N e g a t i v e ) \mathrm{(True \, Negative)} (TrueNegative)、假反例 ( F a l s e N e g a t i v e ) \mathrm{(False \, Negative)} (FalseNegative)四种情形。
对应混淆矩阵 ( C o n f u s i o n M a t r i x ) \mathrm{(Confusion \, Matrix)} (ConfusionMatrix)如下表:
|
| |
---|---|---|
|
| |
|
|
|
|
|
|
根据混淆矩阵,我们可以得到如下定义:
F1分数( F 1 − s c o r e \mathrm{F1-score} F1−score)即精确率与召回率的调和平均数( H a r m o n i c M e a n \mathrm{Harmonic \, Mean} HarmonicMean),比算术平均数( A r i t h m e t i c M e a n \mathrm{Arithmetic \, Mean} ArithmeticMean)的评价效果更好。
F 1 = 2 1 P + 1 R = 2 P R P + R \mathrm{F1=\frac{2}{\frac1{P}+\frac1{R}}=\frac{2PR}{P+R}} F1=P1+R12=P+R2PR
在你训练的机器学习模型过程中,你往往希望能够兼顾精确率和召回率,并使用一个统一的单值评价指标来评价你的机器学习模型的训练效果。我们之所以使用调和平均而不是算术平均,是因为在算术平均中,任何一方对数值增长的贡献相当,任何一方对数值下降的责任也相当;而调和平均在增长的时候会偏袒较小值,也会惩罚精确率和召回率相差巨大的极端情况,很好地兼顾了精确率和召回率。
上图为函数图象 z = f ( x , y ) = 2 x y x + y z=f(x, y)=\frac{2xy}{x+y} z=f(x,y)=x+y2xy。显而易见当 x = 1 x=1 x=1, y = 0 y=0 y=0或者 y = 1 y=1 y=1, x = 0 x=0 x=0时, z = 0 z=0 z=0,说明调和平均惩罚精确率和召回率相差很大的极端情况。
当 x < y x<y x<y时,梯度 g r a d z \mathrm{grad} \, z gradz在 x x x方向增长比 y y y方向快;当 y < x y<x y<x时,梯度 g r a d z \mathrm{grad} \, z gradz在 y y y方向增长比 x x x方向快,即调和平均在增长的时候会偏袒较小值。
对函数 f ( x , y ) = 2 x y x + y f(x, y)=\frac{2xy}{x+y} f(x,y)=x+y2xy,其图象关于平面 x = y x=y x=y对称。分别求 f ( x , y ) f(x,y) f(x,y)对 x x x和 y y y的偏导数:
∂ f ( x , y ) ∂ x = 2 y 2 ( x + y ) 2 \frac{\partial f(x,y)}{\partial x}=\frac{2y^2}{(x+y)^2} ∂x∂f(x,y)=(x+y)22y2
∂ f ( x , y ) ∂ y = 2 x 2 ( x + y ) 2 \frac{\partial f(x,y)}{\partial y}=\frac{2x^2}{(x+y)^2} ∂y∂f(x,y)=(x+y)22x2
当 x < y x<y x<y时, ∂ f ( x , y ) ∂ x > ∂ f ( x , y ) ∂ y \frac{\partial f(x,y)}{\partial x}>\frac{\partial f(x,y)}{\partial y} ∂x∂f(x,y)>∂y∂f(x,y),梯度 g r a d z \mathrm{grad} \, z gradz在 x x x方向增长比 y y y方向快;
当 y < x y<x y<x时, ∂ f ( x , y ) ∂ y > ∂ f ( x , y ) ∂ x \frac{\partial f(x,y)}{\partial y}>\frac{\partial f(x,y)}{\partial x} ∂y∂f(x,y)>∂x∂f(x,y),梯度 g r a d z \mathrm{grad} \, z gradz在 y y y方向增长比 x x x方向快,即调和平均在增长的时候会偏袒较小值。
可以看出, F 1 − s c o r e \mathrm{F1-score} F1−score是一种综合的评价指标,它要求总体高指标必须建立在同时满足高精确率和高召回率的情况之上。使得我们可以更方便快速地对不同模型进行比较,从而选择最优的那个模型。
Reference and lots of thanks:https://blog.csdn.net/otengyue/article/details/89426004
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。