赞
踩
E ( f ; D ) = 1 m ∑ n = 1 m ( f ( x i ) − y i ) 2 E(f;D) = \frac{1}{m}\sum_{n=1}^{m}{(f(x_i) - y_i)^2} E(f;D)=m1n=1∑m(f(xi)−yi)2
E ( f ; D ) = ∫ x − D ( f ( x ) − y ) 2 p ( x ) d x E(f;D) = \int_{x-D}^{}{(f(x) - y)^2p(x)}dx E(f;D)=∫x−D(f(x)−y)2p(x)dx
P = T P ( T P + F P ) P = \frac{TP}{(TP + FP)} P=(TP+FP)TP
P = T P ( T P + F N ) P = \frac{TP}{(TP + FN)} P=(TP+FN)TP
注:上述的例子都是二分类问题,所以只有正例和反例之分,理所当然的就只有唯一的P和R。而在多分类问题中,并没有所谓的正例和反例,precision和recall也不是只有一个,而是每一个类别都对应这一个precision(P)和recall(R)。而至于要得到多分类问题的整体的P和R,可以用后面所讲的macro和micro方法。
图片来自网络中的一篇文章,查看原文更容易理解:
下图为logistics模型在不同阈值上得P(precision)和R(recall)得计算:
图片来源于网络,可点击链接查看原文:
F 1 = 2 × P × R P + R = 2 × T P 样 例 总 数 + T P − T N = 2 × T P 2 × T P + F P + F N F1 = \frac{2\times P \times R}{P + R} = \frac{2 \times TP}{样例总数 + TP - TN} = \frac{2 \times TP}{2 \times TP + FP + FN} F1=P+R2×P×R=样例总数+TP−TN2×TP=2×TP+FP+FN2×TP
F1-score是precision(P)和recall(R)的二数调和平均数:
F
1
=
2
1
P
+
1
R
F1 = \frac{2}{\frac{1}{P} + \frac{1}{R}}
F1=P1+R12
F β = ( 1 + β 2 ) × P × R ( β 2 × P ) + R ( β > 0 ) Fβ = \frac{(1 + β^2)\times P \times R}{(β^2 \times P) + R} (β > 0) Fβ=(β2×P)+R(1+β2)×P×R(β>0)
β > 1时recall(R)有更大影响。
β < 1时precision(P)有大影响。
按照上面所说,多个confusion matrix(混淆矩阵)和多分类问题的confusion matrix会得出多个precision、recall、F1,那我们如何综合考察precision和recall呢?
m a c r o − p = 1 n ∑ i = 1 n P i macro-p = \frac{1}{n}\sum_{i=1}^{n}{P_i} macro−p=n1i=1∑nPi
m a c r o − R = 1 n ∑ i = 1 n R i macro-R = \frac{1}{n}\sum_{i=1}^{n}{R_i} macro−R=n1i=1∑nRi
m a c r o − F 1 = 1 n ∑ i = 1 n F 1 i = 2 × m a c r o − P × m a c r o − R m a c r o − P + m a c r o − R macro-F1 = \frac{1}{n}\sum_{i=1}^{n}{F1_i} = \frac{2 \times macro-P \times macro-R}{macro-P + macro-R} macro−F1=n1i=1∑nF1i=macro−P+macro−R2×macro−P×macro−R
m i c r o − P = T P ‾ T P ‾ + F P ‾ micro-P = \frac{\overline{TP}}{\overline{TP} + \overline{FP}} micro−P=TP+FPTP
m i c r o − R = T P ‾ T P ‾ + F N ‾ micro-R = \frac{\overline{TP}}{\overline{TP} + \overline{FN}} micro−R=TP+FNTP
m i c r o − F 1 = 2 × T P ‾ 2 × T P ‾ + F P ‾ + F N ‾ = 2 × m i c r o − P × m i c r o − R m i c r o − P + m i c r o − R micro-F1 = \frac{2 \times\overline{TP}}{2\times\overline{TP} + \overline{FP}+ \overline{FN}} = \frac{2\times micro-P \times micro-R}{micro-P + micro-R} micro−F1=2×TP+FP+FN2×TP=micro−P+micro−R2×micro−P×micro−R
理解ROC和AUC在另外一篇博客中:
https://blog.csdn.net/qq_46020653/article/details/119613712
西瓜书的第二章的笔记博客链接:
https://blog.csdn.net/qq_46020653/article/details/119493200
其他有关机器学习的博客文章:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。