F1度量:比BEP更常用的F1度量。β<1,查准率有更大的影响,β>1,查全率有很大的影响。β代表对查准率和查全率的倾向性,如推荐系统更倾向于查准率,逃犯系统更倾向于查全率。F的公式由P和R两个指标合成,通用公式如下:
F
=
(
1
+
β
²
)
P
R
/
β
²
P
+
R
F=(1 + β² )PR/β²P+R
F=(1+β²)PR/β²P+R
宏XX(macro) vs 微XX(micro):对于多分类问题,先平均后计算或者先计算后平均。macro的算法复杂度稍微比micro要多,原因在进行了更多的除法运算。
ROC曲线(Recevier Operating Characteristic),AUC(Area Under Curve):真正例率(TPR=true positive ratio纵轴)和假正例率(FPR=false positive ratio横轴)曲线就是AUC曲线。
t
p
r
=
T
P
/
m
+
=
T
P
/
T
P
+
F
N
=
R
;
tpr=TP/m+=TP/TP+FN=R;
tpr=TP/m+=TP/TP+FN=R;m+就表示全部的基准正例,可以认为是男生中的直男比例
f
p
r
=
F
P
/
m
−
=
F
P
/
F
P
+
T
N
fpr=FP/m-=FP/FP+TN
fpr=FP/m−=FP/FP+TNm-表示全部的基准反例,可以认为是女生中的假小子比例