赞
踩
1:查准率,查全率
T:True
F:Flase
P:Positive
N:negative
什么是真正例(TP),假反例(FN),假正例(FP),真反例(TN)。
查准率关心的是”预测出正例的正确率”即从正反例子中挑选出正例的问题。
查全率关心的是”预测出正例的保证性”即从正例中挑选出正例的问题。
ROC是TPR为y轴,FPR为x轴做的曲线图
AUC即AUROC,为ROC曲线下的面积。
AUPR是pr曲线下的面积,PR即 召回率和正确率组成的曲线图。
主要的区别是,一个是作用在平衡数据集中,一个是作用在高度不平衡的数据集中。
如果只有较高的召回率,只能说明你的模型或者方法可以预测出较多的数据,但并不能保证预测出的样本是正确的。
如果只有较高的正确率,说明所预测的样本的正确的,但只能是很少一部分数据集。
数据集合中的正样本和负样本的比率。我现在所用的数据就是负样本很多,而正样本比较少的数据集合。正样本在集合中占比低于10%。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。