F1 score概念及python实现_python f1score

作者：繁依Fanyi0 | 2024-02-26 01:38:21

踩

python f1score

一、F1 score概念?

F1 score是分类问题的一个衡量指标，一些多分类问题的机器学习竞赛，常把F1 score作为最终评测的方法。它是精确率和召回率的调和平均数，取值0-1之间。

F1 score认为召回率和精确率同样重要，而F2认为召回率的重要程度是精确率的2倍，F0.5则认为召回率的重要程度是精确率的一半。

$F_{1}=2\frac{precision\cdot recall}{precision+recall}$

要明确几个概念

TP(True Positive): 被判定为正样本，实际为正样本
TN(True Negative): 被判定为负样本，实际为负样本
FP(False Positive): 被判定为正样本，实际为负样本
FN(False Negative): 被判定为负样本，实际为正样本
accuracy：准确率，针对所有样本而言，即所有实际正负样本中，判定正确的样本所占的比例。accuracy = (TP + TN)/(TP + TN + FP + FN)
precision：精确率（又称为查准率），针对所有判定为正的样本而言，即所有判定为正的样本中，实际为正的样本所占的比例。precision = TP/(TP + FP)
recall：召回率（又称为查全率），针对所有实际为正的样本而言，即所有实际为正的样本中，判定为正的样本所占的比例。recall = TP/(TP + FN)

注意：上述所有正负样本描述是针对二分类问题而言，如果是多分类问题，则上述正样本代表第k类样本，负样本代表所有其他类样本。

二、F1 score如何计算？

首先分别计算每一类样本的精确率 $precision_{k}$ 和召回率 $recall_{k}$ ；
然后分别计算每一类的F1 score: $f1_{k}=2\cdot \frac{precision_{k}\cdot recall_{k}}{precision_{k}+recall_{k}}$
最后对所有类别的F1 score求均值，得到最终结果： $F1 score=(\frac{1}{n}\sum f1_{k})^{2}$

三、python如何实现？

可以通过调用sklearn包实现

函数介绍：

sklearn.metrics.f1_score(y_true, y_pred, labels=None, pos_label=1, average='binary', sample_weight=None)

y_true: 真实类别，1d array-like, or label indicator array / sparse matrix.
y_pred: 预测类别，1d array-like, or label indicator array / sparse matrix.
average: string,[None, ‘binary’(default), ‘micro’, ‘macro’, ‘samples’, ‘weighted’]，如果二分类则选binary，如果考虑类别的不平衡性，需要计算类别的加权平均，则使用‘weighted’；如果不考虑类别的不平衡性，计算宏平均，则使用‘macro’。

代码示例：


from sklearn.metrics import f1_score
 
y_true = [0,0,0,1,1,2]
y_pred = [0,0,1,1,2,2]
 
print(f1_score(y_true, y_pred, average='weighted'))
print(f1_score(y_true, y_pred, average='macro'))

参考：

https://blog.csdn.net/qq_14997473/article/details/82684300

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/143037