赞
踩
在这里,我们将讨论各种性能指标,这些指标可用于评估分类问题的预测。
这是衡量分类问题性能的最简单方法。混淆矩阵可以用一个二位表表示:
– | actual_1 | actual_0 |
---|---|---|
predict_1 | TP | FP |
predict_0 | FN | TN |
与混淆矩阵相关的术语解释如下:
即正确预测的比例值。公式如下:
a
c
c
u
r
a
c
y
=
T
P
+
T
N
T
P
+
T
N
+
F
P
+
F
N
accuracy=\frac{TP+TN}{TP+TN+FP+FN}
accuracy=TP+TN+FP+FNTP+TN
分类的精度(Precision)
召回率(Recall)
特异性率(Specificity)
假阳率
支持(Support)
F1 得分
AUC-ROC(Area Under Receiver Operation Characteristic Curve)
对数损失(Log Loss)
p
。下面是计算这些性能的指标的简单示例:
from sklearn.metrics import accuracy_score from sklearn.metrics import classification_report from sklearn.metrics import confusion_matrix from sklearn.metrics import log_loss from sklearn.metrics import roc_auc_score X_actual = [1, 1, 0, 1, 0, 0, 1, 0, 0, 0] Y_predic = [1, 0, 1, 1, 1, 0, 1, 1, 0, 0] results = confusion_matrix(X_actual, Y_predic) print('Confusion Matrix :') print(results) print('Accuracy Score is', accuracy_score(X_actual, Y_predic)) print('Classification Report : ') print(classification_report(X_actual, Y_predic)) print('AUC-ROC:', roc_auc_score(X_actual, Y_predic)) print('LOGLOSS Value is', log_loss(X_actual, Y_predic))
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。