赞
踩
在得到模型后,你需要借助一些指标来评估这个模型的好坏。人在学习后,会通过考试来评价学习效果,最终会评出优等生、差等生。机器学习也是一样的。区别只是机器学习会根据问题的不同,用不同的指标来进行模型效果的评估。对于分类问题,混淆矩阵是一种直观的模型效果分析方法。假设有个二分类模型,可以对一件事的正(P)负(N)作出判断。这样,在一次判断中,存在真实结果 y ^ \hat{y} y^ 和预则结果y。如果二者相等,也就是本次预测结果正确;反之则错误。假设有100个不同的测试用例,就会有以下四种可能性:
我们把这四种情况进行统计,就得到了这样的一个表格,这就是混滴矩阵。
在这个表中,横向表示预测结果,纵向表示真实结果。我们用TP、FP、FN、TN表示上面的四种可能性。这里面的T和F表示正确预测(true)或错误预测(false);而P和N是被T或F修饰的正负,显然这是预测值,因为只有预测值才有对错之分。那么,首先,TP为True Positive,含义为真的正样本。也就是预测值为P,真实值也是P的情况。这个例子中,共有20个样本属于TP。其次,FP为False Positive,含义为假的正样本,也就是预测值为P真实值为N的情况。这里共有8个样本属于FP。接下来,FN为False Negative,含义为假的负样本,也就是预测值为N真实值为P的情况。这里共有6个样本属于FN。最后的TN为True Negative,含义为真的负样本,也就是预测值和真实值都为N的情况。这里共有66个样本属于TN。有了混滴矩阵后,就能计算一些模型的统计量指标了。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。