当前位置:   article > 正文

2、2011Classifier Chains Classifier chains for multi-label classification_分类器链cc

分类器链cc

论文相关内容

本文中解决多标记问题的方法:

众所周知的多标签分类的二元关联方法,认为每个标签都是一个独立的二元问题,由于不能直接对标签相关性建模的不足,在文献中经常被忽视。我们用一种新的分类器链方法举例说明了这一点,这种方法可以在保持可接受的计算复杂度的同时对标签关联进行建模。我们在集成框架中进一步扩展了这种方法。

两种模型

1、分类器链模型(CC)
分类器链模型(CC)涉及L个二类转换——每个标签一个——就像在BR中一样。从这个意义上讲,CC也是一种二元关联方法,但与BR不同,因为对于每个二类模型的属性空间都用0或者1来扩展,0或1代表所有之前分类器的标记相关性;从而形成一个分类器链。训练步骤概述于算法1。图1通过一个示例说明了这个过程,并与BR进行了对比。
在这里插入图片描述
在这里插入图片描述在这里插入图片描述2、集成分类器链(ECC)
单个独立CC模型的顺序可能很差。此外,当第一个分类器中的一个(或多个)预测较差时,在分类时可能会沿链产生传播误差;
ECC训练m个CC分类器h1,…,hm;每个分类器被赋予随机链排序,并且在随机选择的N个训练实例上进行训练,所述N个训练示例使用重复采样。
通过图2中的一个例子演示了集成投票方案。这个集成方案是通用的,因此可以直接应用于任何多标签方法。
在这里插入图片描述2.1、ECC的一个显著的潜在缺点是,作为二类转换的集合,必须处理潜在的大量实例。在实例的数量方面,每个标签有着m×N实例;每个都是从最初的N个示例的m次迭代中得到。在ECC中使用的二类环境通常在学习空间中包含相当多的冗余。

总结

1、相关背景:BR方法不能对标签之间的关系进行建模,降低了分类器的预测能力。

2、问题:如何在维持住BR的低复杂度等优点的情况下,对标签之间的关系进行建模,提高预测性能。

3、现有解决方案:在我知识水平受限及从本篇论文来看的情况下,其他算法要么是高复杂度、能对标签关系建模,要么是低复杂度、不能对标签关系建模,要么低复杂度、能对标签关系建模,但是只能在特定的问题下(泛化能力低),可扩展性不强(规模较小)。

4、作者的核心思想、创新点:基于BR方法下提出了CC方法,保持了低复杂度同时又通过’链’对标签进行了建模;根据CC的缺点(误差传播,链的顺序),提出了ECC方法,使用了多个CC分类器,数据的采样是从训练集里有放回地采集,进行实验;根据ECC的缺点(训练集包含了大量的冗余),使用属性空间和示例空间的子集来减少ECC的冗余解决这一问题。最终得到了一个低复杂度、预测性能好、可扩展性强的分类器。

5、通过什么样的实验进行验证:计算在不同规模的数据集、不同迭代次数下的不同算法的不同时间复杂度及各种评估度量。

6、对我的启发:要站在巨人的肩膀上思考、辩证的去看待问题,什么事情都有其两面性。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/371566?site
推荐阅读
相关标签
  

闽ICP备14008679号