赞
踩
论文中文翻译:《一种基于生物特征的鱼类分类模型》
论文名称:《A biometric-based model for fish species classification》
录用日期:2018年3月3日
期刊:Fisheries Research
期刊情况
• 提出了基于生物识别方法的鱼类分类方法。
• 我们的模型采用了韦伯的本地描述符 (WLD) 和颜色特征以及AdaBoost分类器。
• 使用了鱼图像数据集(来自4个类的241张图像)。
• 拟议的模型获得了竞争结果
鱼类分类对工业、食品生产以及海洋渔业的保护和管理都至关重要。目前,许多商业渔船或船只根据欧共体条例(3703/85,1986)手工将鱼类分类为不同的物种(委员会等,1986年)。然而,手工过程是耗时的,需要很多人工,因此增加了成本。因此,需要一个完全自动化的鱼类分选或分类系统来解决人工处理的问题(Benson et al., 2009;Hasija等,2017)。
据报道,动物识别/鉴定可以使用多种不同的方法来实现,这些方法可以分为电子、机械和生物特征识别方法(Gaber et al., 2016)。有许多与机械方法相关的例子,如颚和鳍标记。然而,机械方法有许多局限性,例如它们不适合大规模的识别系统,它们比其他现代方法需要更多的时间(Rusk等,2006)。使用无线射频识别(RFID)等电子方法来识别动物,主要依赖于在鱼身上安装一个包含唯一识别号码的设备。另一种装置被称为阅读装置,它被用来与动物交流并解释动物的密码。然而,所连接的设备可能会丢失、损坏或被移除(Gaber等人,2016)。电子和机械方法的局限性可以用基于生物特征的方法来解决。
在基于生物特征的方法中,许多生物特征标记被提出来唯一地识别动物个体(Gaber et al., 2016;Tharwat等,2016a)。这种方法解决了电气法和机械法的缺点。与基于生物特征的人类识别类似,许多生物特征动物标记已被用于识别动物个体(Gonzales Barron et al., 2008; Rusk et al.,
2006; Corkery et al., 2007; Tharwat et al., 2016a)。例如,基于视网膜的识别系统使用视网膜血管,可以从视网膜图像中提取血管作为唯一标识符(Gonzales Barron et al., 2008)。Peirce et al.(2001)也采用了动物面部识别技术;Corkery等人(2007)。此外,DNA生物测定法还被用于识别由每种特定动物生产的肉类和动物产品(Jiménez-Gamero等人,2006)。尽管这种方法比其他生物特征识别方法获得了更高的识别率,但它并不具有成本效益,具有侵入性,而且很耗时(Rusk等人,2006年)。
在本文中,我们收集了一个由四个物种组成的数据集,即:阿吉罗索穆斯雷吉乌斯、撒丁岛马德伦西斯、斯科贝罗穆鲁斯·科默森和特拉奇诺图斯·奥瓦图斯。选择这四个物种是因为它们具有特定的营养和功能重要性;因此,这些物种在埃及和世界各地都很常见。分别采用韦伯局部描述子(WLD)法和颜色矩法提取纹理特征和颜色特征。由于WLD特征的高维性,采用线性判别分析(LDA)技术减少特征数量,提高不同类别之间的可分离性。使用AdaBoost分类器可以预测未知样本的类标签,该分类器将未知样本的特征与已标记的或训练数据的特征进行匹配。
计算每个类的分数,AdaBoost 分类器将类的最大分数分配给未知样本
数据集包含四种不同的鱼类,即:阿吉罗索穆斯雷吉乌斯,撒丁岛马德伦西斯,斯科贝罗莫鲁斯科默森,和特拉奇诺图斯卵子。这四种鱼很常见。此外,这些物种具有特殊的营养和功能重要性,如促进心脏健康和骨骼健康,采集的数据集包括241张彩色图像,使用Fujifilm X-T10 Camera,2采集自埃及El Brulus Kafr El- sheikh - Egypt,并以Jpeg格式存储。所提出的系统,用于收集我们的数据集,如图2所示。如图所示,这些图像是从不同的角度拍摄的。
表1总结了每个类的样本数量、最小维度和最大维度,图3显示了收集的数据的样本。
如图3所示,从不同距离拍摄的图像,不同的照明和照明条件对图像尺寸的影响如表1所示。这四类样本的特征如下:
第1类:头大身体长。它的嘴处于末端位置,没有杠铃,眼睛很小。沿着尾鳍,侧线是延伸的。而且,第一背鳍比第二背鳍短,臀鳍包含短小且很细的多刺魟。此外,这类鱼的体色为银灰色,背部为青铜色,鳍基部为红褐色,口腔为金黄色,死后呈褐色。这种鱼的长度可达2米,体重50公斤。
马德拉沙丁鱼或马德拉沙丁鱼(类别2):这类是发现在大西洋和地中海。这类鱼的颜色是银色的,尾鳍是灰色的,有时尾部是黑色的,腹部突出。此外,在白色的上胸鳍鳍之间有一层黑色的膜。这个班在沿海水域组成学校。
商业鱼(3类):这种鱼类分布于亚洲、非洲东海岸、中东、印度洋北部沿海地区以及最东至西南太平洋地区。背、腹呈蓝色至深灰色,腹部呈银白色,浅蓝色。
卵形轴尾鱼(第4类):身体细长而扁平,背部有棘。它的背部是绿灰色的,侧面是银色的。背鳍、肛鳍和尾鳍裂片呈黑色。第二背鳍和臀鳍长度相等,侧线在胸鳍上呈弓形。
利用4.1节中提到的4种不同鱼类收集的241张彩色图像对提出的鱼类分类模型进行评价
所有实验均在具有以下特性的PC机上进行:Intel® Core ™ i5-2400 CPU@3.10 GHz, 4gb RAM, Windows 7操作系统,Matlab 7.10.0 (R2010a)。
通过不同的实验测试了WLD斑块大小对模型计算时间和精度的影响。从这些实验中我们发现,增加patch的大小减少了特征向量的长度,从而减少了分类的计算时间。当patch的大小设置为5 × 5时,模型的精度最高。图5为使用不同patch大小的WLD方法的直方图。
由于4.1节中提到的图像尺寸的变化,使用WLD生成不同长度的特征向量。在我们的实验中,我们将所有图像按相同的比例缩放(500 × 2000)。另外,由于WLD特征的高维数达到98968个特征,使用LDA算法对该高维数进行降维,进一步提取出更具鉴别性的特征。图6显示了使用LDA将特征数量减少到4个特征后,这4个类别样本的散点图。在图中,x轴和y轴代表应用LDA后的WLD特征。该图显示了这四个类的样本是如何很容易地分离和分类的。图7为所有样本的颜色特征(六个特征)散点图。如图6所示,不同类别之间的可分性远远高于图7。这是因为将WLD特征投影到LDA空间上增加了类间的方差,从而增加了不同类之间的可分性。为此,将LDA应用于颜色特征。图8为应用LDA后的颜色特征散点图。可见,类间的可分性增加了,这可能对分类精度有积极的影响。
综上所述,将WLD特征和颜色特征进行归一化后,将其结合在一起改进了模型的性能,得到的结果优于WLD特征和颜色特征。
本实验的目的是使用不同的分类器测试所提出的模型。在这个实验中,我们将AdaBoost分类器与朴素贝叶斯(NB) (Bender et al., 2004)、k-最近邻(k-NN) (Tharwat et al., 2013)和多层感知器(MLP) (Gardner and Dorling, 1998)分类器进行了比较。AdaBoost分类器使用15个单分类器,k- nn中的k值为3。在MLP中,使用了一个包含15个节点和1000个epoch的隐藏层。在这个实验中,我们使用了经过归一化的WLD+颜色特征。图10为本次实验的结果。
如图10所示,与其他分类器相比,AdaBoost分类器获得了最好的结果。这是因为AdaBoost分类器依赖于许多分类器,而不仅仅是k-NN、MLP和NB等单一分类器。因此,AdaBoost分类器的决策或类标签是基于结合来自不同弱学习者的不同决策而生成的,这使得AdaBoost分类器相对于其他单一分类器具有优势。此外,AdaBoost重点关注第3.4节中提到的关键点或样本,这提高了分类性能。此外,MLP分类器取得了第二好的结果,而k-NN取得了最坏的结果。
为了进一步评估,我们对我们的方法和最相关的工作进行了比较,如表4所示。从表中可以看出,各数据集的样本数量存在明显差异,样本数量从22个样本到1346个样本。此外,类的数量也有所不同。因此,将我们的结果与表4中列出的相关工作进行比较是不公平的。然而,可以注意到所提出的方法产生了显著的结果
为了进一步检验我们提出的模型,图11和图12分别给出了受试者工作特征(ROC)曲线和混淆矩阵。如图11所示,四类结果均较好,反映了所提模型的鲁棒性。这些结果与图12的结果一致,四类的准确率达到了96.3%,错误率很小。此外,四类(最下面一行)的敏感性或真阳性率值在95.7到96.7%之间,这反映了我们提出的模型的稳健性。此外,右列表示精确度或阳性预测值大于93%。
图13为旋转后的图像样本。
图14为翻译后的图像样本
图15为旋转和平移图像时的模型结果。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。