种质资源收集与评价岗位
潘博文 姜建福 樊秀彩 张颖 孙磊 刘崇怀
深度学习作为一个重要的研究方向,能够在保证较高准确率的前提下,快速提取图像的深层特征,被广泛应用于图像分类识别领域。野生葡萄种类多样且复杂,识别难度较大。本研究选取23份野生葡萄种质在自然条件下的成熟叶片图像作为研究对象,通过智能手机采集叶片图像,构建了一个数量为10077张的野生葡萄叶片数据集。采用4个深度学习网络对野生葡萄叶片图像进行识别。平均准确率最高的分类网络为ResNet-101。其最优模型参数平均准确率和召回率分别为98.64%和95.98%。证明了深度学习网络模型对自然环境下叶片种类识别的可行性,实现了对野生葡萄的自动实时识别,为野生葡萄的保护、利用、分类研究以及其他农作物的品种鉴定提供参考。
1. 材料与方法
1.1 叶片数据集
数据集中的叶片图像在中国农业科学院郑州果树研究所的国家葡萄种质资源圃采集,本研究中葡萄数据集包含23份野生葡萄种质。
1.2 数据预处理
采用多种图像预处理技术,从原始输入图像中自动获取增强的局部图像特征,提高了葡萄种类识别的性能。将每个品种的图像按照7:2:1的比例分为训练集、测试集和验证集。
1.3 卷积神经网络模型
在深度学习领域,卷积神经网络是最常用的算法,主要由卷积层、收敛层、全连接层和输出层组成。本研究选取GoogleNet、ResNet - 50、ResNet - 101和VGG - 16四种卷积神经网络对野生葡萄叶片数据集进行训练和验证。
1.4 基于Grad - CAM的模型可视化
为了解野生葡萄叶片样本的特征学习情况,对模型的可解释性进行了检验。利用梯度加权类激活映射( Grad-CAM )技术,将每张图像中用于品种识别和预测的特征区域用热图可视化,直观表达算法得到分类结果的原因。
1.5 实验平台
实验平台:操作系统为64位Windows10操作系统,深度学习框架为 TensorFlow2.8.0,GPU为NVIDIA GeForce RTX 3090,计算机语言为 Python。
2.结果与分析
2.1 分类模型选择
参数设置:初始学习率设置为0.001,mini-batch size为32,训练的Epochs数量设置为50。得到了不同CNN网络结构的分类结果,如表1所示。结果表明,CNN检测算法在23份野生葡萄种质的验证数据集上准确率达到95%以上,证明了利用深度学习在实际生长环境中识别葡萄品种的可行性。
2.2 模型参数选择
选用ResNet-101作为分类模型,测试不同训练参数对分类性能的影响。设置七个实验,结果表明,当学习率分别为0.005。表2展示了不同学习率下ResNet-101的分类精度。结果表明,当学习率为0.005、最小批次为32、最大迭代次数分别为50时,分类性能最好。
2.3 Loss和训练精度曲线
本研究中,上述参数下网络训练的损失收敛曲线如图2所示。从Loss变化可以看出,与ResNet-50、GoogleNet和VGG-16相比,ResNet-101的Loss相对较低,Loss下降较快,最终Loss比较稳定。ResNet-101比GoogleNet和ResNet-50收敛更快、更稳定,且ResNet-101的最终精度高于GoogleNet、ResNet-50和VGG-16(图3)。
2.4 准确率、召回率和F1值分析
平均检测精度最高的检测模型为ResNet-101。如图4所示,在ResNet-101检测模型的23份种质中,有12份种质的预测精度为100%,平均识别精度达到96%。相比之下,ResNet-101的识别精度高于ResNet-50、Google net和Vgg-16,且物种间的识别精度差距更小,识别精度更稳定。
如图5所示,ResNet-101的识别召回率较高,13份种质的识别召回率达到100%,平均识别召回率达到95%。相比之下,除沙地葡萄和东南葡萄外,ResNet-101的识别召回率高于ResNet-50、GoogleNet和Vgg-16,且识别召回率更稳定。
如图6所示,ResNet-101的模型F1值较高,7份种质的F1值达到 100%,平均F1值达到95%;除桑叶葡萄、刺葡萄以及毛葡萄外,其余品种F1值均达到93%以上。相比之下,ResNet-101模型的F1值均高于ResNet-50、GoogLeNet以及VGG16,各品种之间的F1值差距较小,模型效果更为稳定。
2.5 Grad - Cam可视化分析
使用Grad - CAM算法输出最终卷积层中权重的梯度热图,并对网络模型进行可视化。如图所示,该区域颜色越红,说明该部分特征在类别定向中起着更关键的作用。对于野生葡萄叶片的物种鉴定,叶片的叶质地、叶脉和叶缘对分类的影响最大。ResNet - 101和ResNet - 50对野生葡萄的叶片识别范围更广,对完整叶片表面和背景中的同种叶片均能识别到位。
4.结论
本研究在田间环境下采集了10077个野生葡萄叶片数据集,然后采用图像预处理和数据增强相结合的方法对图像特征进行增强,以增强训练数据集。在此基础上,利用4个深度学习网络(GoogleNet、ResNet-50、ResNet-101、Vgg-16 )对23份野生葡萄种质的叶片图像进行识别。并对模型参数进行了优化。所有的卷积神经网络分类算法在23份种质的验证数据上都能达到95%以上的准确率。其中,ResNet-101模型在时间和模型复杂度方面均优于其他模型。平均准确率和召回率分别达到98.64%、95.98%。采用Grad-CAM算法对3种卷积神经网络的分类效果进行评价,均能准确识别叶片的主要特征。