种质资源收集与评价岗位
姜建福 樊秀彩 张颖 孙磊 刘崇怀
任何植物的叶子都有其独特的特征,例如形状特征、纹理以及叶片脉序图案,而这些特征的微小变化很难被人捕捉。随着计算机视觉、机器学习和模式识别等人工智能技术的快速发展,决策树、卷积神经网络、支持向量机和k近邻等方法通过提取形态和几何特征,被广泛应用于植物表型识别,深度学习可以在保证高准确率的前提下快速的提取图像的深层特征,提取的特征具有更强的泛化能力,有效地解决人工分类带来的问题。采用计算机作为工具帮助人们完成鉴别工作,可以提高生产效率,减轻科研人员的工作强度,加快科研进展,并自动量化表型指标。因此,基于植物叶片的自动识别已经成为农业领域的重要研究方向之一。本研究以国内外常见的鲜食葡萄品种为试材,采用4种卷积神经网络对叶片进行自动识别,并进一步评价了各个模型的识别效率,为鲜食葡萄品种的分类、保护、利用研究以及其他作物的品种识别提供科学参考。
1 材料与方法
叶片图像在中国农业科学院郑州果树研究所的国家葡萄种质资源圃(郑州)(113°67′E, 34°75′N)拍摄。样本叶片在田间自然条件下拍摄采集,采集叶片为成龄叶,叶片完全展开,没有明显的营养缺乏、病原体感染或虫害症状,采样位置为新梢7-9节点。拍摄不同叶片的正面图像,每个品种采集叶片图像400-500张。在本研究中,葡萄数据集包含了68个鲜食葡萄品种。
采用图像预处理技术,从原始输入图像中自动获得增强的局部化图像特征,提高品种识别性能。采用数据增强技术来扩增数据集,应用了缩放、旋转、固定裁剪等几何变换技术来扩展图像数据集。选择GoogleNe、ResNet-50、ResNet-101以及VGG-16四个卷积神经网络对鲜食葡萄叶片数据集进行训练验证。对于深度学习分类任务常用的评价指标有:精度(A, Accuracy)、损失值(L,LOSS)精确率(P,Precision)、召回率(R,Recall)以及F1score。
2 结果与分析
2.1 分类模型选择
为了对所有的卷积神经网络进行公平比较,鲜食葡萄识别最优模型为ResNet-101,精度达到97.13%,ResNet-50略低,精度也达到了97%以上,VGG-16以及GoogleNet模型精度均未达到95%。分类模型的准确率如表1所示。
结果表明,ResNet-101模型在68个葡萄品种的验证数据集上精度最高,证明了在实际生长环境中使用深度学习进行葡萄品种识别的可行性。
2.2 模型参数选择
以ResNet-101作为分类模型,测试不同训练参数对分类性能的影响。在保持其他参数不变的情况下,设置三个实验T1、T2和T3,学习率分别为0.001、0.005和0.01。表2是不同学习率值下的分类准确率。结果表明,当学习率为0.005时,分类性能达到最佳。
2.3 Loss及训练精度曲线
本研究网络训练最优模型的LOSS收敛曲线如图2所示。如图所示,GoogleNet模型初始精度较低,仅有30%左右,迭代0~10次精度快速增长,迭代次数20次后精度逐渐趋于稳定,精度变化范围大,最终精度在91.82%左右波动。GoogleNet模型的初始损失约为2.99,为所有模型最高,曲线变化趋势为前10次快速降低,迭代20次后趋于稳定,最终稳定于0.26。VGG-16模型初始精度为所有模型最低,迭代前10次精度快速升高,10~15次精度产生波动,于迭代次数20次后趋于稳定,最终精度稳定于94.96%。VGG-16模型的初始损失约为2.48,前10次快速降低,10~15次损失值产生波动,15~20次缓慢下降,之后趋于稳定,最终LOSS稳定于0.21。
由图3可见,ResNet-50模型初始精度达到67%,训练迭代0~5次精度快速增长,从迭代次数10次后精度趋于稳定,精度变化范围小,最终精度在97.05%左右波动。ResNet-50模型的初始损失约为1.22,变化趋势为前10次稳定降低,10次后趋于稳定,最终稳定于0.09。ResNet-101模型初始精度便达到80%,精度变化范围小,增长稳定,最终精度达到了97.99%。ResNet-101模型的初始损失约为0.59,为所有模型最低,变化趋势为前5次快速降低,后趋于稳定,最终稳定于0.06。
ResNet-101模型在模型精度和损失值两方面表现均显著高于GoogleNet、VGG-16以及ResNet-50模型,初始精度最高,收敛更快且更为稳定,最终精度最高,初始损失最低,损失下降速度快,且最终LOSS较为稳定。
2.4 识别准确率、召回率及 F1 值分析
如图4A所示,ResNet-101模型识别的68个品种中,有23个品种的预测精确率为100%,68个品种的平均识别精确率达到了94.90%;ResNet-50有13个品种的预测精确率为100%,,68个品种的平均识别精确率达到了90.38%;VGG-16有11个品种的预测精确率为100%,68个品种的平均识别精确率为85.45%;GoogleNet仅有5个品种预测精确率达到100%, 68个品种的平均识别精确率为78.79%。相比之下,ResNet-101模型的预测精确度明显优于ResNet-50、GoogleNet以及VGG-16模型,各品种之间的识别精确率差距较小,更稳定。
ResNet-101模型有18个品种的召回率达到100%, 68个品种的平均召回率达到了94.19%;ResNet-50模型有6个品种的召回率达到100%,分别为:金手指、里扎马特、龙眼、茉莉香、秋黑宝、阳光玫瑰,68个品种的平均召回率达到了88.71%;VGG-16有5个品种的召回率达到100%,68个品种的平均召回率为82.83%;GoogleNet仅有克瑞森无核以及阳光玫瑰这2个品种召回率达到100%,68个品种的平均召回率为74.44%(图4B)。相比之下,ResNet-101的模型显著优于ResNet-50、GoogleNet、VGG-16,各品种之间的召回率更稳定。
ResNet-101模型克瑞森无核、先锋及龙眼三个品种的F1值达到1,平均F1值达到0.94,各品种数据F1值差距较小,模型可信度较高,模型效果更为稳定。VGG-16模型克瑞森无核F1值达到1,平均F1值达到0.82;ResNet-50以及GoogleNet模型未有品种F1值达到1,其平均F1值分别为0.88和0.74(图4C)。
3 结论
葡萄品种繁多,资源丰富,叶片数据集可以进一步扩大,以便进行更多的品种识别研究。结合深度学习技术实现鲜食葡萄的自动识别,以无损的方式获取田间葡萄品种信息。未来将会成为无人农业建设的一部分。综合来看,本研究对葡萄品种的识别研究有一定指导意义,为葡萄品种识别提供新思路。