为方便调查宁夏全区荒漠草原植物种类及其分布,需对植物识别方法进行研究。针对YOLO v5s模型参数量大,对复杂背景下的植物不易识别等问题,提出一种复杂背景下植物目标识别轻量化模型YOLO v5s-CBD。改进模型YOLO v5s-CBD在特征提取网络中引入带有Transformer模块的主干网络BoTNet(Bottleneck transformer network),使卷积和自注意力相结合,提高模型的感受野;同时在特征提取网络融入坐标注意力(Coordinate attention,CA),有效捕获通道和位置的关系,提高模型的特征提取能力;引入SIoU函数计算回归损失,解决预测框与真实框不匹配问题;使用深度可分离卷积(Depthwise separable convolution,DSC)减小模型体积。实验结果表明,模型YOLO v5s-CBD在单块Nvidia GTX A5000 GPU 帧率可达140帧/s,模型体积为8.9MB,精确率P为95.1%,召回率R为92.9%,综合评价指标F1为94.0%,平均精度均值mAP为95.7%,在VOC数据集平均精度均值可达80.09%。
1