专利 一种基于目标检测分组残差结构进行特征提取的方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210882832.5 (22)申请日 2022.07.26 (71)申请人湖北工业大学地址 430068 湖北省武汉市洪山区南李路 28号 (72)发明人王改华　曹清程　甘鑫　翟乾宇　 (74)专利代理机构武汉科皓知识产权代理事务所(特殊普通合伙) 42222 专利代理师王琪 (51)Int.Cl. G06V 10/25(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/44(2022.01) G06V 10/774(2022.01)G06V 10/80(2022.01) G06V 10/82(2022.01) (54)发明名称一种基于目标检测分组残差结构进行特征提取的方法 (57)摘要本发明公开一种基于目标检测分组残差结构进行特征提取的方法，包括：准备训练、测试用的图像数据集；构建基于目标检测分组残差结构的特征提取网络，包括Backbone、 Neck和Head三部分；使用训练好的网络对测试集图像进行特征提取。本发明对ResNet50骨干网络进行改进，引入了分组卷积块，对不同组别之间的特征信息进行融合，提高了特征提取的质量，同时使用深度可分离卷积替代传统的卷积，使参数量和运算成本更低。权利要求书1页说明书4页附图3页 CN 115294326 A 2022.11.04 CN 115294326 A 1.一种基于目标检测分组残差结构进行特征提取的方法，其特征在于，包括以下步骤：步骤1，准备图像数据集用于测试和训练；步骤2，构建基于目标检测分组残差结构的特征提取网络，该网络由Backbone、 Neck和 Head三部分构成， Backbone采用的是对ResNet50残差结构改进后的G ‑ResNet50骨干网络，用于提取图片的特征， Neck结构用于连接Backbone和Head，用于融合特征， Head部分用于物体的检测，实现目标的分类和回归；特征信息经过G ‑ResNet50骨干网络的卷积和最大池化层后，进入由ResNet50原始残差和改进后的新残差构成的残差网络， ResNet50骨干网络的分组残差结构new residual将1×1卷积后的卷积层分为四个通道组x1、 x2、 x3、 x4，每组的宽、高相同，通道数为输入特征图的1/4，通过分组卷积， x1、 x2、 x3、 x4生成y1、 y2、 y3、 y4，此外x1和x4的特征信息分别与x2和 x3交错生成y2和y3，将两个通道得到的y2、 y3通过拼接进行合并，然后将y1、 y2、 y3、 y4的特征信息拼接融合后经过一个1 ×1的卷积进行参数缩减；令 x1和x4经过3 ×3卷积增加通道维数，再与1 ×1卷积后的特征融合，以提高残差网络的特征提取能力；融合后的特征信息经过一个3 ×3深度可分离卷积后与直接输入的特征相加得到最终的特征；步骤3，使用训练集图像对基于目标检测分组残差结构的特征提取网络模型进行训练；步骤4，使用步骤3训练好的网络模型对测试集图像进行特征提取。 2.如权利要求1所述的一种基于目标检测分组残差结构进行特征提取的方法，其特征在于：步骤1中将所有图像的尺寸调整到512 ×512大小进行多尺度训练，采用数据增强对图像数据集进行一系列操作：随机翻转、 pad ding填充、随机裁剪，归一化处理，图像失真处理。 3.如权利要求1所述的一种基于目标检测分组残差结构进行特征提取的方法，其特征在于：步骤2中Neck结构采用了Backbone的三个特征图[C2,C3,C4]，经过 1×1卷积后通道都降为256，经过FPN结构进行特征融合，然后 FPN经过了两次下采样得到Expand结构，最后采用3×3卷积对特征图进行处理，输出5个不同尺寸的特征图，步距为[8,16,32,64,128]，通道大小都为25 6。 4.如权利要求1所述的一种基于目标检测分组残差结构进行特征提取的方法，其特征在于：步骤3中将训练集图像大小统一为512 ×512，学习率设置为0.001， batch_size大小设置为4，训练次数为12个epoc h，并在第8个和第1 1个epoch时，将学习率降为原来的1/10 。权　利　要　求　书 1/1 页 2 CN 115294326 A 2一种基于目标检测分组残差结构进行特征提取的方法技术领域 [0001]本发明属于目标检测技术领域，具体涉及一种基于目标检测分组残差结构进行特征提取的方法。背景技术 [0002]在深度学习的发展背景下，卷积神经网络已经得到越来越多的人认同，应用也越来越普遍。基于深度学习的目标检测算法利用卷积神经网络(CNN)自动选取特征，然后再将特征输入到检测器中对目标分类和定位。 [0003]在目标检测任务中，主干网络位于整个网络的前端，用于提取目标的不同尺度特征。早期基于卷积神经网络的物体检测模型大多使用VGG 网络作为骨干网络，通过反复堆叠卷积层和池化层来提高特征提取和语义表达能力。但其层数仅为19层，提取的特征表达能力有限。如果通过堆叠加深网络层数，很容易导致梯度消失或爆炸，从而降低网络的性能。为了解决这个问题， He等人提出了一个跳跃连接残差(ResNet50)网络，它将浅层特征信息与后续层相结合，以产生新特征并将其反馈回来。此外，在单阶段目标检测网络Y OLO V3中，提出了Darknet骨干网络结构，该结构结合ResNet50的特点，在保证特征超强表达的同时，避免了网络过深带来的梯度问题。 [0004]ResNet50网络是通过堆叠残差单元形成的。在训练过程中，随着网络深度的增加，梯度消失、梯度爆炸、准确率下降等问题会陆续出现，使用残差结构可以有效地解决这些问题。然而，随着网络深度的增加，模型计算量随之增加，卷积核的通道信息也经常未被充分利用。为了提高骨干网络充分提取通道特征信息的能力，本发明提出一种分组残差结构G ‑ ResNet50，用于替换初始残差结构，形成骨干增强网络。发明内容 [0005]本发明针对现有技术的不足，提供一种基于目标检测分组残差结构进行特征提取的方法，包括以下步骤： [0006]步骤1，准备图像数据集用于测试和训练； [0007]步骤2，构建基于目标检测分组残差结构的特征提取网络； [0008]步骤3，使用训练集图像对基于目标检测分组残差结构的特征提取网络模型进行训练； [0009]步骤4，使用步骤3训练好的网络模型对测试集图像进行特征提取。 [0010]而且，所述步骤1中将所有图像的尺寸调整到5 12×512大小进行多尺度训练，采用数据增强对图像数据集进行一系列操作：随机翻转、 padding填充、随机裁剪，归一化处理，图像失真处理。 [0011]而且，所述步骤2中基于目标检测分组残差结构的特征提取网络由Backbone、 Neck 和Head三部分构成， Backbone采用的是本发明提出的G ‑ResNet50骨干网络，用于提取图片的特征， Neck结构用于连接Backb one和Head，用于融合特征， Head部分用于物体的检测，实说　明　书 1/4 页 3 CN 115294326 A 3

专利 一种基于目标检测分组残差结构进行特征提取的方法

专利一种基于目标检测分组残差结构进行特征提取的方法