(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210882832.5
(22)申请日 2022.07.26
(71)申请人 湖北工业大 学
地址 430068 湖北省武汉市洪山区南李路
28号
(72)发明人 王改华 曹清程 甘鑫 翟乾宇
(74)专利代理 机构 武汉科皓知识产权代理事务
所(特殊普通 合伙) 42222
专利代理师 王琪
(51)Int.Cl.
G06V 10/25(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06V 10/44(2022.01)
G06V 10/774(2022.01)G06V 10/80(2022.01)
G06V 10/82(2022.01)
(54)发明名称
一种基于目标检测分组残差结构进行特征
提取的方法
(57)摘要
本发明公开一种基于目标检测分组残差结
构进行特征提取的方法, 包括: 准备训练、 测试用
的图像数据集; 构建基于目标检测分组残差结构
的特征提取网络, 包括Backbone、 Neck和Head三
部分; 使用训练好的网络对测试集图像进行特征
提取。 本发明对ResNet50骨干网络进行改进, 引
入了分组卷积块, 对不同组别之间的特征信息进
行融合, 提高了特征提取的质量, 同时使用 深度
可分离卷积替代传统的卷积, 使参数量和运算成
本更低。
权利要求书1页 说明书4页 附图3页
CN 115294326 A
2022.11.04
CN 115294326 A
1.一种基于目标检测分组残差结构进行 特征提取的方法, 其特 征在于, 包括以下步骤:
步骤1, 准备图像数据集用于测试和训练;
步骤2, 构建基于目标检测分组残差结构的特征提取网络, 该网络 由Backbone、 Neck和
Head三部分构成, Backbone采用的是对ResNet50残差结构改进后的G ‑ResNet50骨干网络,
用于提取图片的特征, Neck结构用于连接Backbone和Head, 用于融合特征, Head部分用于物
体的检测, 实现目标的分类和回归; 特征信息经过G ‑ResNet50骨干网络的卷积和最大池化
层后, 进入由ResNet50原始残差和改进后的新残差构成 的残差网络, ResNet50骨干网络的
分组残差结构new residual将1×1卷积后的卷积层分为四个通道组x1、 x2、 x3、 x4, 每组的
宽、 高相同, 通道数为输入特征图的1/4, 通过分组卷积, x1、 x2、 x3、 x4生成y1、 y2、 y3、 y4, 此
外x1和x4的特征信息分别与x2和 x3交错生成y2和y3, 将两个通道得到的y2、 y3通过拼接进
行合并, 然后将y1、 y2、 y3、 y4的特征信息拼接融合后经过一个1 ×1的卷积进 行参数缩减; 令
x1和x4经过3 ×3卷积增加通道维数, 再与1 ×1卷积后的特征融合, 以提高残差网络的特征
提取能力; 融合后的特征信息经过一个3 ×3深度可分离卷积后与直接输入的特征相加得到
最终的特 征;
步骤3, 使用训练集图像对基于目标检测分组残差结构的特 征提取网络模型进行训练;
步骤4, 使用步骤3训练好的网络模型对测试集图像进行 特征提取。
2.如权利要求1所述的一种基于目标检测分组残差结构进行特征提取的方法, 其特征
在于: 步骤1中将所有图像的尺 寸调整到512 ×512大小进 行多尺度训练, 采用数据增强对图
像数据集进行一系列操作: 随机翻转、 pad ding填充、 随机 裁剪, 归一化处理, 图像失真处 理。
3.如权利要求1所述的一种基于目标检测分组残差结构进行特征提取的方法, 其特征
在于: 步骤2中Neck结构 采用了Backbone的三个特征图[C2,C3,C4], 经过 1×1卷积后通道都
降为256, 经过FPN结构进行特征融合, 然后 FPN经过了两次下采样得到Expand结构, 最后采
用3×3卷积对特征图进行处理, 输出5个不同尺寸的特征图, 步距为[8,16,32,64,128], 通
道大小都为25 6。
4.如权利要求1所述的一种基于目标检测分组残差结构进行特征提取的方法, 其特征
在于: 步骤3中将训练集图像大小统一为512 ×512, 学习率设置为0.001, batch_size大小设
置为4, 训练次数为12个epoc h, 并在第8个和第1 1个epoch时, 将学习率降为原来的1/10 。权 利 要 求 书 1/1 页
2
CN 115294326 A
2一种基于目标 检测分组残差结构进行特征提取的方 法
技术领域
[0001]本发明属于目标检测技术领域, 具体涉及 一种基于目标检测分组残差结构进行特
征提取的方法。
背景技术
[0002]在深度学习的发展背景下, 卷积神经网络已经得到越来越多的人认同, 应用也越
来越普遍。 基于深度学习的目标检测算法利用卷积神经网络(CNN)自动选取特征, 然后再将
特征输入到检测器中对目标分类和定位。
[0003]在目标检测任务中, 主干网络位于整个网络 的前端, 用于提取目标的不 同尺度特
征。 早期基于卷积神经网络的物体检测模型大多使用VGG 网络作为骨干网络, 通过反复堆叠
卷积层和池化层来提高特征提取和语义表达能力。 但其层数仅为19层, 提取 的特征表达能
力有限。 如果通过堆叠加深网络层数, 很容易导致梯度消失或爆炸, 从而降低网络的性能。
为了解决这个问题, He等人提出了一个跳跃连接残差(ResNet50)网络, 它将浅层特征信息
与后续层相结合, 以产生新特征并将其反馈回来。 此外, 在单阶段目标检测网络Y OLO V3中,
提出了Darknet骨干网络结构, 该结构结合ResNet50的特点, 在保证特征超强表达的同时,
避免了网络过深带来的梯度问题。
[0004]ResNet50网络是通过堆叠残差单元形成的。 在训练过程中, 随着网络深度的增加,
梯度消失、 梯度爆 炸、 准确率下降等问题会陆续出现, 使用残差结构可以有效地解决这些问
题。 然而, 随着网络深度的增加, 模型计算量随之增加, 卷积核的通道信息也经常未被充分
利用。 为了提高骨干网络充分提取通道特征信息的能力, 本发明提出一种分组残差结构G ‑
ResNet50, 用于替换初始 残差结构, 形成骨干增强网络 。
发明内容
[0005]本发明针对现有技术的不足, 提供一种基于目标检测分组残差结构进行特征提取
的方法, 包括以下步骤:
[0006]步骤1, 准备图像数据集用于测试和训练;
[0007]步骤2, 构建基于目标检测分组残差结构的特 征提取网络;
[0008]步骤3, 使用训练集图像对基于目标检测分组残差结构的特征提取网络模型进行
训练;
[0009]步骤4, 使用步骤3训练好的网络模型对测试集图像进行 特征提取。
[0010]而且, 所述步骤1中将所有图像的尺寸调整到5 12×512大小进行多尺度训练, 采用
数据增强对图像数据集进行一系列操作: 随机翻转、 padding填充、 随机裁剪, 归一化处理,
图像失真处 理。
[0011]而且, 所述步骤2中基于目标检测分组残差结构的特征提取 网络由Backbone、 Neck
和Head三部分构成, Backbone采用的是本发明提出的G ‑ResNet50骨干网络, 用于提取图片
的特征, Neck结构用于连接Backb one和Head, 用于融合特征, Head部分用于物体的检测, 实说 明 书 1/4 页
3
CN 115294326 A
3
专利 一种基于目标检测分组残差结构进行特征提取的方法
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:40:41上传分享