(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210574950.X
(22)申请日 2022.05.25
(71)申请人 西安理工大 学
地址 710048 陕西省西安市碑林区金花 南
路5号
(72)发明人 刘晶 马小龙 梁庆国
(74)专利代理 机构 西安弘理专利事务所 61214
专利代理师 徐瑶
(51)Int.Cl.
G06V 10/774(2022.01)
G06V 10/40(2022.01)
G06V 10/77(2022.01)
G06V 10/762(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
基于轻量化骨干网络的目标检测方法
(57)摘要
本发明公开的基于轻量化骨干网络的目标
检测方法, 具体按照以下步骤实施: 步骤1、 准备
预训练数据集Tiny ‑Imagenet和VOC格式的训练
数据集; 步骤2、 搭建特征提取网络LBNet; 步骤3、
搭建由LBNet的多层输出特征构成的特征金字塔
结构, 并且在通过步骤1得到的T iny‑Imagenet数
据集中进行预训练, 得到预训练权重。 步骤4、 设
计anchors生成容器算法, 生成区域推荐网络所
需的anchors尺寸。 步骤5、 完成模型的训练和预
测。 该方法解决了现有检测技术中存在的检测效
率低和边界框 定位不准的问题。
权利要求书3页 说明书8页 附图3页
CN 114863218 A
2022.08.05
CN 114863218 A
1.基于轻量 化骨干网络的目标检测方法, 其特 征在于, 具体按照以下步骤实施:
步骤1、 准备 预训练数据集Ti ny‑Imagenet和VOC格式的训练数据集;
步骤2、 搭建特 征提取网络LBNet;
步骤3、 搭建由LBNet的多层输出特征构成的特征金字塔结构, 并且在通过步骤1得到的
Tiny‑Imagenet数据集中进行 预训练, 得到预训练权 重;
步骤4、 设计anc hors生成容器算法CFA, 生成区域推荐网络所需的anc hors尺寸;
步骤5、 完成模型的训练和预测。
2.根据权利要求1所述的基于轻量化骨干网络的目标检测方法, 其特征在于, 所述步骤
1具体按照以下步骤实施:
步骤1.1、 准备 预训练数据集Ti ny‑Imagenet, 并生成预训练所需的标签文件;
所述步骤1.1具体按照以下步骤实施:
步骤1.1.1、 从Imagenet数据集中抽取一部分来制作本所需的预训练数据集Tiny ‑
Imagenet, 即预训练数据集TI;
步骤1.1.2、 生成标签文件, 根据每个类别 对应的实际物体名称构 建json类型的标签文
件; 从TI中按照8:2的比例去划分训练集和验证集, 然后对TI中包含的每个类别中进行采
样, 分别得到标签文件t rain.csv和val.csv;
步骤1.2、 准备VOC格式的训练数据集;
步骤1.2具体按照以下步骤实施:
步骤1.2.1、 将广泛用于目标检测的PascalV OC2007和2012数据集进行合并来制作我们
所需的VOC格式的训练数据集M;
步骤1.2.2、 生成标签文件, 对训练集和验证集 中的图像进行类别和区域标注, 生成xml
文件, 并将其统一放在Annotations文件夹中, 根据xml文件生成后续训练所需的
train.txt, val.txt和t rainval.txt标签文件, 并统一 放在Main文件夹中。
3.根据权利要求2所述的基于轻量化骨干网络的目标检测方法, 其特征在于, 所述步骤
2具体按照以下步骤实施:
步骤2.1、 设计内部连接 子块;
步骤2.2、 设计残差连接块, 通过跳跃连接的方式将每个内部连接子块的输入和输出进
行相加, 便就形成了残差连接块;
步骤2.3、 设计局部密集连接块, 将每个内部连接子块的输出层特征都与其前面所有内
部连接子块的输出 特征在对应通道维度上进行拼接, 便就形成了局部密集连接块;
步骤2.4、 设计LBNet的第一个网络层C1, C1是一个由步长为1, 大小为3x3, 通道数为32的
卷积核、 Batc h Normalization层和激活函数ReLu组成的卷积层结构;
步骤2.5、 设计LBNet中以残差连接块和密集连接块为主体的网络层结构C2, C3, C4, C5,
C6;
步骤2.6、 设计LBNet中的降采样层d。
4.根据权利要求3所述的基于轻量化骨干网络的目标检测方法, 其特征在于, 所述步骤
2.1具体按照以下步骤实施:
步骤2.1.1、 每个连接子块的结构都一样, 均由一个大小为1x1的卷积核一个大小为3x3
的卷积核构成; 具体的前向传播过程是Co nv(1x1)‑BN‑ReLu‑Conv(3x3)‑BN‑ReLu;权 利 要 求 书 1/3 页
2
CN 114863218 A
2步骤2.1.2、 保证内部连接子块的输入和输出尺寸一致, 将内部连接子块中1x1卷积核
的通道数设置为3x3卷积核通道数的1/2。
5.根据权利要求4所述的基于轻量化骨干网络的目标检测方法, 其特征在于, 所述步骤
2.5具体按照以下步骤实施:
步骤2.5.1、 将C2与C5设置为由局部密集连接块构成的层 结构; C2是一个由3个内部连接
子块构成的局部密集连接块, C5是一个由4个内部连接 子块构成的密集连接块;
步骤2.5.2、 将C3, C4, C6设置为由残差连接块构成的层结构; C3, C4, C6分别为由4个, 6个
和6个内部连接 子块构成的残差连接块。
6.据权利要求5所述的基于轻量化骨干网络的目标检测方法, 其特征在于, 所述步骤
2.6具体按照以下步骤实施:
步骤2.6.1、 在LBNet 中C1~C6的相邻两个网络层之间, 均采用一个大小为3x3, 步长为2
的降采样层d来完成下采样 操作;
步骤2.6.2、 对于网络层C2~C6来说, 将步长为2, 大小为3x3的卷积核移到了残差连接块
之外的主干路径上, 也 就是在每 个独立的连接块之前就完成图像的下采样。
7.根据权利要求6所述的基于轻量化骨干网络的目标检测方法, 其特征在于, 所述步骤
3具体按照以下步骤实施:
步骤3.1、 设计横向连接结构, 并通过横向连接结构将 LBNet中网络层 C2~C6的输出特征
作为特征金字塔的输入;
所述步骤3.1具体按照以下步骤实施:
步骤3.1.1、 设置LBNet输出特征层; 选择从第1个局部密集连接块C2开始进行特征的输
出, 并将C2的输出记为 F2, 为了得到更加丰富的多尺度特征信息, 将接下来的3个残差连接块
C3、 C4、 C6的特征信息和1个局部密集连接块C5的特征信息进行输出, 因此, 这5个特征层依次
记为: F={F2, F3, F4, F5, F6};
步骤3.1.2、 统一设置输出层的通道数并对输出层进行降维; 通过一个大小为1x1卷积
核来完成上述C2~C6中特征层通道的降维, 由于C2的通道数为64, 所以此处的通道数统一设
置为64;
步骤3.2、 搭建由LBNet的多层输出特征构成的自上而下的特征金字塔结构; 首先使用
1x1x64大小的卷积核分别对特征层F6, F5降维得到新的特征层P6, P5, 这样就得到了第一个
特征输出层P6, 然后使用双线性插值 的方法将P6上采样到与P5相同的尺寸大小; 最后, 将P6
和P5在其对应的维度上进行相 加, 就获得了更新后的第二个特征输出层P5; 基于上述的相同
策略, 使用P5更新P4, 使用P4更新P3, 使用P3更新P2;
步骤3.3、 将预训练数据集TI中的图片送入由LBNet构成的特征金字塔结构中, 并依据
步骤1.1.2中的标签文件设置类别数, 进行 预训练, 得到预训练权 重。
8.根据权利要求7所述的基于轻量化骨干网络的目标检测方法, 其特征在于, 所述步骤
4具体按照以下步骤实施:
步骤4.1、 输入带有边界包围框的训练集图像即样本;
步骤4.2、 从所有输入的图像中挑选k个边界包围框作为聚类中心;
步骤4.3、 依次计算并比较所有边界包围框与每个聚类中心之间的距离D, 并划分边界
框所在的类;权 利 要 求 书 2/3 页
3
CN 114863218 A
3
专利 基于轻量化骨干网络的目标检测方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:36:33上传分享