说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210138123.6 (22)申请日 2022.02.15 (71)申请人 南通大学 地址 226019 江苏省南 通市崇川区啬园路9 号 (72)发明人 邵叶秦 曹秋阳 李登亮 宋锦伟 高瞻 施佺 (74)专利代理 机构 南京瑞弘专利商标事务所 (普通合伙) 32249 专利代理师 许海洲 (51)Int.Cl. G06V 10/40(2022.01) G06V 10/762(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01)G06T 3/40(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于注意力YOLOv5模型的自动水果识 别方法 (57)摘要 本发明公开了一种基于注意力YOLOv5模型 的自动水果识别方法, 包括以下步骤: 1、 将数据 集的原始图像进行预处理; 2、 输入主干网络提取 特征, 并使用SENet注意力模块得到一个与通道 对应的一维向量作为评价 分数; 3、 将评价 分数通 过乘法操作作用到feature map的对应通道上, 得到用于水果识别的有效特征; 4、 经过Feature Pyramid Networks和Path Aggregation Network结构将特征融合; 5、 对图像特征进行预 测, 使用CIOU 考虑目标框与预测框的高宽比和中 心点之间的关系, 提升预测精度, 根据大、 中、 小 目标分别输出识别结果。 权利要求书2页 说明书6页 附图2页 CN 114494710 A 2022.05.13 CN 114494710 A 1.一种基于注意力YOLOv5模型的自动水果识别方法, 其特 征在于, 包括以下步骤: 步骤1、 将数据集的原 始图像进行 预处理; 步骤2、 输入主干网络提取特征, 并使用SENet注意力模块得到一个与通道对应的一维 向量作为评价分数; 步骤3、 将评价分数通过乘法操作作用到feature map的对应通道上, 得到用于水果识 别的有效特 征; 步骤4、 经 过特征金字塔和路径聚合网络结构将特 征融合; 步骤5、 对图像特征进行预测, 使用CIOU考虑目标框与预测框的高宽比和中心点之间的 关系, 提升预测精度, 根据大、 中、 小目标分别输出识别结果。 2.根据权利 要求1所述的基于注意力YOLOv5模型的自动水果识别方法, 其特征在于, 所 述步骤1中使用Mosaic数据增强的方式进行图像拼接 。 3.根据权利 要求2所述的基于注意力YOLOv5模型的自动水果识别方法, 其特征在于, 所 述步骤1中对数据集的尺寸归一化处理, 对原始图像进 行自适应填充最少的灰度值, 具体包 括以下步骤: 步骤1.1、 设置图像缩放比例; 令原始图像为A ×B, 缩放至a ×a, 其中A为原始图像的宽, B为原始图像的高, a为缩放后图像的宽, 缩放后图像宽和高相等, 将缩放后图像的宽高除以 原始图像相应宽高, 得到2个系数, 取其小的系数; 步骤1.2、 设置缩放后的尺寸; 将原 始图片宽高乘以最小的系数, 则宽为C, 高为D; 步骤1.3、 设置灰边的填充值; 先将C减去D, 并采用取余的方式得需要填充的像素值(C ‑ D)%E=F, 其中E=2n, n是网络经过的下采样次数, 两端各 个像素; 在测试过程中采用灰色 填充, 训练过程使用原 始的resize操作以提高物体的检测、 计算速度。 4.根据权利 要求1所述的基于注意力YOLOv5模型的自动水果识别方法, 其特征在于, 所 述主干网络是CS PDarknet‑53, 能增强卷积网络的学习能力, 降低内存消耗。 5.根据权利 要求1所述的基于注意力YOLOv5模型的自动水果识别方法, 其特征在于, 步 骤2所述SENet 注意力模块操作过程包括以下步骤: 步骤2.1、 使用全局平均池化作为Sque eze操作; 步骤2.2、 使用两个全连接层得到通道间的相关性, 同时减少参数与计算 量; 步骤2.3、 通过Sigmo id归一化权重; 步骤2.4、 通过Scale操作将归一 化后的权 重作用在原 始通道的特 征上。 6.根据权利 要求1所述的基于注意力YOLOv5模型的自动水果识别方法, 其特征在于, 所 述步骤5中CIOU将真实框与预测框之间的距离、 重叠率、 边框尺度以及惩罚因子均考虑进 去, 使得目标边框回归更加稳定; CIOU公式: 其中, ρ2(b, bgt)即预测框与真实框中心点之间的欧式距离d, c表示 同时包含真实框与 预测框最小闭包矩形框的对角线距离 。 惩罚项α v中α 的公式如下 所示:权 利 要 求 书 1/2 页 2 CN 114494710 A 2惩罚项α v中v的公式如下 所示: 其中, wgt表示真实框的宽, hgt表示真实框的高, w表示预测框的宽, h表示预测框的高; CIOU在回归时l oss的计算公式如下 所示: 目标框与预测框重合时, CIOU值不相同; c值相同时, 通过目标框与预测框中心点的欧 式距离与对角线的比值d, 度量两者 位置关系, 使损失函数收敛。权 利 要 求 书 2/2 页 3 CN 114494710 A 3
专利 一种基于注意力YOLOv5模型的自动水果识别方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:32:14
上传分享
举报
下载
原文档
(626.5 KB)
分享
友情链接
DB3305-T 149—2020 长三角G60科创走廊“一网通办”专窗管理规范 湖州市.pdf
GB-T 39854-2021 光伏发电站性能评估技术规范.pdf
塞讯 自动化安全度量验证平台.pdf
A_White_Paper_of_AIGC_GPT-4_Empowering_Telecom_Sector.pdf
GB-T 32737-2016 土壤硝态氮的测定 紫外分光光度法.pdf
GB-T 36627-2018 信息安全技术 网络安全等级保护测试评估技术指南.pdf
DB45-T 2211-2020 航空集装箱用铝合金板材技术规范 广西壮族自治区.pdf
GB/T 36448-2018 集装箱式数据中心机房通用规范.pdf
T-DGAG 024—2024 政务信息化项目 服务成本度量规范 系统业务运营服务.pdf
GB-T 32169.4-2015 政务服务中心运行规范 第4部分:窗口服务评价要求.pdf
GB-T 35218-2017 拖拉机可靠性 台架试验方法.pdf
GB-T 37094-2018 信息安全技术 办公信息系统安全管理要求.pdf
DB31-T 1356.1-2022 公共数据资源目录 第1部分:编制指南 上海市.pdf
GB-T 39404-2020 工业机器人控制单元的信息安全通用要求.pdf
GB-T 22918-2008 易腐食品控温运输技术要求.pdf
GB-T 37756-2019 产品水足迹评价和报告指南.pdf
SL-T 813-2021 规划水资源论证技术导则.pdf
GB-T 36568-2018 光伏方阵检修规程.pdf
GB-T 3462-2017 钼条和钼板坯.pdf
中国银保监会监管数据安全管理办法(试行).pdf
1
/
3
11
评价文档
赞助2.5元 点击下载(626.5 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。