(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210557381.8
(22)申请日 2022.05.20
(71)申请人 浙江大学
地址 310058 浙江省杭州市西湖区余杭塘
路866号
(72)发明人 黄慧 蒋吉庆 黄豪彩 詹舒越
(74)专利代理 机构 杭州君锐知产专利代理事务
所(普通合伙) 33443
专利代理师 应孔月
(51)Int.Cl.
G06V 10/25(2022.01)
G06V 10/762(2022.01)
G06V 10/774(2022.01)
G06V 20/05(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
水下船底可疑目标检测方法、 装置、 电子设
备及可读介质
(57)摘要
本发明公开了一种水下船底可疑目标检测
方法、 装置、 电子设备及可读介质, 包括: 获取待
检测水下图像; 利用暗通道去雾算法和MSR图像
增强算法对所述待检测水下图像进行预处理得
到输入图像; 将所述输入图像输入训练好的
YOLOv3网络中, 输出目标检测结果, 其中所述
YOLOv3网络对训练集数据的锚框获取使用K ‑
means++算法, 在非极大值抑制的筛选时使用基
于MSCNN动态阈值算法。 本发明使用的K ‑means+
+, 在目标的预训练时获取更精准的anchor box,
本发明使用的MSCNN动态阈值矩阵根据目标的稀
疏程度而进行候选框的筛选, 对 水下目标的数目
不确定的情况有很好的检测效果。
权利要求书2页 说明书7页 附图3页
CN 115294322 A
2022.11.04
CN 115294322 A
1.一种水 下船底可疑目标检测方法, 其特 征在于, 包括:
获取待检测水 下图像;
利用暗通道去雾算法和MSR图像增强算法对所述待检测水下图像进行预处理得到输入
图像;
将所述输入图像输入训练好的YOLOv3网络中, 输出目标检测结果, 其中所述YOLOv3网
络对训练集数据的锚框获取使用K ‑means++算法, 在非极大值抑制的筛选时使用基于MSCNN
动态阈值 算法。
2.根据权利要求1所述的一种水下船底可疑目标检测方法, 其特征在于, 在将所述输入
图像输入训练好的YOLOv3网络之前, 还 包括:
通过数据扩充方法获取训练数据集;
利用所述训练数据集对所述YOLOv3网络进行训练, 得到训练好的YOLOv3网络 。
3.根据权利要求2所述的一种水下船底可疑目标检测方法, 其特征在于, 所述通过数据
扩充获取训练数据集, 具体包括:
通过水平翻转、 上 下翻转、 旋转预设角度、 随机缩放、 随机 裁剪以及添加噪声中的一种
或多种方法获取训练数据集。
4.根据权利要求1所述的一种水下船底可疑目标检测方法, 其特征在于, 对训练集数据
锚框的获取使用K ‑means++算法, 具体包括:
在训练集数据中选择1个随机数据作为初始中心, 以交并比作为距离的度量单位来计
算所有样本与质心的距离, 其中所述交并比为两个预测框的重叠部分的宽和长, 即用两个
预测框的交集 面积除以并集 面积;
用轮盘法筛选下一个满足条件的聚类中心, 重复以上步骤, 直至找到k个聚类中心;
针对数据集中每个样本, 计算它到k个聚类中心 的距离并将其分到距离最小的聚类中
心所对应的簇中;
针对每个簇, 重新根据平均距离计算该簇的聚类中心, 直至到达预设迭代次数或者聚
类中心不再变化 为止;
计算每一个簇的平均交并比, 将得到的k个长和宽转换为相对比例, 作为预训练的锚
框。
5.根据权利要求1或4所述的一种水下船底可疑目标检测方法, 其特征在于, 在非极大
值抑制的筛 选时使用基于 MSCNN动态阈值 算法, 具体包括:
将所述输入图像输入到MSCNN网络中, 获取热力图, 将其正则化, 获得一个区间在(0,1)
的稀疏矩阵;
利用金字塔最大池化法将所述稀疏矩阵转 化为动态阈值矩阵;
在YOLOv3网络中应用动态阈值矩阵获得基于目标稀疏程度的阈值, 并根据所述阈值在
非极大值抑制的步骤中进行筛 选目标候选区域。
6.一种水 下图像目标检测装置, 其特 征在于, 包括:
获取模块, 用于获取待检测水 下图像;
预处理模块, 用于利用暗通道去雾算法和MSR图像增强算法对所述待检测水下图像进
行预处理得到输入图像;
目标检测模块, 用于将所述输入图像输入训练好的YOLOv3 网络中, 输出目标检测结果,权 利 要 求 书 1/2 页
2
CN 115294322 A
2其中所述YOLOv3网络对训练集数据的锚框获取使用K ‑means++算法, 在非极大值抑制的筛
选时使用基于 MSCNN动态阈值 算法。
7.根据权利要求6所述的一种水下船底可疑目标检测装置, 其特征在于, 对训练集数据
锚框的获取使用K ‑means++算法, 具体包括:
在训练集数据中选择1个随机数据作为初始中心, 以交并比作为距离的度量单位来计
算所有样本与质心的距离, 其中所述交并比为两个预测框的重叠部分的宽和长, 即用两个
预测框的交集 面积除以并集 面积;
用轮盘法筛选下一个满足条件的聚类中心, 重复以上步骤, 直至找到k个聚类中心;
针对数据集中每个样本, 计算它到k个聚类中心 的距离并将其分到距离最小的聚类中
心所对应的簇中;
针对每个簇, 重新根据平均距离计算该簇的聚类中心, 直至到达预设迭代次数或者聚
类中心不再变化 为止;
计算每一个簇的平均交并比, 将得到的k个长和宽转换为相对比例, 作为预训练的锚
框。
8.根据权利要求6或7所述的一种水下船底可疑目标检测装置, 其特征在于, 在非极大
值抑制的筛 选时使用基于 MSCNN动态阈值 算法, 具体包括:
将所述输入图像输入到MSCNN网络中, 获取热力图, 将其正则化, 获得一个区间在(0,1)
的稀疏矩阵;
利用金字塔最大池化法将所述稀疏矩阵转 化为动态阈值矩阵;
在YOLOv3网络中应用动态阈值矩阵获得基于目标稀疏程度的阈值, 并根据所述阈值在
非极大值抑制的步骤中进行筛 选目标候选区域。
9.一种电子设备, 其特征在于, 包括处理器、 通信 接口、 存储器和总线, 其中, 处理器, 通
信接口, 存储器通过总线完成相互间的通信, 处理器可以调用存储器中的逻辑指 令, 以执行
如权利要求1至 5任一项所述的水 下图像目标检测方法。
10.一种非暂态计算机可读存储介质, 其特征在于, 所述非暂态计算机可读存储介质存
储计算机指令, 所述计算机指 令使所述计算机执行如权利要求1至5任一项所述的水下图像
目标检测方法。权 利 要 求 书 2/2 页
3
CN 115294322 A
3
专利 水下船底可疑目标检测方法、装置、电子设备及可读介质
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:37:07上传分享