说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210799673.2 (22)申请日 2022.07.06 (71)申请人 西北工业大 学 地址 710072 陕西省西安市友谊西路127号 (72)发明人 沈钧戈 危欢 毛昭勇 孙健 王亦晨 (74)专利代理 机构 西北工业大 学专利中心 61204 专利代理师 金凤 (51)Int.Cl. G06V 20/05(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/44(2022.01) G06V 10/764(2022.01)G06V 10/80(2022.01) G06V 10/82(2022.01) (54)发明名称 一种基于深度学习的水下目标三维重建方 法 (57)摘要 本发明提供了一种基于深度学习的水下目 标三维重建方法, 采用注意力机制获得水下图片 重点聚焦的特征, 对图片进行单应性变换, 生成 匹配特征体, 计算该图片的特征体与其他图片特 征体的匹配代价, 得到一个四维的匹配代价体, 使用基于多尺度的三维卷积神经网络进行匹配 代价体正则化, 对代价体进行过滤, 得到深度值 概率体, 通过神经网络得出深度图, 将深度值映 射到三维空间, 得到三维点云图。 本发明充分使 用卷积神经网络的特征提取能力, 进一步提升模 型的表征能力, 极大改善立体匹配效果, 动态平 衡各个通道的权重大小, 能够精 准的对特征的各 个通道进行全局信息调整, 有利于优化特征局部 信息。 权利要求书4页 说明书9页 附图1页 CN 115147709 A 2022.10.04 CN 115147709 A 1.一种基于深度学习的水 下目标三维重建方法, 其特 征在于包括下述 步骤: 步骤1, 采用注意力机制获得 水下图片重点聚焦的特 征; 步骤2, 从步骤1获得的图片任意选出一张图片作为推理图片; 引入先验信息, 包括相机 内参以及每张图片对应的内参和外参, 进 行单应性变换, 生成匹配特征体, 计算该图片的特 征体与其 他图片特 征体的匹配代价, 得到一个四维的匹配代价体; 步骤3, 使用基于多尺度的三维卷积神经网络进行匹配代价体正则化, 利用U ‑Net网络, 对匹配代价体进行降采样, 并提取不同尺度中的上下文信息和临近像素信息, 对代价体进 行过滤, 得到深度值 概率体; 步骤4, 将深度值概率体直接与预设的连续深度值相乘再求和, 得到一个初步的深度 图; 最大深度值设置为192, 由推理 图片生成另一张深度图, 将两张深度图分别与真实的深 度图进行比对, 两 部分损失之和作为损失值; 步骤5, 通过调 节步骤1和步骤3的深度卷积神经网络的超参数, 所述的超参数包括学习 率、 批次大小、 卷积核尺寸和激活函数, 超参数属于神经网络的通用参数, 调节的方式是采 用控制变量法依次逐个缓慢增 加或减少以得到最优的结果; 步骤6, 将待分类的水下图像数据经过步骤1至步骤4之后, 通过神经网络得出深度图, 将深度值映射到三维空间, 得到三维点云图。 2.根据权利要求1所述的基于深度学习的水 下目标三维重建方法, 其特 征在于: 所述步骤1中, 采用一个通道注意力模块加强特征的提取, 输入的图片依次经过CNN、 注 意力机制及CN N得到特征提取, 得到一个和水 下图片大小一样但是 特征更加明显的图片; 所述CNN包括一系列卷积、 批归一化层和线性整流激活函数, 即: Conv ‑BN‑Relu, 卷积核 的尺寸为3×3, 卷积核个数为 128, 经过两次卷积操作, 匹配三个层次的特征尺 寸, 降维到统 一到尺寸; 表1 CNN模型的网络各层特 征信息 在水下图片特 征提取各层次特 征信息如表1所示。 3.根据权利要求1所述的基于深度学习的水 下目标三维重建方法, 其特 征在于: 所述步骤2中构建匹配代价体的步骤为: 通过深度特征抽取后, 每张图片得到一张对应的特征图, 根据 先验的深度 范围信息, 以权 利 要 求 书 1/4 页 2 CN 115147709 A 2主光轴为扫描方向, 将参考影像按照某一深度间隔, 从最小深度一直映射到最大深度处, 得 到一个处于不同深度间隔的相机锥体, 利用插值的方法, 使得每张投影的长 宽一样; 已知推理水下图片Iref, 候选集中影像的相机参数为: {Ki,Ri,ti}, 其中, Ki代表相机内 参, Ri和ti代表外参中的旋转角和平移, 对于 候选集中的非推理图片的特征图投影到该相机 椎体的不同深度中, 定义投影变换为: Vi=Hj( θ )xj, θ表示深度值, xj为候选集中第j个图片 经过结合注意力的CNN得到的特征, Vi表示第j个图片经过结合注意力的CNN得到的特征经 过单应性变换的结果; Hj表示对于第j个特征图映射到深度θ 的参考影像上的单应性矩阵, 单应性矩阵的计算公式为: 其中, Kj代表第j个特征的内参, Rj表示第j个特征的外参旋转角, I代表图片, tref代表推 理图片外参的平移矩阵, tj代表第j张图片外参的平移矩阵, 代表推理图片法向量的转 置, θ表示深度值, 表示推理图片的外参旋转矩阵的转置, 表示推理图片的内参矩阵 的转置; 单应性矩阵是完全可以微分的, 通过投影变换, N张图片形成N个特征体Vi(i∈N), 特征 体Vi就是匹配代价体的表示; 采用一种基于方差的多视图一致性度量准则, 保证每一个特征体Vi都加入方差计算中, 表示一致性度量, 利用下式构造三维代价体: 其中C代表 三维代价体, N代表匹配代 价数量, Vi代表第i个代价体, 代表匹配代 价的平 均值。 4.根据权利要求1所述的基于深度学习的水 下目标三维重建方法, 其特 征在于: 所述步骤3中, 优化匹配代价体的步骤为: 采用基于多尺度的三维卷积神经网络进行代价体正则化, 利用U ‑Net网络, 对代价体进 行降采样, 并提取不同尺度中的上下文信息和临近像素信息, 对代价体进 行过滤; 首先进 行 下采样, 构建输入图像的高斯金字塔, 获得3个尺度的特征; 然后, 在 进行特征融合用于联合 精细信息和粗略信息; 输入为初始匹配代价体C, 各层次特 征信息如表 2所示: 表2优化匹配代价体中CN N模型的网络各层特 征信息权 利 要 求 书 2/4 页 3 CN 115147709 A 3
专利 一种基于深度学习的水下目标三维重建方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-02-24 00:40:47
上传分享
举报
下载
原文档
(730.5 KB)
分享
友情链接
DB32-T 3670-2019 律师政府法律顾问服务导则 江苏省.pdf
奇安信 网络安全应急响应典型案例集(2021).pdf
DB53-T1033-2021 公路隧道监控量测技术规程 云南省.pdf
DB31-T 367-2022 黄浦江游览船及码头运营设施与服务质量要求 上海市.pdf
GB-T 5271.17-2010 信息技术词汇第17部分数据库.pdf
T-ZZB 1424—2019 节能低噪音三相干式电力变压器.pdf
GB-T 32649-2016 光伏用高纯石英砂.pdf
等保二级-安全技术-数据安全.doc
GM-T 0115-2021 信息系统密码应用测评要求.pdf
T-CCUA 019—2022 金融机构信息系统运维数据治理能力成熟度评估规范.pdf
T-CHTS 10034—2021 沥青路面施工质量信息动态管理技术指南.pdf
T COSOCC 007—2024 信息安全技术 网络空间资产测绘安全要求.pdf
GB-T 3536-2008 石油产品 闪点和燃点的测定 克利夫兰开口杯法.pdf
T-CBJ 3201—2019 工坊啤酒及其生产规范.pdf
GB-T 4333.4-2007 硅铁 铝含量的测定 铬天青S分光光度法、EDTA滴定法和火焰原子吸收光谱法.pdf
GB 35114-2017 公共安全视频监控联网信息安全技术要求.pdf
GB-T 26832-2011 无损检测仪器 钢丝绳电磁检测仪技术条件.pdf
ISO TS 44006 2023 Collaborative business relationship management — Guidelines for.pdf
DB13-T 5181-2020 尾矿库溃坝泥石流数值模拟技术规程 河北省.pdf
DB42-T 819-2012 风电场防雷设计规范 湖北省.pdf
交流群
-->
1
/
15
评价文档
赞助2元 点击下载(730.5 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。