说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210810000.2 (22)申请日 2022.07.11 (71)申请人 河海大学 地址 210024 江苏省南京市 鼓楼区西康路1 号 (72)发明人 周亚男 汪顺营 冯莉 杨先增  (74)专利代理 机构 南京苏高专利商标事务所 (普通合伙) 32204 专利代理师 王恒静 (51)Int.Cl. G06V 20/10(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/44(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) (54)发明名称 一种基于注意力网络的遥感影像建筑物特 征提取方法 (57)摘要 本发明公开了一种基于注意力网络的遥感 影像建筑物特征提取方法, 该方法包括: 获取具 有地物要素的遥感影像建筑物图片, 并进行预处 理, 得到预处理后的图片; 将预处理后的图片输 入至注意力网络中, 常规流包括5个卷积块, 每个 卷积块结构相同, 经过常规流后的特征图为二值 语义图Fs, 形状流的输入为常规流5个卷积块的 输出特征图; 将常规流和形状流 分别得到的二值 图Fs和Fe经过通道连接后输入到融合模块, 经过 卷积下采样 遇上采样操作后, 最终输出为大小为 HW的目标二值语义图, 该部分输出由常规流中使 用的语义标签进行损失监督, 从而得到边缘清晰 的二值语义图。 本发明改进传统的注意力机制, 使得可以采用更小的网络结构提高遥感影像建 筑物提取的效果。 权利要求书2页 说明书5页 附图2页 CN 115063685 A 2022.09.16 CN 115063685 A 1.一种基于注意力网络的遥感影 像建筑物特 征提取方法, 其特 征在于, 该 方法包括: 首先, 获取具有地物要素的遥感影像建筑物图片, 并进行预处理, 得到预处理后的图 片; 其次, 将大小为C ×H×W的预处理后的图片输入至注意力网络中, 所述注意力网络包括 常规流、 形状流和融合模块, 所述常规流包括5个卷积块, 每个卷积块结构相同, 经过常规流 后的特征图为二值语义图Fs, 所述形状流的输入为常规流5个卷积块的输出特征图, 大小分 别为CHW* 1/2i, 将其上采样CHW大小后输入到4个串联的门控卷积层GCL后得到大小为1HW的 二值边缘图Fe, 0≤i≤4; 最后, 将常规流和形状流分别得到的二值图Fs和Fe经过通道连接后输入到融合模块, 经 过卷积下采样遇上采样操作后, 最终输出为大小为HW的目标二值语义图, 该部分输出 由常 规流中使用的语义标签进行损失监 督, 从而得到边 缘清晰的二 值语义图。 2.根据权利要求1所述的基于注意力网络的遥感影像建筑物特征提取方法, 其特征在 于, 每个卷积块包括编码 器、 注意力部 分和解码 器, 所述常规流对图像的处理方法包括以下 步骤: (1)将预处理后的图片输入到编码器 中, 编码器包括5个编码层, 除了第一个编码层, 其 余四个编码层都会将特征图的尺 寸缩小二分之一, 当输入特征图大小为CHW时, 先经过第一 个编码层依旧为C1HW, 经过第二个编码层后尺寸为C2H/2W/2, 经过第三个编码层后尺寸为 C3H/22W/22, 经过第四个编码层后尺寸为C4H/23W/23, 经过第五个编码层后尺寸为C5H/24W/ 24, 经过五个编码层后, 尺寸变为原来的1/16, 得到编码后的特 征图Fe; (2)所述注意力部分包 括通道注意力模块、 位置注意力模块、 叠加模 块, 首先将特征图Fe 经过一个1 ×1卷积, 将通道维度数量 从C5降为C’, 空间维度尺寸不变得到C ’H/24W/24的特征 图Fi, 输入到通道注意力模块中, 得到与Fi同样大小的特征图Fo1, 所述通道注意力模块用于 使用特征通道挤压和激励处 理输入的特 征图; (3)将大小为C5H/24W/24的特征图Fe先经过一个1 ×1卷积, 将通道维度数量从C5降为C’, 空间维度尺寸不变得到C ’H/24W/24的特征图Fi, 此处的Fi与步骤(2)的Fi是相同的, 步骤(2) 与步骤(3)的两个注意力是并行的, 然后将其输入到位置注意力模块中, 得到与Fi同样大小 的特征图Fo2, 所述位置注意力模块用于使用Criss ‑Cross Attention  Module通 过两次叠加 得到像素的空间全局上 下文信息; (4)将特征图Fo1和特征图Fo2输入到叠加模 块中, 叠加模 块采用short ‑cut结构融合特征 图Fo1和特征图Fo2, 最终得到大小为3*C ’ ×H/24×W/24的输出特征图, 所述叠加 模块用于将 不同输入的特 征图在通道维度上进行叠加操作; (5)将步骤(4)中得到的特 征图Fleveli经解码块上采样为1HW大小的二 值语义图Fs。 3.根据权利要求1所述的基于注意力网络的遥感影像建筑物特征提取方法, 其特征在 于, 所述形状流由边 缘标签对输出的二 值边缘图进行损失监 督。 4.根据权利要求1所述的基于注意力网络的遥感影像建筑物特征提取方法, 其特征在 于, 所述通道注意力模块具体为: 挤压是在空间维度上进行压缩, 将C ’H/24W/24的特征图Fi进行全局平均池化操作, 每个 通道得到一个标量, 输出为C ’ ×1×1, 激励是将得到的C ’ ×1×1特征图, 送入两层的全连接 神经网络, 同时保持尺寸不变, 然后再通过一个Sigmoid函数得到C ’个0~1之间的权重Mc,权 利 要 求 书 1/2 页 2 CN 115063685 A 2作为C’个通道各自的权重, 然后将权重与对应通道的每个元素分别相乘, 实现增强重要的 特征, 减弱不重要的特征, 从而让提取的特征指向性更强, 该模块的输出是大小为C ’ ×H/24 ×W/24的特征图Fo1。 5.根据权利要求4所述的基于注意力网络的遥感影像建筑物特征提取方法, 其特征在 于, 所述位置注意力模块具体为: 对于卷积得到大小为C ’ ×H/24×W/24的特征图Fi分别进行1 ×1卷积得到特征图Q、 K、 V, 其中, 特征图Q和K的大小为C ’ ×H/24×W/24, 特征图V的大小为C ’ ×H/24×W/24, 然后对Q和K 进行Affinicy操作, 即在Q上任意像素点u取得一个通道向量Qu, 共有H*W个, 形状为C ’ ×1× 1, 同时, 在K和Q 上像素点u的同行同列所有位置上取得一个特征向量Ku、 Vu, 有Ku、 Vu∈[(H/24 +W/24‑1)×C’], Ki, u、 Vi, u表示Ku、 Vu上的第i个像素的通道向量, 形状 为C’ ×1×1, 对Qu和Ku进 行向量相乘操作得到向量Di, u, 之后再通道维度上应用一个softmax层, 获得注意图A, 其表 示任一像素点与其同行同列其他像素点的相关程度; 然后再将Ai, u与Vi, u进行矩阵相乘, 经 过以上操作可以捕捉到任一像素点与其水平和垂 直方向的上下文信息; 但一个像素与其周 围不在交叉路径中的像素之间的连接仍然缺失, 通过两次CCAM模块叠加操作, 每个位置都 可以从给定图像的所有像素 中收集全局上下文信息, 该模块的输出是大小为C ’ ×H/24×W/ 24的特征图Fo2。 6.根据权利要求1所述的基于注意力网络的遥感影像建筑物特征提取方法, 其特征在 于, 所述叠加模块包含了Short ‑Cut结构, 当原始特征输入本模块时, 先使用1 ×1卷积进行 通道降维处理, 之后将 两个模块的输出结果和short ‑cut结构按照1:1:1的比例在通道尺度 上串联起 来, 共同构成本模块输出。权 利 要 求 书 2/2 页 3 CN 115063685 A 3

PDF文档 专利 一种基于注意力网络的遥感影像建筑物特征提取方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于注意力网络的遥感影像建筑物特征提取方法 第 1 页 专利 一种基于注意力网络的遥感影像建筑物特征提取方法 第 2 页 专利 一种基于注意力网络的遥感影像建筑物特征提取方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:40:46上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。