说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210884364.5 (22)申请日 2022.07.25 (71)申请人 中国人民解 放军军事科学院军事科 学信息研究中心 地址 100000 北京市海淀区阜成路26号 (72)发明人 薛非 李晓松 李斐 张成鲁  刘宝琪 余翌帆  (74)专利代理 机构 湖北高韬律师事务所 42 240 专利代理师 张承接 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 10/44(2022.01)G06V 10/26(2022.01) G06T 7/73(2017.01) G06T 5/10(2006.01) (54)发明名称 一种基于多块特征滤波网络的图像分类方 法 (57)摘要 本发明提出了一种基于多块特征滤波网络 的图像分类方法, 实现了一个计算效率高的架 构, 它在具有对 数线性复杂 度的频域学习长期空 间依赖性, 本发 明的架构用三个关键操作取代了 视觉transformer中的自注意层: 分别是二维离 散傅里叶变换、 频域特征和可学习全局滤波器 之 间的元素相乘、 以及二维傅里叶反变换; 由于傅 里叶变换用于混合不同标记的信息, 和快速傅里 叶变换算法(FFT)的O(L  log L)复杂性, 全局滤 波器比自注意力和MLP更有效。 多块特征滤波网 络在效率、 泛化能力和鲁棒性方面可以成为 transformer模型和CNN的一个非常有竞争力的 替代品。 权利要求书2页 说明书7页 附图2页 CN 115240003 A 2022.10.25 CN 115240003 A 1.一种基于多块特征滤波网络的图像分类方法, 其特征在于, 所述多块特征滤波网络 的图像分类包括以下步骤: 1)图像预处理, 即对图像进行分割, 将图像划分成多个小块, 每个小块都包含了图像的 位置信息, 对每 个小块进行位置编码; 2)提取图像信 息特征, 将每个小块分别输入多个并行的多块特征滤波获得相应的特征 表示; 先对数据集中的图像进行二次分割, 将第一次分割的第i块图像块输入第i个多块特 征滤波网络中, 将输入的第i块空间特征先转换为频域的二 维离散傅里叶变换, 再频率域特 征与全局滤波器之 间的元素相乘, 然后 将特征映射回空间域的二 维傅里叶反变换, 通过FFN 和全局平均池化操作获得第i 块的图像局部特 征; 3)图像特 征融合, 将多个图像块的特 征进行融合, 得到 完整图像的特 征信息表示; 4)图像分类器训练, 在获取了图像整体特征之后, 使用了Linear层对提出到的特征进 行线性转换操作, 并用来训练分类网络, 进 而实现图像的分类。 2.根据权利要求1所述的一种基于多块特征滤波 网络的图像分类方法, 其特征在于, 所 述图像预处 理的具体流 程为: 对数据集的图像进行二次分割: 第一次分割: 将图像I先分割成N个图像块 Ii, i∈{1,. ..,N}, 即将图像进行降维处 理; 第二次分割: 将第i个图像 块Ii进行再次分割, 划分为M个更小的图像 块 提取每个位置所对应的图像块中, 让每 个多块特 征滤波学习到每 个位置中的特有信息 。 3.根据权利要求1所述的一种基于多块特征滤波 网络的图像分类方法, 其特征在于, 所 述提取图像信息特 征具体步骤为: 采用了多个并行的多块特征滤波模型来对图像进行分类任务, 提取图像块信 息特征表 示, 然后将所有的图像块特征进行融合汇成一个完整的图像特征表示, 具体为将给定的 tokens, 即 进行二维的F FT, 转换需要沿着空间维度进行, 转换为: 其中 表示的是 FFT计算, 将一个学习滤波器 乘以B来调制频谱: 其中⊙是按元素计算的乘法; 滤波器P被称为全局滤波器, P与B具有相同的维度; 使用 反FFT将频谱 转换回空间域, 并且 对tokens进行 更新: 根据B[C‑u,D‑v,:]=B*[u,v,:], 即二维实数的共轭对称, 只取B中值的一半, 但同时保 留全部信息: 其中 为实例输入的二维快速傅立叶变换; 将图像进行了二次分割, 即将图像的第一 次分割作, 使用图像块来形成输入Image  block; 第二次分割, 在第一次的基础上, 将第一步 中的每一个Image  block继续分为n个来形成新的输入Image  block, 并将其放入并行计算 的多块特 征滤波网络中; 因此 该输出可以表示 为:权 利 要 求 书 1/2 页 2 CN 115240003 A 2其中fx表示第x个输入图像的特征表示, GFn(·)为第n个并行 的多块特征滤波, 0≤n≤ N‑1, Ii表示了第 一次分割的输入的第i个图像块, 由于在GFn(·)中会对输入的图像块进行 再次分割, 所以此处公式, 并未进行展。 4.根据要求1 ‑3任一所述的一种基于多块特征滤波网络的图像分类方法, 其特征在于, 所述图像分类 器训练具体步骤为: 将提取出来的图像 特征fx输入至Linear层中, 进行分类; 当输入特征被一个Linear层接 收时, 以一个展平成一维张量的形式接收, 然后乘以权重矩阵; 这个矩阵乘法产生输出特 征; 输出的特征也就是该图像在每个类别中的概率; 选取最高的一个概率值对应的类别, 作 为该图像的分类结果。权 利 要 求 书 2/2 页 3 CN 115240003 A 3

PDF文档 专利 一种基于多块特征滤波网络的图像分类方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于多块特征滤波网络的图像分类方法 第 1 页 专利 一种基于多块特征滤波网络的图像分类方法 第 2 页 专利 一种基于多块特征滤波网络的图像分类方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:40:42上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。