说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210941958.5 (22)申请日 2022.08.08 (71)申请人 厦门聚视智创科技有限公司 地址 361000 福建省厦门市软件园三期诚 毅北大街65号501-4单元 (72)发明人 赵兴旺 宋传水 (51)Int.Cl. G06T 17/00(2006.01) G06F 16/951(2019.01) G06V 40/20(2022.01) G06T 7/194(2017.01) G06T 7/30(2017.01) (54)发明名称 一种复杂背景图像的预处 理方法 (57)摘要 本发明公开了一种复杂背景图像的预处理 方法, 通过进行符合人体构造的三维骨架建模, 并将构建的三维骨架模型的关节部位设置为可 动状态, 为可动关节的三维骨架模 型设置动作状 态设置, 并对三维骨架模型的运动状态进行视觉 学习, 构建基础的动作识别库, 同时配置爬虫程 序进行网络大数据学习来补 充细节, 随后再获取 复杂图像后, 首先以三维骨架模 型为基础模型对 复杂图像中可能的人体区域进行识别并在识别 出的区域周围扩容并采用图像分割技术对复杂 图像进行裁切, 最终完成识别和处理, 本发明的 优点在于以符合人体构造的三维骨架模型作为 基础, 并配置可动的关节部位来模拟人体动作, 经过深度学习后来实现复杂背景图像中目标的 精准识别处 理。 权利要求书1页 说明书4页 CN 115439602 A 2022.12.06 CN 115439602 A 1.一种复杂背景图像的预处 理方法, 其特 征在于: 包括以下步骤: S1、 进行符合人体构造的三维骨架建模, 并将构建的三维骨架模型的关节部位设置为 可动状态; S2、 为可动关节的三维骨架模型设置动作状态设置, 并对三维骨架模型的运动状态进 行视觉学习, 构建基础的动作识别库; S3、 为基础的动作识别库设置爬虫程序, 通过爬虫程序在公开网络上抓取包含各种人 体动作的图片, 将抓取的图片与动作识别库中的存储的学习结果进行复配来进行细节补 充; S4、 获取复杂图像后, 首先以三维骨架模型为基础模型对复杂图像中可能的人体区域 进行识别并在识别出的区域周围扩容并采用图像分割技 术对复杂图像进行裁切; S5、 对S4中裁切出的区域采用编辑模糊算法以删除冗余特征并缩减至骨架状态, 随后 删除尺寸特 征, 与动作识别库比较后标注人体 检测框信息; S6、 对人体检测框信息进行后处理后, 再对图像中未标注部分进行虚化处理获得最终 预处理结果。 2.根据权利要求1所述的一种复杂背景图像的预处理方法, 其特征在于: S6 中的后处理 流程包括以下步骤: S61、 人体检测框信息与动作识别库中的三维骨架模型进行二次匹配, 筛选匹配人体检 测框信息中骨架状态的动作状态, 匹配后完成初步检出; S62、 完成初步检出后利用非极大值抑制的方法对得到的检测框信息进行交叉框的非 极大值抑制处 理, 获取新的人体 检测框信息; S63、 对新的人体检测框信息利用放大算法恢复骨架状态外沿的细节状态并输出, 完成 后处理流程。 3.根据权利要求1所述的一种复杂背景图像的预处理方法, 其特征在于: S2中对三维骨 架模型中的各个可动状态关节部位进行角度逐帧微调, 已完成具备普适性的自主模拟学 习。 4.根据权利要求1所述的一种复杂背景图像的预处理方法, 其特征在于: S4中采用的图 像分割技 术采用以三维骨架模型匹配 基准线为基础并进行均匀 增量扩容的方式进行裁切。权 利 要 求 书 1/1 页 2 CN 115439602 A 2一种复杂背景图像的预处理 方法 技术领域 [0001]本发明涉及复杂图像识别处理领域, 具体地说, 是一种复杂背景 图像的预处理方 法。 背景技术 [0002]图像预处理是指在图像分析中, 对输入图像进行特征抽 取、 分割和匹配前所进行 的处理。 图像预 处理的主要目的是消除图像中无关的信息, 恢复有用的真实信息, 增强有关 信息的可检测性和最大限度地简化数据, 从而改进 特征抽取、 图像分割、 匹配和识别的可靠 性。 现有图像预处理技术一般包括数字化、 几何变换、 归一化、 颜色空间变换、 图像平滑、 图 像增强。 [0003]但在人流量较大的复杂场景中, 由于大量姿态不 同的人形单位的出现, 经现有的 图像预处理方式处理后的图像在后续的人体姿态检测、 情绪检测等技术的关键特征提取 时, 关键特征定位出现误差的几率较高, 从而影响到整体效率和效果。 结合现有的视频监控 系统。 [0004]为解决这一问题, 我们需要一种适用于多人复杂场景的图像预处 理方法。 发明内容 [0005]发明目的: 本发明目的在于针对现有技术的不足, 提供一种复杂背景 图像的预处 理方法。 [0006]技术方案: 本发明所述 一种复杂背景图像的预处 理方法, 包括以下步骤: [0007]S1、 进行符合人体构造的三维骨架建模, 并将构建的三维骨架模型的关节部位设 置为可动状态; [0008]S2、 为可动关节的三维骨架模型设置动作状态设置, 并对三维骨架模型的运动状 态进行视 觉学习, 构建基础的动作识别库; [0009]S3、 为基础的动作识别库设置爬虫程序, 通过爬虫程序在公开网络上抓取包含各 种人体动作的图片, 将抓取的图片与动作 识别库中的存储的学习结果进 行复配来进行细节 补充; [0010]S4、 获取复杂图像后, 首先以三维骨架模型为基础模型对复杂图像中可能的人体 区域进行识别并在识别出的区域周围扩容并采用图像分割技 术对复杂图像进行裁切; [0011]S5、 对S4中裁切出的区域采用编辑模糊 算法以删除冗余特征并缩减至骨架状态, 随后删除尺寸特 征, 与动作识别库比较后标注人体 检测框信息; [0012]S6、 对人体检测框信息进行后处理后, 再对图像中未标注部分进行虚化处理获得 最终预处 理结果。 [0013]作为优选的, S6中的后处 理流程包括以下步骤: [0014]S61、 人体检测框信息与动作识别库中的三维骨架模型进行二次匹配, 筛选匹配人 体检测框信息中骨架状态的动作状态, 匹配后完成初步检出;说 明 书 1/4 页 3 CN 115439602 A 3
专利 一种复杂背景图像的预处理方法
文档预览
中文文档
6 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共6页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-24 00:44:19
上传分享
举报
下载
原文档
(256.2 KB)
分享
友情链接
GB-T 30282-2023 信息安全技术 反垃圾邮件产品技术规范.pdf
GB-T 34658-2017 电动汽车非车载传导式充电机与电池管理系统之间的通信协议一致性测试.pdf
GB-T 43026-2023 公共安全视频监控联网信息安全测试规范.pdf
GM-T 0102-2020 密码设备应用接口符合性检测规范.pdf
GB-T 42156-2023 铸造砂型3D打印设备 通用技术规范.pdf
GB-T 31710.3-2015 休闲露营地建设与服务规范 第3部分:帐篷露营地.pdf
GB-T 18607-2017 石油天然气工业 钻井和采油设备 往复式整筒抽油泵.pdf
滨州市河道管理办法.pdf
GB-T 43411-2023 电子束选区熔化增材制造机床 通用技术条件.pdf
奇安信 天眼新一代威胁感知系统产品白皮书 2020.pdf
GB-T 36629.1-2018 信息安全技术 公民网络电子身份标识安全技术要求 第1部分:读写机具安全技术要求.pdf
企业安全运营实践研究报告 freebuf 2021版.pdf
ISO 27001 信息安全管理体系实施案例及文件集 .pdf
T-CPUMT 006—2022 工业数据安全事件应急预案编制指南.pdf
DB3305-T 247-2022 银行信贷碳排放核算通则 湖州市.pdf
DB50-T 1279-2022 民用醇基液体燃料应用技术规程 重庆市.pdf
中小企业数字化转型指南.pdf
HS-T 17-2006 海关业务基础数据元目录.pdf
GB-T 36989-2018 用超声流量计测量液态烃流量.pdf
GB-T 26119-2010 绿色制造 机械产品生命周期评价 总则.pdf
1
/
6
评价文档
赞助2.5元 点击下载(256.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。