专利 一种复杂背景图像的预处理方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210941958.5 (22)申请日 2022.08.08 (71)申请人厦门聚视智创科技有限公司地址 361000 福建省厦门市软件园三期诚毅北大街65号501-4单元 (72)发明人赵兴旺　宋传水　 (51)Int.Cl. G06T 17/00(2006.01) G06F 16/951(2019.01) G06V 40/20(2022.01) G06T 7/194(2017.01) G06T 7/30(2017.01) (54)发明名称一种复杂背景图像的预处理方法 (57)摘要本发明公开了一种复杂背景图像的预处理方法，通过进行符合人体构造的三维骨架建模，并将构建的三维骨架模型的关节部位设置为可动状态，为可动关节的三维骨架模型设置动作状态设置，并对三维骨架模型的运动状态进行视觉学习，构建基础的动作识别库，同时配置爬虫程序进行网络大数据学习来补充细节，随后再获取复杂图像后，首先以三维骨架模型为基础模型对复杂图像中可能的人体区域进行识别并在识别出的区域周围扩容并采用图像分割技术对复杂图像进行裁切，最终完成识别和处理，本发明的优点在于以符合人体构造的三维骨架模型作为基础，并配置可动的关节部位来模拟人体动作，经过深度学习后来实现复杂背景图像中目标的精准识别处理。权利要求书1页说明书4页 CN 115439602 A 2022.12.06 CN 115439602 A 1.一种复杂背景图像的预处理方法，其特征在于：包括以下步骤： S1、进行符合人体构造的三维骨架建模，并将构建的三维骨架模型的关节部位设置为可动状态； S2、为可动关节的三维骨架模型设置动作状态设置，并对三维骨架模型的运动状态进行视觉学习，构建基础的动作识别库； S3、为基础的动作识别库设置爬虫程序，通过爬虫程序在公开网络上抓取包含各种人体动作的图片，将抓取的图片与动作识别库中的存储的学习结果进行复配来进行细节补充； S4、获取复杂图像后，首先以三维骨架模型为基础模型对复杂图像中可能的人体区域进行识别并在识别出的区域周围扩容并采用图像分割技术对复杂图像进行裁切； S5、对S4中裁切出的区域采用编辑模糊算法以删除冗余特征并缩减至骨架状态，随后删除尺寸特征，与动作识别库比较后标注人体检测框信息； S6、对人体检测框信息进行后处理后，再对图像中未标注部分进行虚化处理获得最终预处理结果。 2.根据权利要求1所述的一种复杂背景图像的预处理方法，其特征在于： S6 中的后处理流程包括以下步骤： S61、人体检测框信息与动作识别库中的三维骨架模型进行二次匹配，筛选匹配人体检测框信息中骨架状态的动作状态，匹配后完成初步检出； S62、完成初步检出后利用非极大值抑制的方法对得到的检测框信息进行交叉框的非极大值抑制处理，获取新的人体检测框信息； S63、对新的人体检测框信息利用放大算法恢复骨架状态外沿的细节状态并输出，完成后处理流程。 3.根据权利要求1所述的一种复杂背景图像的预处理方法，其特征在于： S2中对三维骨架模型中的各个可动状态关节部位进行角度逐帧微调，已完成具备普适性的自主模拟学习。 4.根据权利要求1所述的一种复杂背景图像的预处理方法，其特征在于： S4中采用的图像分割技术采用以三维骨架模型匹配基准线为基础并进行均匀增量扩容的方式进行裁切。权　利　要　求　书 1/1 页 2 CN 115439602 A 2一种复杂背景图像的预处理方法技术领域 [0001]本发明涉及复杂图像识别处理领域，具体地说，是一种复杂背景图像的预处理方法。背景技术 [0002]图像预处理是指在图像分析中，对输入图像进行特征抽取、分割和匹配前所进行的处理。图像预处理的主要目的是消除图像中无关的信息，恢复有用的真实信息，增强有关信息的可检测性和最大限度地简化数据，从而改进特征抽取、图像分割、匹配和识别的可靠性。现有图像预处理技术一般包括数字化、几何变换、归一化、颜色空间变换、图像平滑、图像增强。 [0003]但在人流量较大的复杂场景中，由于大量姿态不同的人形单位的出现，经现有的图像预处理方式处理后的图像在后续的人体姿态检测、情绪检测等技术的关键特征提取时，关键特征定位出现误差的几率较高，从而影响到整体效率和效果。结合现有的视频监控系统。 [0004]为解决这一问题，我们需要一种适用于多人复杂场景的图像预处理方法。发明内容 [0005]发明目的：本发明目的在于针对现有技术的不足，提供一种复杂背景图像的预处理方法。 [0006]技术方案：本发明所述一种复杂背景图像的预处理方法，包括以下步骤： [0007]S1、进行符合人体构造的三维骨架建模，并将构建的三维骨架模型的关节部位设置为可动状态； [0008]S2、为可动关节的三维骨架模型设置动作状态设置，并对三维骨架模型的运动状态进行视觉学习，构建基础的动作识别库； [0009]S3、为基础的动作识别库设置爬虫程序，通过爬虫程序在公开网络上抓取包含各种人体动作的图片，将抓取的图片与动作识别库中的存储的学习结果进行复配来进行细节补充； [0010]S4、获取复杂图像后，首先以三维骨架模型为基础模型对复杂图像中可能的人体区域进行识别并在识别出的区域周围扩容并采用图像分割技术对复杂图像进行裁切； [0011]S5、对S4中裁切出的区域采用编辑模糊算法以删除冗余特征并缩减至骨架状态，随后删除尺寸特征，与动作识别库比较后标注人体检测框信息； [0012]S6、对人体检测框信息进行后处理后，再对图像中未标注部分进行虚化处理获得最终预处理结果。 [0013]作为优选的， S6中的后处理流程包括以下步骤： [0014]S61、人体检测框信息与动作识别库中的三维骨架模型进行二次匹配，筛选匹配人体检测框信息中骨架状态的动作状态，匹配后完成初步检出；说　明　书 1/4 页 3 CN 115439602 A 3

专利 一种复杂背景图像的预处理方法

专利一种复杂背景图像的预处理方法