说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210554527.3 (22)申请日 2022.05.19 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 康战辉  (74)专利代理 机构 北京三高永信知识产权代理 有限责任公司 1 1138 专利代理师 祝亚男 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/762(2022.01) G06V 30/414(2022.01) G06V 10/82(2022.01)G06V 20/40(2022.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 生成样本图像的方法、 装置、 设备 (57)摘要 本申请公开了一种生成样 本图像的方法、 装 置、 设备, 属于图像识别技术领域, 可以应用在对 视频进行物品识别的应用场景中。 所述方法包 括: 获取包含长尾物品的目标图像; 对所述目标 图像进行物品识别, 得到对所述目标图像中进行 物品识别的识别框; 基于所述识别框的个数, 确 定长尾物品在所述目标图像中的显示区域; 对所 述目标图像中在所述显示区域内的局部图像进 行图像处理, 得到多个进行图像处理后的目标图 像, 将所述多个进行图像处理后的目标图像确定 为对第一图像识别模型进行训练的样本图像。 本 申请通过能够增加包括长尾物品的样本图像的 数量。 权利要求书2页 说明书18页 附图10页 CN 115131602 A 2022.09.30 CN 115131602 A 1.一种生成样本图像的方法, 其特 征在于, 所述方法包括: 获取包含长尾物品的目标图像; 对所述目标图像进行物品识别, 得到对所述目标图像中进行物品识别的识别框; 基于所述识别框的个数, 确定 长尾物品在所述目标图像中的显示区域; 对所述目标图像中在所述显示 区域内的局部图像进行图像处理, 得到多个进行图像处 理后的目标图像, 将所述多个进 行图像处理后的目标图像确定为对第一图像识别模型进 行 训练的样本图像。 2.根据权利要求1所述的方法, 其特 征在于, 所述获取包 含长尾物品的目标图像, 包括: 获取包含长尾物品的样本 视频; 在所述样本视频中获取多个视频帧, 其中, 所述多个视频帧中的任意两个视频帧的相 似度小于相似度阈值; 将所述多个视频帧确定为目标图像。 3.根据权利要求1所述的方法, 其特征在于, 所述对所述目标图像进行物品识别, 得到 对所述目标图像中进行物品识别的识别框, 包括: 将所述目标图像输入至所述第 二图像识别模型, 由所述第 二图像识别模型输出所述识 别框和对应识别结果, 其中, 所述第二图像识别模型为经过包含长尾物品的第二图像训练 后的图像识别模型, 所述识别结果为所述目标图像中包括的长尾物品的物品类别以及 对应 的置信度。 4.根据权利要求3所述的方法, 其特 征在于, 所述方法还 包括: 如果所述第 二图像识别模型输出的识别框为多个, 则确定多个识别框中尺寸最大的目 标识别框; 将所述目标识别框对应的目标物品类别, 确定为所述目标图像中包括的长尾物品对应 的物品类别。 5.根据权利要求3所述的方法, 其特征在于, 所述将所述多个进行图像处理后的目标图 像确定为对第一图像识别模型进行训练的样本图像, 包括: 获取所述第 二图像识别模型输出的所述目标图像对应的物品类别的目标置信度, 将所 述目标置信度设置为由所述目标图像得到的各样本图像对应的训练标签值。 6.根据权利要求1 ‑5任一项所述的方法, 其特征在于, 所述基于所述识别框的个数, 确 定长尾物品在所述目标图像中的显示区域, 包括: 如果所述识别框为一个, 则对所述识别框按照预设放大系数进行放大处理, 得到放大 处理后的识别框, 将所述放大 处理后的识别框对应的区域确定为长尾物品在所述目标图像 中的显示区域; 如果所述识别框为多个, 则确定多个识别框对应的最小外接矩形, 将所述最小外接矩 形对应的区域确定为长尾物品在所述目标图像中的显示区域。 7.根据权利要求1 ‑5任一项所述的方法, 其特征在于, 所述基于所述识别框的个数, 确 定长尾物品在所述目标图像中的显示区域, 包括: 如果所述识别 框的个数为多个, 且在多个识别框中存在对应同一目标识别结果的多个 第一识别框, 则将所述多个第一识别框组成第一识别框集 合; 在所述第一识别框集合中, 确定对应置信度最大的第二识别框, 将所述第二识别框添权 利 要 求 书 1/2 页 2 CN 115131602 A 2加至第二识别框集合中, 在所述第一识别框集合中删除所述第二识别框, 并在所述第一识 别框集合中确定与所述第二识别框的交并比超出 交并比阈值的第三识别框, 降低所述第三 识别框的置信度; 确定所述第一识别框集 合中是否存在对应置信度大于 置信度阈值的第四识别框; 如果存在所述第四识别框, 则转至执行所述在所述第一识别框集合中, 确定对应置信 度最大的第二识别框; 如果不存在所述第四识别框, 则根据所述第二识别框集合中包括的识别框, 确定所述 目标识别结果对应的长尾物品在所述目标图像中的显示区域。 8.根据权利要求7所述的方法, 其特征在于, 所述根据所述第 二识别框集合中包括的识 别框, 确定所述目标识别结果对应的长尾物品在所述目标图像中的显示区域, 包括: 确定所述第 二识别框集合中每个识别框对应的置信度、 面积以及与 所述目标图像 中心 点的距离值; 对所述每个识别框对应的置信度、 面积以及距离值进行加权求和, 得到每个识别框对 应的排序指示 值; 将对应排序指示值最高的指定数目个识别 框对应的区域, 确定为所述目标识别结果对 应的长尾物品在所述目标图像中的显示区域。 9.一种生成样本图像的装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取包 含长尾物品的目标图像; 识别模块, 用于对所述目标图像进行物品识别, 得到对所述目标图像中进行物品识别 的识别框; 确定模块, 用于基于所述识别框的个数, 确定 长尾物品在所述目标图像中的显示区域; 处理模块, 用于对所述目标图像中在所述显示区域内的局部 图像进行图像处理, 得到 多个进行图像处理后的目标图像, 将所述多个进 行图像处理后的目标图像确定为对第一图 像识别模型进行训练的样本图像。 10.一种计算机设备, 其特征在于, 所述计算机设备包括处理器和存储器, 所述存储器 中存储有至少一条指令, 所述至少一条指令由所述处理器加载并执行以实现如权利要求1 至权利要求8任一项所述的生成样本图像的方法所 执行的操作。权 利 要 求 书 2/2 页 3 CN 115131602 A 3

.PDF文档 专利 生成样本图像的方法、装置、设备

文档预览
中文文档 31 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 生成样本图像的方法、装置、设备 第 1 页 专利 生成样本图像的方法、装置、设备 第 2 页 专利 生成样本图像的方法、装置、设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:37:16上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。