专利 生成样本图像的方法、装置、设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210554527.3 (22)申请日 2022.05.19 (71)申请人腾讯科技（深圳）有限公司地址 518057 广东省深圳市南山区高新区科技中一路腾讯大厦3 5层 (72)发明人康战辉　 (74)专利代理机构北京三高永信知识产权代理有限责任公司 1 1138 专利代理师祝亚男 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/762(2022.01) G06V 30/414(2022.01) G06V 10/82(2022.01)G06V 20/40(2022.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称生成样本图像的方法、装置、设备 (57)摘要本申请公开了一种生成样本图像的方法、装置、设备，属于图像识别技术领域，可以应用在对视频进行物品识别的应用场景中。所述方法包括：获取包含长尾物品的目标图像；对所述目标图像进行物品识别，得到对所述目标图像中进行物品识别的识别框；基于所述识别框的个数，确定长尾物品在所述目标图像中的显示区域；对所述目标图像中在所述显示区域内的局部图像进行图像处理，得到多个进行图像处理后的目标图像，将所述多个进行图像处理后的目标图像确定为对第一图像识别模型进行训练的样本图像。本申请通过能够增加包括长尾物品的样本图像的数量。权利要求书2页说明书18页附图10页 CN 115131602 A 2022.09.30 CN 115131602 A 1.一种生成样本图像的方法，其特征在于，所述方法包括：获取包含长尾物品的目标图像；对所述目标图像进行物品识别，得到对所述目标图像中进行物品识别的识别框；基于所述识别框的个数，确定长尾物品在所述目标图像中的显示区域；对所述目标图像中在所述显示区域内的局部图像进行图像处理，得到多个进行图像处理后的目标图像，将所述多个进行图像处理后的目标图像确定为对第一图像识别模型进行训练的样本图像。 2.根据权利要求1所述的方法，其特征在于，所述获取包含长尾物品的目标图像，包括：获取包含长尾物品的样本视频；在所述样本视频中获取多个视频帧，其中，所述多个视频帧中的任意两个视频帧的相似度小于相似度阈值；将所述多个视频帧确定为目标图像。 3.根据权利要求1所述的方法，其特征在于，所述对所述目标图像进行物品识别，得到对所述目标图像中进行物品识别的识别框，包括：将所述目标图像输入至所述第二图像识别模型，由所述第二图像识别模型输出所述识别框和对应识别结果，其中，所述第二图像识别模型为经过包含长尾物品的第二图像训练后的图像识别模型，所述识别结果为所述目标图像中包括的长尾物品的物品类别以及对应的置信度。 4.根据权利要求3所述的方法，其特征在于，所述方法还包括：如果所述第二图像识别模型输出的识别框为多个，则确定多个识别框中尺寸最大的目标识别框；将所述目标识别框对应的目标物品类别，确定为所述目标图像中包括的长尾物品对应的物品类别。 5.根据权利要求3所述的方法，其特征在于，所述将所述多个进行图像处理后的目标图像确定为对第一图像识别模型进行训练的样本图像，包括：获取所述第二图像识别模型输出的所述目标图像对应的物品类别的目标置信度，将所述目标置信度设置为由所述目标图像得到的各样本图像对应的训练标签值。 6.根据权利要求1 ‑5任一项所述的方法，其特征在于，所述基于所述识别框的个数，确定长尾物品在所述目标图像中的显示区域，包括：如果所述识别框为一个，则对所述识别框按照预设放大系数进行放大处理，得到放大处理后的识别框，将所述放大处理后的识别框对应的区域确定为长尾物品在所述目标图像中的显示区域；如果所述识别框为多个，则确定多个识别框对应的最小外接矩形，将所述最小外接矩形对应的区域确定为长尾物品在所述目标图像中的显示区域。 7.根据权利要求1 ‑5任一项所述的方法，其特征在于，所述基于所述识别框的个数，确定长尾物品在所述目标图像中的显示区域，包括：如果所述识别框的个数为多个，且在多个识别框中存在对应同一目标识别结果的多个第一识别框，则将所述多个第一识别框组成第一识别框集合；在所述第一识别框集合中，确定对应置信度最大的第二识别框，将所述第二识别框添权　利　要　求　书 1/2 页 2 CN 115131602 A 2加至第二识别框集合中，在所述第一识别框集合中删除所述第二识别框，并在所述第一识别框集合中确定与所述第二识别框的交并比超出交并比阈值的第三识别框，降低所述第三识别框的置信度；确定所述第一识别框集合中是否存在对应置信度大于置信度阈值的第四识别框；如果存在所述第四识别框，则转至执行所述在所述第一识别框集合中，确定对应置信度最大的第二识别框；如果不存在所述第四识别框，则根据所述第二识别框集合中包括的识别框，确定所述目标识别结果对应的长尾物品在所述目标图像中的显示区域。 8.根据权利要求7所述的方法，其特征在于，所述根据所述第二识别框集合中包括的识别框，确定所述目标识别结果对应的长尾物品在所述目标图像中的显示区域，包括：确定所述第二识别框集合中每个识别框对应的置信度、面积以及与所述目标图像中心点的距离值；对所述每个识别框对应的置信度、面积以及距离值进行加权求和，得到每个识别框对应的排序指示值；将对应排序指示值最高的指定数目个识别框对应的区域，确定为所述目标识别结果对应的长尾物品在所述目标图像中的显示区域。 9.一种生成样本图像的装置，其特征在于，所述装置包括：获取模块，用于获取包含长尾物品的目标图像；识别模块，用于对所述目标图像进行物品识别，得到对所述目标图像中进行物品识别的识别框；确定模块，用于基于所述识别框的个数，确定长尾物品在所述目标图像中的显示区域；处理模块，用于对所述目标图像中在所述显示区域内的局部图像进行图像处理，得到多个进行图像处理后的目标图像，将所述多个进行图像处理后的目标图像确定为对第一图像识别模型进行训练的样本图像。 10.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现如权利要求1 至权利要求8任一项所述的生成样本图像的方法所执行的操作。权　利　要　求　书 2/2 页 3 CN 115131602 A 3

专利 生成样本图像的方法、装置、设备

专利生成样本图像的方法、装置、设备