说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210260410.4 (22)申请日 2022.03.16 (71)申请人 上海闪马智能科技有限公司 地址 201203 上海市浦东 新区博霞路6 6号 申请人 杭州闪马智擎科技有限公司 (72)发明人 彭垚 倪华健 林亦宁 (74)专利代理 机构 北京康信知识产权代理有限 责任公司 1 1240 专利代理师 赵静 (51)Int.Cl. G06F 16/215(2019.01) G06F 16/28(2019.01) G06F 16/55(2019.01) G06K 9/62(2022.01) G06V 10/762(2022.01)G06V 10/74(2022.01) (54)发明名称 目标数据 的去重方法、 装置、 存储介质及电 子装置 (57)摘要 本发明实施例提供了一种目标数据的去重 方法、 装置、 存储介质及电子装置, 其中, 该方法 包括: 获取第一数据组, 第一数据组中包括有多 个对发生目标动作的一个或多个对象进行采集 所得到的数据; 利用目标神经网络模 型提取第一 数据组中包括的各数据的特征; 对提取得到的特 征进行聚类, 得到多个聚类类别; 对多个聚类类 别内所包括的特征进行类别内的第一去重处理, 以得到多个第一聚类类别, 对多个第一聚类类别 内包括的特征进行类别间的第二去重处理, 以得 到去重后的目标数据。 通过本发明, 解决了相关 技术中存在的容易出现数据重复上报的问题, 进 而达到了提高数据上报的准确率的效果。 权利要求书2页 说明书9页 附图4页 CN 114661702 A 2022.06.24 CN 114661702 A 1.一种目标 数据的去重方法, 其特 征在于, 包括: 获取第一数据组, 其中, 所述第一数据组中包括有多个对发生目标动作的一个或多个 对象进行采集所 得到的数据; 利用目标神经网络模型提取所述第一数据组中包括的各数据的特征, 其中, 所述目标 神经网络模型是利用预先构建的数据集通过度量学习对网络模型进行训练后得到的模型, 所述数据集包括 一个或多个所述对象的数据; 对提取得到的特 征进行聚类, 得到多个聚类 类别; 对多个所述聚类类别内包括的特征进行类别内的第 一去重处理, 以得到多个第 一聚类 类别; 对多个所述第 一聚类类别内包括的特征进行类别间的第 二去重处理, 以得到去重后的 目标数据。 2.根据权利要求1所述的方法, 其特征在于, 对多个所述 聚类类别内包括的特征进行类 别内的第一去重处 理, 以得到多个第一聚类 类别包括: 针对多个所述聚类类别 中包括的任一个聚类类别, 均执行以下处理, 以得到多个所述 第一聚类 类别: 确定所述聚类 类别中包括的任两个特 征之间的第一相似度; 删除所述第一相似度超过第一阈值的两个特 征中的一个特 征。 3.根据权利要求1所述的方法, 其特征在于, 对多个所述第 一聚类类别内包括的特征进 行类别间的第二去重处 理包括: 针对多个所述第一聚类类别 中包括的任两个第一聚类类别, 均执行以下处理, 以得到 多个第二聚类 类别: 依次确定一个第一聚类类别中包括的各特征与另一个第一聚类类别中包括的各特征 之间的第二相似度; 删除所述第二相似度超过第二阈值的两个特 征中的一个特 征。 4.根据权利要求1所述的方法, 其特 征在于, 获取第一数据组包括: 获取一组待上报数据中包括的每个数据的初始特征, 并确定是否存在多个所述数据中 包含相同的所述初始特 征的情况; 在确定所述一组待上报数据中存在多个所述数据中包含相同的所述初始特征的情况 下, 对包含相同的所述初始特征 的多个所述数据进行删减处理, 直至仅留下一个满足目标 条件的数据为止, 以得到所述第一数据组。 5.根据权利要求1所述的方法, 其特征在于, 利用目标神经网络模型提取所述第 一数据 组中包括的各 数据的特 征包括: 利用所述目标神经网络模型提取所述第 一数据组中包括的各数据的特征, 以得到多个 目标特征; 对多个所述目标 特征进行归一 化处理, 以确定出 所述提取得到的特 征。 6.一种目标 数据的去重装置, 其特 征在于, 包括: 获取模块, 用于获取第一数据组, 其中, 所述第 一数据组中包括有多个对发生目标动作 的一个或多个对象进行采集所 得到的数据; 提取模块, 用于利用目标神经网络模型提取所述第一数据组中包括的各数据的特征,权 利 要 求 书 1/2 页 2 CN 114661702 A 2其中, 所述目标神经网络模型是利用预先构建的数据集通过度量学习对网络模型进行训练 后得到的模型, 所述数据集包括 一个或多个所述对象的数据; 聚类模块, 用于对提取 得到的特 征进行聚类, 得到多个聚类 类别; 第一处理模块, 用于对多个所述聚类类别内包括的特征进行类别内的第一去重处理, 以得到多个第一聚类 类别; 第二处理模块, 用于对多个所述第 一聚类类别内包括的特征进行类别间的第 二去重处 理, 以得到去重后的目标 数据。 7.根据权利要求6所述的装置, 其特 征在于, 所述第一处 理模块包括: 第一处理单元, 用于针对多个所述聚类类别 中包括的任一个聚类类别, 均执行以下处 理, 以得到多个所述第一聚类类别: 确定所述聚类类别中包括的任两个特征之间的第一相 似度; 删除所述第一相似度超过第一阈值的两个特 征中的一个特 征。 8.根据权利要求6所述的装置, 其特 征在于, 所述第二处 理模块包括: 第二处理单元, 用于针对多个所述第一聚类类别 中包括的任两个第一聚类类别, 均执 行以下处理, 以得到多个第二聚类类别: 依 次确定一个第一聚类类别中包括的各特征与另 一个第一聚类类别中包括的各特征之 间的第二相似度; 删除所述第二相似度超过第二阈值 的两个特 征中的一个特 征。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有计算机 程序, 其中, 所述计算机程序被处理器执行时实现所述权利要求1至5任一项中所述的方法 的步骤。 10.一种电子装置, 包括存储器、 处理器以及存储在所述存储器上并可在所述处理器上 运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现所述权利要求 1至 5任一项中所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114661702 A 3
专利 目标数据的去重方法、装置、存储介质及电子装置
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:37:23
上传分享
举报
下载
原文档
(584.2 KB)
分享
友情链接
GB-T 43417-2023 儿童青少年脊柱侧弯矫形器的配置.pdf
ISO 31000-2018.pdf
GB-T 4291-2017 冰晶石.pdf
T-YAIMH 002—2022 互联网诊疗电子病历基本规范.pdf
数据安全解决方案.pdf
GB-T 23997-2009 室内装饰装修用溶剂型聚氨酯木器涂料.pdf
GB-T 16945-2009 电子工业用气体 氩.pdf
GB-T 43628-2023 空气中病原微生物宏基因组测序鉴定方法.pdf
GB-T 40171-2021 磁珠法DNA提取纯化试剂盒检测通则.pdf
SN-T 0987.2-2014 出口危险货物中型散装货物包装容器检验规程 第2部分:使用鉴定.pdf
GB-T 15911-2021 工业电热设备节能监测方法.pdf
DB37-T 3160-2018 渔港安全管理规范 山东省.pdf
GB 55031-2022 民用建筑通用规范.pdf
GB-T 33009.4-2016工业自动化和控制系统网络安全集散控制系统(DCS)第4部分风险与脆弱性检测要求.pdf
中国信创产业发展白皮书.pdf
GB-T 38769-2020 金属材料 预裂纹夏比试样冲击加载断裂韧性的测定.pdf
OWASP-Top-10-for-LLMs-2023-v05.pdf
GB-T 41165-2021 海洋预报结果准确性检验评估方法.pdf
DB11-T 2049-2022 政务大数据安全技术框架 北京市.pdf
GB-T 38541-2020 信息安全技术 电子文件密码应用指南.pdf
1
/
3
16
评价文档
赞助2.5元 点击下载(584.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。