(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210548406.8
(22)申请日 2022.05.20
(65)同一申请的已公布的文献号
申请公布号 CN 114638322 A
(43)申请公布日 2022.06.17
(73)专利权人 南京大学
地址 210000 江苏省南京市栖霞区仙林大
道163号
(72)发明人 许封元 吴昊 李书城 唐华骜
(74)专利代理 机构 南京苏创专利代理事务所
(普通合伙) 32273
专利代理师 吴太平
(51)Int.Cl.
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06F 16/953(2019.01)
G06F 16/951(2019.01)
G06F 16/9035(2019.01)
G06V 10/762(2022.01)
G06V 10/82(2022.01)(56)对比文件
CN 110717534 A,2020.01.21
CN 110717534 A,2020.01.21
CN 10876 3313 A,2018.1 1.06
CN 108596 338 A,2018.09.28
CN 112131418 A,2020.12.25
CN 112613548 A,2021.04.0 6
CN 112329550 A,2021.02.0 5
CN 10783 3213 A,2018.0 3.23
CN 112200173 A,2021.01.08
CN 111914928 A,2020.1 1.10
CN 109543 693 A,2019.0 3.29
CN 111507419 A,2020.08.07
CN 110781934 A,2020.02.1 1
CN 111178387 A,2020.0 5.19
US 2021089 964 A1,2021.0 3.25
CN 110472082 A,2019.1 1.19
CN 106503047 A,2017.0 3.15 (续)
审查员 黄文琪
(54)发明名称
开放场景下基于给定描述的全自动目标检
测系统和方法
(57)摘要
本发明涉及开放场景下基于给定描述的全
自动目标检测系统和方法, 包括数据准备模块、
数据筛选模块和目标检测模块, 数据准备模块以
输入器中给定描述为关键词, 在网页上爬取相关
的图片并进行预处理, 构建图片数据集, 数据筛
选模块通过无监督的数据筛选算法对图片进行
数据筛选; 目标检测模块使用弱监督的目标检测
方法, 基于筛选后的图片数据集进行训练, 获取
给定描述目标的目标检测模型。 方法, 包括1.数
据获取, 2.数据筛选, 3.目标检测。 本发明能够基
于输入的任意给定目标物体描述, 自动化地返回所描述物体的目标检测模型; 从开放的环境中获
得数据, 并自动化地构建相应的目标检测数据
集, 训练并返回相应的目标检测模型, 用于用户
的部署和推断。
[转续页]
权利要求书2页 说明书8页 附图5页
CN 114638322 B
2022.09.13
CN 114638322 B
(56)对比文件
Zahra Nematzadeh 等.A hybrid model
for class noise detecti on using k‑means
and classifcation flteri ng algorithm s. 《SN
Applied Sciences 2020》 .2020,
姜高霞 等.近邻感知的标签噪声过滤算法.
《模式识别与人工智能》 .2020,第3 3卷(第6期),
Yunhang Shen 等.N oise-Aware Ful ly
Webly Supervised Object Detecti on. 《CVPR
2020》 .2020,
姚洁茹 等.一种基 于点标注的弱监 督目标检测方法. 《中国科 学: 信息科 学》 .2022,第52卷
(第3期),
Qingyi Tao 等.Expl oiting Web Ima ges
for Weak ly Supervised Object Detecti on.
《IEEE TRANSACTIONS ON MULTIM EDIA》 .2018,第
21卷(第5期),
Hakan Bi len 等.Weak ly Supervised De ep
Detection Networks. 《CVPR 2016》 .2016,
Sheng Guo 等.Cur riculumNet: Weak ly
Supervised Learn ing from Large-Scale Web
Images. 《arXiv》 .2018,2/2 页
2[接上页]
CN 114638322 B1.开放场景下基于给定描述的全自动目标检测方法, 其特 征在于, 包括以下步骤:
步骤1: 数据获取: 建立数据源, 根据用户给定的描述, 从数据源中获取原始的图片数
据, 并对图片数据进行 预处理, 得到目标图片数据;
步骤2: 数据筛选: 构 建弱监督的目标检测数据 集, 采用KMeans划分聚类算法, 对得到的
目标图片数据进 行筛选, 对于给定的N个样 本的目标检测数据集, 给定聚类簇的个数K, K<N,
初始化K个中心 点, 在每一轮迭代中计算数据集中所有的样本到中心 点的距离, 将 每个样本
分配到距离最近的中心 点的簇中, 然后更新每个簇中心点位置, 重复上述步骤, 直到输入的
含有噪声目标图片输出为纯 净的目标图片子集 为止;
由于搜索引擎自带的相关度算法, 在搜索结果靠前的图片数据与用户给定的描述相关
性高, 且包含的噪声比例比图片分享网站中的图片数据低, 因此, 引入搜索引擎的图片对数
据筛选部分的聚类方法进行改进, 包括以下步骤:
步骤4.1: 对于用户给定的描述, 除了在图片分享网站获取图片, 同时在各大搜索引擎
上面搜索同样描述, 并获取排在搜索结果靠前的图片;
步骤4.2: 将搜索引擎的图片以及图片分享网站 的图片经过相同的卷积神经网络进行
特征提取, 并计算它 们特征之间的距离;
步骤4.3: 根据计算得到的距离, 结合聚类的结果, 得到每张图片的用于 筛选的得分;
为增强数据筛选中图片与给定描述的相关性, 引入聚类簇的纯净程度, 而聚类簇内部
的纯净程度使用聚类簇内部样本之 间的相似度来衡量, 即一个聚类簇内部的样本之 间相似
程度越高, 则这个聚类簇相对 越纯, 包括以下步骤:
步骤5.1: 对于用户给定的描述, 对获取到的图片分享网站的图片使用聚类方法进行处理;
步骤5.2: 计算各个聚类簇内的相似度, 衡量 其聚类簇内的图片的纯 净程度;
步骤5.3: 根据相似度的结果, 计算得到一张图片最终的用于 筛选的得分;
数据筛选算法如公式 (1) ‑(6) 所示,
(1)
(2)
(3)
(4)
(5)
(6)权 利 要 求 书 1/2 页
2
CN 114638322 B
3
专利 开放场景下基于给定描述的全自动目标检测系统和方法
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:36:43上传分享