(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210228594.6
(22)申请日 2022.03.10
(71)申请人 南通大学
地址 226000 江苏省南 通市啬园路9号
(72)发明人 杨赛 胡彬 周伯俊 杨慧
(74)专利代理 机构 南京瑞弘专利商标事务所
(普通合伙) 32249
专利代理师 徐激波
(51)Int.Cl.
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06V 10/764(2022.01)
G06V 10/762(2022.01)
G06V 10/774(2022.01)G06V 10/82(2022.01)
(54)发明名称
一种基于深度聚类的小样本电气设备图像
分类方法
(57)摘要
本发明公开一种基于深度聚类的小样本电
气设备图像分类方法, 该方法首先网络搜索和现
场进行实地拍摄的方式收集若干电气设备图像,
创建电气设备图像数据集; 然后将将数据集随机
分为两部分, 分别被用于分类模 型的预训练和小
样本电气分类的训练与测试; 接下来利用C均值
聚类算法图像样本的特征进行聚类, 将聚类结果
作为图像的标签值, 基于标签值与类别概率输出
值计算交叉熵损失函数, 利用梯度下降算法对深
度卷积神经网络模型中的参数进行优化; 最后利
用训练好的网络对小样本电气图像完成训练和
测试。 该方法能够在只对电气设备图像进行少量
人工标注的情况下完成对电气设备的自动分类
识别。
权利要求书2页 说明书5页 附图1页
CN 114580551 A
2022.06.03
CN 114580551 A
1.一种基于深度聚类的小样本电气设备图像分类方法, 其特 征在于, 包括如下步骤;
步骤S1:电气设备图像的收集与处理,收集电气设备图像, 第 一种途径为利用图像搜索
引擎收集若干电气设备图像; 第二种途径为到现场进行实地拍摄;
步骤S2:分类模型的构建,分类模型由主干神经网络、 线性分类器以及Softmax层三个
模块组成;
步骤S3:分类模型的预训练; 在数据集Dpretrain随机抽取一批图像, 将 其输入到分类模型
中提取特征, 经过线性分类器以及Softmax将特征转化为类别概率输出值, 利用C均值聚类
算法对这些图像样本的特征进行聚类, 将聚类结果作为图像的标签值, 基于标签值与类别
概率输出值计算交叉熵损失函数, 利用梯度下降算法对分类模型中的参数进行优化;
步骤S4:小样本电气图像的特征提取, 移除分类模型中的线性分类器以及Softmax层,
固定分类模型中的主干神经网络中的参数作为特征提取器。 在数据集DFSC中每类中随机抽
取M幅图像作为训练图像样 本, 将每类剩余样 本作为测试图像样本。 将训练图像样本和测试
图像样输入到分类模型中的主干神经网络中提取图像特 征;
步骤S5: 样本电气图像分类测试, 利用训练图像样本的分类标签, 使用K近邻算法得到
测试图像样本的类别标签。
2.根据权利要求1所述的一种基于深度聚类的小样本电气设备图像分类方法, 其特征
在于, 所述 步骤S1的具体步骤为:
S11: 首先利用图像搜索引擎收集若干电气设备图像, 由于网络中关于电气设备的图像
数量不多, 再到现场进行实地拍摄大量电气设备图像, 将网络和实地拍摄图像合并得到电
气设备图像数据集D;
S12: 将数据集D随机分为两个部分, 一部分用于后续分类模型的预训练, 被表示为
Dpretrain, 对另一部分图像的类别进行人工标注用于后续小样本电气分类的训练与测试, 该
部分数据集表示 为DFSC。
3.根据权利要求1所述的一种基于深度聚类的小样本电气设备图像分类方法, 其特征
在于, 所述 步骤S2的具体步骤为:
S21: 选择轻量级模型MoblieNet作为分类模型中的主干网络, 该网络共包含28层, 第一
层为标准卷积核层, 卷积核的大小3 ×3, 数量为32个, 其余层为深度可分离卷积层, 由一个
深度卷积和一个1 ×1卷积交替组成的, 主干网络表示 为Mθ(·), θ 为网络中的参数;
S22: 分类模型中的线性分类器和So ftmax层被分别表示为Lφ(·)和S(·), 其中
为参
数矩阵。
4.根据权利要求1所述的一种基于深度聚类的小样本电气设备图像分类方法, 其特征
在于, 所述 步骤S3的具体步骤为:
S31: 在数据集Dpretrain随机抽取一批图像, 将其输入到分类模型中的主干神经网络提取
特征, 第i幅图像表示 为xi, 其特征表示为:
zi=Mθ(xi) (1);
S32: 对上述图像样本的特征进行C均值聚类, 每个图像样本所属于的聚类类别作为该
图像样本的标签, 第i幅图像表示 为xi属于第c个聚类, 则其对应的标签值表示 为yi∈C;
S33: 线性分类 器以及Softmax 对图像特 征的类别概 率输出值的计算公式为:权 利 要 求 书 1/2 页
2
CN 114580551 A
2其中pic表示第i幅图像属于第c类别的概率值,
表示线性分类器中参数矩阵
的第c
个分量;
S34: 则类别概 率输出值与标签值之间的交叉熵损失函数计算公式为:
其中yic表示标签值的第c个分量。
5.根据权利要求1所述的一种基于深度聚类的小样本电气设备图像分类方法, 其特征
在于, 所述 步骤S4的具体步骤如下:
S41: 移除分类模型中的线性分类器以及Softmax层, 固定分类模型中的主干神经网络
中的参数作为特 征提取器;
S42: 在数据集DFSC中每类中随机抽取M幅图像作为训练图像样本, 第m幅图像表示为xm,
将每类剩余样本作为测试图像样本, 第q幅图像表示 为xq;
S43: 第m幅图像xm和第q幅图像xq的特征表示为:
zm=Mθ(xm) (4);
zq=Mθ(xq) (5)。
6.根据权利要求1所述的一种基于深度聚类的小样本电气设备图像分类方法, 其特征
在于, 所述 步骤S5的具体步骤如下:
S51: 利用训练图像样本的分类标签, 使用K近邻算法得到测试图像样本进行分类测试
的计算公式为:
其中D(zm,zq)计算zm和zq之间的距离, 从而确定测试图像样本与训练图像样本的近邻。权 利 要 求 书 2/2 页
3
CN 114580551 A
3
专利 一种基于深度聚类的小样本电气设备图像分类方法
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:32:21上传分享