说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210277784.7 (22)申请日 2022.03.16 (71)申请人 中南民族大 学 地址 430000 湖北省武汉市洪山区民族大 道708号、 823号 申请人 武汉空天软件技 术有限公司 (72)发明人 孟博 赵俊杰 王德军 王俊  康怡琳 李娜  (74)专利代理 机构 武汉天领众智专利代理事务 所(普通合伙) 42300 专利代理师 谢非 (51)Int.Cl. G06N 20/20(2019.01) G06V 10/762(2022.01) G06K 9/62(2022.01)G06F 21/60(2013.01) (54)发明名称 一种基于聚类分析的安全横向联邦学习方 法 (57)摘要 本发明公开了一种基于聚类分析的安全横 向联邦学习方法, 属于联邦学习数据安全性技术 领域, 通过采用密文计算的方式, 让梯度值在密 文的情况加进行计算, 等计算完毕后在进行解 密, 通过聚类 分析和服务器端参数的分析对比评 分机制, 来解决横向联邦学习中存在的数据投毒 攻击和不诚实参与者问题, 这在解决这个问题的 同时, 还可以在一定程度上提升训练的准确度, 本发明方法通过同态加密的方式, 实现在服务器 上进行密态计算, 来保证服务器上计算的安全 性, 本申请的方法主要是解决数据投毒和不诚实 参与者的问题, 可以在防止数据投毒和不诚实用 户的同时, 提高训练的准确度, 并且通过同态加 密的方式保证 了梯度的安全性。 权利要求书2页 说明书6页 附图2页 CN 114611722 A 2022.06.10 CN 114611722 A 1.一种基于聚类分析的安全横向联邦学习方法, 其特 征在于, 包括以下步骤: S1、 模型下载: 首先用户从服 务器下载初始模型; S2、 模型训练: 通过初始模型对数据集进行清洗, 去除数据集中的空值, 然后再进行聚 类分析, 找出数据集中的离群点, 最后进 行模型训练得到训练后的参数, 从而 形成用户训练 模型; S3、 数据集分析: 用户的进行数据清洗后的数据集进行分析, 针对于其分布情况, 数据 集的集中趋势(众数、 中位数、 均值)、 数据的离散趋势(四分位差、 极差、 平均差、 标准差)、 数 据的形状(峰度系数、 偏度系数); S4、 参数传递: 用户把训练完的参数发送到服 务器, 且用户发送的消息包括: 离群值在数据集中的占比、 离群点数量、 数据集的大小、 模型训练后得到的参数; 数据集的集中趋势(众数、 中位数、 均 值)、 数据的离散趋势(四分位差、 极差、 平均差、 标 准差)、 数据的形状(峰度系数、 偏度系数); 模型训练后得到的参数, 需进行同态加密, 之后再进行传输; S5、 数据集的分布趋势分析: 服务器进行数据分析和训练结果的密态加权平均, 判断各 个用户的数据集的分布趋势 一致性, 把数据分布趋势相似而且评价值高于60的训练梯度值 进行计算, 对梯度的处 理, 主要保证其在 密态的情况 下, 进行加权平均计算; S6、 训练模型更新: 用户获取新的参数信息, 更新模型, 重复S2 ‑S6的步骤, 直到训练模 型达到训练轮次或者到 达到设置的阈值。 2.根据权利要求1所述的一种基于聚类分析的安全横向联邦学习方法, 其特征在于: 所 述S2的模型训练中, 首先需要进行数据清洗去除其中的空值和零值, 然后采用Kmeans聚类 算法找出 数据集中的离群点和离群簇, 模型 再拿数据进行训练, 得到梯度w i。 3.根据权利要求2所述的一种基于聚类分析的安全横向联邦学习方法, 其特征在于: 所 述S3的数据集分析中, 主 要分析数据集的参数: 集中趋势: 众 数、 中位数、 均值; 离散趋势: 四分位差、 极差、 平均差、 标准差; 数据集的形状: 峰度系数、 偏度系数。 4.根据权利要求3所述的一种基于聚类分析的安全横向联邦学习方法, 其特征在于: 所 述S4中参与者需要发送给服务器的参数, 离群值在数据集中的占比、 离群点数量、 数据集的 大小、 模型训练后得到的参数, 数据集的集中趋势(众数、 中位数、 均值)、 数据的离散趋势 (四分位差、 极差、 平均差、 标准差)、 数据集的形状(峰度系数、 偏度系数)、 加密的梯度值, 梯 度和数据量的乘积的加密值 wij。 5.根据权利要求4所述的一种基于聚类分析的安全横向联邦学习方法, 其特征在于: 所 述S5中进行数据分析和梯度 的密态加权平均, 首先对收到的所有参数的数据进行分类整 合, 按照参数 的重要性设置除了梯度外的每一个参数 的评分值, 评分规则按照各类型参数 的正太的分布范围进行打分, 只有数据评分达到60的参与者的梯度值才能参与最后的聚 合, 在梯度值确定之后, 进行梯度值的密态的加权计算, 6.根据权利要求5所述的一种基于聚类分析的安全横向联邦学习方法, 其特征在于: 所 述S6中获取到新的参数之后, 需要把Δw解密, 解密后的再除以新参数中聚合参数的数据量权 利 要 求 书 1/2 页 2 CN 114611722 A 2的和, 达到新的Δw ′, 之后进行新一轮的训练, 直到训练模 型达到训练轮次或者到达到 设置 的阈值。权 利 要 求 书 2/2 页 3 CN 114611722 A 3

.PDF文档 专利 一种基于聚类分析的安全横向联邦学习方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于聚类分析的安全横向联邦学习方法 第 1 页 专利 一种基于聚类分析的安全横向联邦学习方法 第 2 页 专利 一种基于聚类分析的安全横向联邦学习方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:32:38上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。