说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210277784.7 (22)申请日 2022.03.16 (71)申请人 中南民族大 学 地址 430000 湖北省武汉市洪山区民族大 道708号、 823号 申请人 武汉空天软件技 术有限公司 (72)发明人 孟博 赵俊杰 王德军 王俊 康怡琳 李娜 (74)专利代理 机构 武汉天领众智专利代理事务 所(普通合伙) 42300 专利代理师 谢非 (51)Int.Cl. G06N 20/20(2019.01) G06V 10/762(2022.01) G06K 9/62(2022.01)G06F 21/60(2013.01) (54)发明名称 一种基于聚类分析的安全横向联邦学习方 法 (57)摘要 本发明公开了一种基于聚类分析的安全横 向联邦学习方法, 属于联邦学习数据安全性技术 领域, 通过采用密文计算的方式, 让梯度值在密 文的情况加进行计算, 等计算完毕后在进行解 密, 通过聚类 分析和服务器端参数的分析对比评 分机制, 来解决横向联邦学习中存在的数据投毒 攻击和不诚实参与者问题, 这在解决这个问题的 同时, 还可以在一定程度上提升训练的准确度, 本发明方法通过同态加密的方式, 实现在服务器 上进行密态计算, 来保证服务器上计算的安全 性, 本申请的方法主要是解决数据投毒和不诚实 参与者的问题, 可以在防止数据投毒和不诚实用 户的同时, 提高训练的准确度, 并且通过同态加 密的方式保证 了梯度的安全性。 权利要求书2页 说明书6页 附图2页 CN 114611722 A 2022.06.10 CN 114611722 A 1.一种基于聚类分析的安全横向联邦学习方法, 其特 征在于, 包括以下步骤: S1、 模型下载: 首先用户从服 务器下载初始模型; S2、 模型训练: 通过初始模型对数据集进行清洗, 去除数据集中的空值, 然后再进行聚 类分析, 找出数据集中的离群点, 最后进 行模型训练得到训练后的参数, 从而 形成用户训练 模型; S3、 数据集分析: 用户的进行数据清洗后的数据集进行分析, 针对于其分布情况, 数据 集的集中趋势(众数、 中位数、 均值)、 数据的离散趋势(四分位差、 极差、 平均差、 标准差)、 数 据的形状(峰度系数、 偏度系数); S4、 参数传递: 用户把训练完的参数发送到服 务器, 且用户发送的消息包括: 离群值在数据集中的占比、 离群点数量、 数据集的大小、 模型训练后得到的参数; 数据集的集中趋势(众数、 中位数、 均 值)、 数据的离散趋势(四分位差、 极差、 平均差、 标 准差)、 数据的形状(峰度系数、 偏度系数); 模型训练后得到的参数, 需进行同态加密, 之后再进行传输; S5、 数据集的分布趋势分析: 服务器进行数据分析和训练结果的密态加权平均, 判断各 个用户的数据集的分布趋势 一致性, 把数据分布趋势相似而且评价值高于60的训练梯度值 进行计算, 对梯度的处 理, 主要保证其在 密态的情况 下, 进行加权平均计算; S6、 训练模型更新: 用户获取新的参数信息, 更新模型, 重复S2 ‑S6的步骤, 直到训练模 型达到训练轮次或者到 达到设置的阈值。 2.根据权利要求1所述的一种基于聚类分析的安全横向联邦学习方法, 其特征在于: 所 述S2的模型训练中, 首先需要进行数据清洗去除其中的空值和零值, 然后采用Kmeans聚类 算法找出 数据集中的离群点和离群簇, 模型 再拿数据进行训练, 得到梯度w i。 3.根据权利要求2所述的一种基于聚类分析的安全横向联邦学习方法, 其特征在于: 所 述S3的数据集分析中, 主 要分析数据集的参数: 集中趋势: 众 数、 中位数、 均值; 离散趋势: 四分位差、 极差、 平均差、 标准差; 数据集的形状: 峰度系数、 偏度系数。 4.根据权利要求3所述的一种基于聚类分析的安全横向联邦学习方法, 其特征在于: 所 述S4中参与者需要发送给服务器的参数, 离群值在数据集中的占比、 离群点数量、 数据集的 大小、 模型训练后得到的参数, 数据集的集中趋势(众数、 中位数、 均值)、 数据的离散趋势 (四分位差、 极差、 平均差、 标准差)、 数据集的形状(峰度系数、 偏度系数)、 加密的梯度值, 梯 度和数据量的乘积的加密值 wij。 5.根据权利要求4所述的一种基于聚类分析的安全横向联邦学习方法, 其特征在于: 所 述S5中进行数据分析和梯度 的密态加权平均, 首先对收到的所有参数的数据进行分类整 合, 按照参数 的重要性设置除了梯度外的每一个参数 的评分值, 评分规则按照各类型参数 的正太的分布范围进行打分, 只有数据评分达到60的参与者的梯度值才能参与最后的聚 合, 在梯度值确定之后, 进行梯度值的密态的加权计算, 6.根据权利要求5所述的一种基于聚类分析的安全横向联邦学习方法, 其特征在于: 所 述S6中获取到新的参数之后, 需要把Δw解密, 解密后的再除以新参数中聚合参数的数据量权 利 要 求 书 1/2 页 2 CN 114611722 A 2的和, 达到新的Δw ′, 之后进行新一轮的训练, 直到训练模 型达到训练轮次或者到达到 设置 的阈值。权 利 要 求 书 2/2 页 3 CN 114611722 A 3
专利 一种基于聚类分析的安全横向联邦学习方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:32:38
上传分享
举报
下载
原文档
(503.0 KB)
分享
友情链接
奇安信 中国数字城市网络安全运营现状分析报告 2022.pdf
GB-T 38318-2019 电力监控系统网络安全评估指南.pdf
GM-T 0115-2021 信息系统密码应用测评要求.pdf
GB-T 30285-2013 信息安全技术 灾难恢复中心建设与运维管理规范.pdf
SY-T 7657.1-2021 天然气 利用光声光谱-红外光谱-燃料电池联合法测定组成 第1部分:总则.pdf
GB-T 35278-2017 信息安全技术 移动终端安全保护技术要求.pdf
DB13-T 5387-2021 水库库容曲线修测及特征值复核 修正技术导则 河北省.pdf
DB11T 1998-2022 既有公共建筑节能绿色化改造技术规程.pdf
GB-T 37759-2019 节水型企业 现代煤化工行业.pdf
DB11-T 1652-2019 空气源热泵节能监测 北京市.pdf
数据安全评估师ccrc-dsa.pdf
GB-T 5838.3-2015 荧光粉 第3部分:性能试验方法.pdf
GB-T 30307-2023 家用和类似用途饮用水处理装置.pdf
GB-T 20794-2021 海洋及相关产业分类.pdf
DB42-T 875-2019 湖北省城镇地下管线探测技术规程 湖北省.pdf
商用密码管理条例.pdf
GB-T 42589-2023 信息安全技术 电子凭据服务安全规范.pdf
GB-T 17145-1997 废润滑油回收与再生利用技术导则.pdf
信息安全风险评估表格.docx
GB-T 43694-2024网络安全技术 证书应用综合服务接口规范.pdf
1
/
3
11
评价文档
赞助2.5元 点击下载(503.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。