说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211262188.8 (22)申请日 2022.10.14 (71)申请人 重庆长安 新能源汽车科技有限公司 地址 401133 重庆市江北区鱼嘴镇永和路 39号2屋208室 (72)发明人 常守亮 王伟 付建军 林富  (74)专利代理 机构 上海光华专利事务所(普通 合伙) 31219 专利代理师 唐勇 (51)Int.Cl. G06F 40/216(2020.01) G06F 40/284(2020.01) G06V 30/42(2022.01) G06V 10/80(2022.01) G06V 10/44(2022.01)G06F 16/31(2019.01) G06F 16/33(2019.01) G06F 16/338(2019.01) (54)发明名称 一种产品技术资料管理方法、 装置、 设备及 介质 (57)摘要 本申请涉及 文件数字化技术领域, 提供了一 种产品技术 资料管理方法、 装置、 设备及介质, 方 法包括: 获取产品技术资料; 根据产品技术资料 中的上下文轮廓, 对产品技术资料进行区域划 分, 得到多个资料区域, 并提取用于描述多个资 料区域的内容的主题词; 根据多个 资料区域中的 内容对多个资料区域进行划分, 得到多个文字子 区域和图像子区域, 并将多个文字子区域转化为 电子文本 数据, 将多个图像子区域转换为图像数 据; 根据主题词、 电子文本 数据和图像数据, 构建 关系网络。 本申请对产品技术资料进行区域划分 并对划分的区域进行主题词提取, 并通过主题词 与产品技术 资料内容的关系构建关系网络, 将产 品技术资料数字化的同时还能提高展示和检索 能力。 权利要求书2页 说明书13页 附图3页 CN 115496057 A 2022.12.20 CN 115496057 A 1.一种产品技 术资料管理方法, 其特 征在于, 所述方法包括: 获取产品技 术资料; 根据所述产品技术资料中的上下文轮廓, 对所述产品技术资料进行区域划分, 得到多 个资料区域, 并提取用于描述所述多个资料区域的内容的主题词; 根据所述多个资料区域中的内容对所述多个资料区域进行划分, 得到多个文字子区域 和多个图像子区域, 并将所述多个文字子区域转化为电子文本数据, 将所述多个图像子区 域转换为图像数据; 根据所述主题词、 电子文本数据和图像数据, 构建关系网络, 所述关系网络用于展示所 述产品技 术资料与所述主题词、 电子文本数据和图像数据之间的关系。 2.根据权利要求1所述的产品技术资料管理方法, 其特征在于, 所述产品技术资料包括 电子元件规格书, 所述电子元件规格书包括多个相互间隔的内容集中区域, 所述根据所述 产品技术资料中的上 下文轮廓, 对所述产品技 术资料进行区域划分之前, 还 包括: 将所述电子元件规格书输入至预 先构建的边 缘检测模型; 通过所述边缘检测模型分别对所述多个内容集中区域进行卷积和池化, 得到不同内容 集中区域对应的多个不同尺寸的初始轮廓; 根据所述预先训练的权重参数, 分别对每个 内容集中区域对应的多个不同尺寸的初始 轮廓进行加权融合, 得到多个内容 集中区域对应的上 下文轮廓。 3.根据权利要求1所述的产品技术资料管理方法, 其特征在于, 所述提取用于描述所述 多个资料区域的内容的主题词, 包括: 若所述资料区域中的内容为文字, 则将所述资料区域输入预先构建的主题词提取模 型; 通过所述主题词提取模型将所述文字 中的每个词映射为特征向量, 并将所述每个词的 特征向量合并, 得到多维特 征向量; 计算所述多维特征向量中每个词出现的概率, 并根据预设的主题词与 所述每个词出现 的频率之间的匹配关系, 得到所述多个资料区域的内容的主题词。 4.根据权利要求1所述的产品技术资料管理方法, 其特征在于, 所述将所述多个文字子 区域转化为电子文本数据, 将所述多个图像子区域 转换为图像数据, 包括: 对所述多个文字子区域进行文字识别, 将识别出的文字内容转换为电子文本文档, 并 对所述电子文本文档分配文档编号, 得到所述电子文本数据; 根据预设的图像尺寸, 对所述图像子区域内的图像内容进行裁 剪, 得到所述图像数据。 5.根据权利要求1所述的产品技术资料管理方法, 其特征在于, 所述根据所述主题词、 电子文本数据和图像数据, 构建 关系网络, 包括: 获取同一产品技 术资料中主题词、 电子文本数据、 图像数据之间的第一映射关系; 根据所述主题词、 电子文本数据、 图像数据和所述第 一映射关系, 构建所述同一产品技 术资料的关系网络; 若多个所述产品技术资料中的产品生产地址相同, 则通过所述产品生产地将所述多个 产品技术资料的关系网络连接 。 6.根据权利要求4所述的产品技术资料管理方法, 其特征在于, 根据所述主题词、 电子 文本数据和图像数据, 构建 关系网络之后, 还 包括:权 利 要 求 书 1/2 页 2 CN 115496057 A 2获取所述产品技 术资料中的产品型号; 对所述电子文本数据中的所有 文字进行分词, 得到多个词汇; 构建同一产品技术资料中的所述多个词汇、 产品型号、 主题词、 文档编号之间的第二映 射关系, 并对所述多个词汇、 产品型号、 主题词与所述文档编号进行存 储, 得到检索数据库。 7.根据权利要求6所述的产品技术资料管理方法, 其特征在于, 所述得到检索数据库之 后, 还包括: 获取检索关键词, 所述检索关键词包括检索主题词, 和/或检索产品型号, 和/或检索词 汇, 所述检索产品型号的检索优先级高于所述检索主题词, 所述检索主题词的检索优先级 高于所述检索词汇; 根据所述检索关键词和所述检索关键词的优先级, 对所述检索数据库中的信 息进行检 索, 得到初始检索结果, 所述初始检索结果包括产品型号, 和/或主题词, 和/或多个词汇, 和/或文档编号; 获取所述初始检索结果中产品型号的出现次数, 和/或主题词的出现次数, 和/或多个 词汇的出现次数, 和/或文档编号的出现次数; 根据所述出现次数对所述初始检索结果中的内容的展示顺序进行排序, 并根据 所述第 二映射关系得到所述初始检索结果对应的电子文本数据。 8.一种产品技 术资料管理装置, 其特 征在于, 所述装置包括: 资料获取模块, 用于获取产品技 术资料; 主题词获取模块, 用于根据所述产品技术资料中的上下文轮廓, 对所述产品技术资料 进行区域划分, 得到多个资料区域, 并提取用于描述所述多个资料区域的内容的主题词; 电子文本数据和图像数据获取模块, 用于根据所述多个资料区域中的内容对所述多个 资料区域进行划分, 得到多个文字子区域和多个图像子区域, 并将所述多个文字子区域转 化为电子文本数据, 将所述多个图像子区域 转换为图像数据; 关系网络构建模块, 用于根据所述主题词、 电子文本数据和图像数据, 构建关系网络, 所述关系网络用于展示所述产品技术资料与所述主题词、 电子文本数据和图像数据之 间的 关系。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 一个或多个处 理器; 存储装置, 用于存储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理 器执行时, 使得所述电子设备实现如权利要求1至7中任一项所述的产品技术资料管理方 法。 10.一种计算机可读存储介质, 其特征在于, 其上存储有计算机程序, 当所述计算机程 序被计算机的处理器执行时, 使计算机执行如权利要求 1至7中任一项 所述的产品技术资料 管理方法。权 利 要 求 书 2/2 页 3 CN 115496057 A 3

PDF文档 专利 一种产品技术资料管理方法、装置、设备及介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种产品技术资料管理方法、装置、设备及介质 第 1 页 专利 一种产品技术资料管理方法、装置、设备及介质 第 2 页 专利 一种产品技术资料管理方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:40:39上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。