说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210997751.X (22)申请日 2022.08.19 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 梁嘉兴 郭子淳 张铭 曹彬  (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 高艳红 (51)Int.Cl. G06T 13/20(2011.01) G06T 13/40(2011.01) G06T 17/00(2006.01) G06V 40/20(2022.01) H04N 5/265(2006.01)H04N 5/278(2006.01) H04N 5/76(2006.01) (54)发明名称 视频生成方法、 装置、 设备以及存 储介质 (57)摘要 本公开提供了视频生成方法、 装置、 设备以 及存储介质, 涉及人工智 能技术领域, 尤其涉及 数字人技术、 以及视频处理技术等领域。 具体实 现方案为: 获取预设脚本信息, 其中, 预设脚本信 息中包含数字人的动作信息和台词信息, 根据动 作信息控制预设数字人展示相应的动作, 以及根 据台词信息控制预设数字人口述相应的台词, 并 在控制预设数字人的过程中进行视频录制, 以生 成数字人视频。 本公开可提高包含 数字人的视频 的制作效率, 缩短制作周期。 权利要求书3页 说明书11页 附图6页 CN 115393477 A 2022.11.25 CN 115393477 A 1.一种视频生成方法, 包括: 获取预设脚本信息, 其中, 所述预设脚本信息中包 含数字人的动作信息和台词信息; 根据所述动作信 息控制预设数字人展示相应的动作, 以及根据 所述台词信 息控制所述 预设数字人 口述相应的台词, 并在控制所述预设数字人 的过程中进行视频录制, 以生成数 字人视频。 2.根据权利要求1所述的方法, 在生成数字人视频之后, 还 包括: 利用预设视频模板, 对预设素材资源和所述数字人视频进行融合处理, 以生成目标视 频。 3.根据权利要求2所述的方法, 还 包括: 在视频录制过程中, 记录所述预设数字人口述每句台词的起始时间戳和结束时间戳, 以生成字幕文件; 其中, 所述利用预设视频模板, 对预设素材资源和所述数字人视频进行融合处理, 以生 成目标视频, 包括: 利用预设视频模板, 对预设素材资源和所述数字人视频进行融合处理, 得到无字幕视 频; 根据所述字幕文件在所述无字幕视频中添加字幕信息, 以生成目标视频。 4.根据权利要求1所述的方法, 还 包括: 在三维图像处 理引擎的运行环境中展示所述预设数字人; 其中, 所述根据所述动作信息控制预设数字人展示相应的动作, 以及根据所述台词信 息控制所述预设数字人口述相应的台词, 包括: 在所述运行环境中, 根据所述动作信息控制预设数字人展示相应的动作, 以及根据所 述台词信息控制所述预设数字人口述相应的台词。 5.根据权利要求4所述的方法, 在三维图像处理引擎的运行环境中展示所述预设数字 人之后, 还 包括: 响应于用户的物料输入操作, 确定目标物料名称; 基于预设映射关系, 确定所述目标物料名称对应的目标物料资源, 其中, 所述预设映射 关系中包括物料名称和物料资源的对应关系; 将所述目标物料资源关联至所述预设数字人 上, 并在所述 运行环境中展示关联 结果。 6.根据权利要求1所述的方法, 在所述获取 预设脚本信息之前, 还 包括: 响应于用户的录制参数设置操作, 对相应的录制参数进行设置, 其中, 所述录制参数包 括码率和/或所述预设数字人的语速 。 7.根据权利要求2所述的方法, 其中, 利用预设视频模板, 对预设素材资源和所述数字 人视频进行融合处 理, 包括: 获取预设配置信 息, 其中, 所述预设配置信 息中包括预设素材资源的插入时间和/或插 入位置; 利用预设视频模板, 按照所述插入时间和/或所述插入位置, 对预设素材资源和所述数 字人视频进行融合处 理。 8.根据权利要求2 ‑7任一所述的方法, 其中, 所述预设素材资源包括背景图、 插图和待 插入视频中的至少一项。权 利 要 求 书 1/3 页 2 CN 115393477 A 29.一种视频生成装置, 包括: 脚本信息获取模块, 用于获取预设脚本信 息, 其中, 所述预设脚本信 息中包含数字人的 动作信息和台词信息; 视频录制模块, 用于根据所述动作信息控制预设数字人展示相应的动作, 以及根据所 述台词信息控制所述预设数字人口述相应的台词, 并在 控制所述预设数字人的过程中进 行 视频录制, 以生成数字人视频。 10.根据权利要求9所述的装置, 还 包括: 视频融合模块, 用于在生成数字人视频之后, 利用预设视频模板, 对预设素材资源和所 述数字人视频进行融合处 理, 以生成目标视频。 11.根据权利要求10所述的装置, 还 包括: 字幕文件生成模块, 用于在视频录制过程中, 记录所述预设数字人口述每句台词的起 始时间戳和结束时间戳, 以生成字幕文件; 其中, 所述视频融合模块, 包括: 视频融合单元, 用于利用预设视频模板, 对预设素材资源和所述数字人视频进行融合 处理, 得到无字幕视频; 字幕添加单元, 用于根据所述字幕文件在所述无字幕视频中添加字幕信息, 以生成目 标视频。 12.根据权利要求9所述的装置, 还 包括: 数字人展示模块, 用于在三维图像处 理引擎的运行环境中展示所述预设数字人; 其中, 视频录制模块包括: 数字人控制单元, 用于在所述运行环境中, 根据所述动作信息控制预设数字人展示相 应的动作, 以及根据所述台词信息控制所述预设数字人口述相应的台词; 视频录制单元, 用于在控制所述预设数字人的过程中进行视频录制, 以生成数字人视 频。 13.根据权利要求12所述的装置, 还 包括: 物料确定模块, 用于在三维图像处理引擎的运行环境中展示所述预设数字人之后, 响 应于用户的物料输入操作, 确定目标物料名称; 物料资源确定模块, 用于基于预设映射关系, 确定所述目标物料名称对应的目标物料 资源, 其中, 所述预设映射关系中包括物料名称和物料资源的对应关系; 物料关联模块, 用于将所述目标物料资源关联至所述预设数字人上, 并在所述运行环 境中展示关联 结果。 14.根据权利要求9所述的装置, 还 包括: 录制参数设置模块, 用于在所述获取预设脚本信息之前, 响应于用户的录制参数设置 操作, 对相应的录制参数进行设置, 其中, 所述录制参数包括码率和/或所述预设数字人 的 语速。 15.根据权利要求10所述的装置, 其中, 所述视频融合模块包括: 配置信息获取单元, 用于获取预设配置信 息, 其中, 所述预设配置信 息中包括预设素材 资源的插 入时间和/或插 入位置; 素材插入单元, 用于按照所述插入时间和/或所述插入位置, 将所述预设素材资源插入权 利 要 求 书 2/3 页 3 CN 115393477 A 3

PDF文档 专利 视频生成方法、装置、设备以及存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 视频生成方法、装置、设备以及存储介质 第 1 页 专利 视频生成方法、装置、设备以及存储介质 第 2 页 专利 视频生成方法、装置、设备以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:44:10上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。