数字人的生成方法、装置和数字人的生成系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：无锡捷通数智科技有限公司

摘要：本申请提供了一种数字人的生成方法、装置和数字人的生成系统。该方法包括：获取音频数据；将音频数据输入至第一人工智能模型，得到音频数据对应的人脸图像；根据人脸图像创建多个目标图像，并基于多个目标图像生成数字人。本方案中，无需录制说话的目标对象的视频，只需要获取目标对象的音频即可，根据预先训练得到的第一人工智能模型的音频生成人脸技术，再通过图生图技术，得到数据量充足的与目标对象的真实人脸相近的多个目标图像，进而可以根据这些图像生成数字人，降低了成本的同时，还可以避免侵犯肖像权。

主权项：1.一种数字人的生成方法，其特征在于，包括：获取音频数据，其中，所述音频数据是目标对象说话过程中的语音的数据；构建第一人工智能模型，其中，所述第一人工智能模型是使用多组训练数据训练得到的，所述多组训练数据中的每一组训练数据均包括历史时间段内获取的：历史音频数据和所述历史音频数据对应的历史人脸图像；将所述音频数据输入至所述第一人工智能模型，得到所述音频数据对应的人脸图像；根据所述人脸图像创建多个目标图像，并基于多个所述目标图像生成数字人，其中，多个所述目标图像之间的相似度小于相似度阈值，任意一个所述目标图像与所述人脸图像之间的相似度小于所述相似度阈值；根据所述人脸图像创建多个目标图像，包括：获取多个目标参数，其中，所述目标参数为预先输入的人物面部形象的参数以及表情的参数；构建图像生成模型，其中，所述图像生成模型是使用多组训练数据训练得到的，所述多组训练数据中的每一组训练数据均包括历史时间段内获取的：历史目标参数、所述历史人脸图像以及多个历史目标图像，其中，各所述历史目标图像是通过所述历史目标参数对所述历史人脸图像进行调整得到的；将所述目标参数和所述人脸图像输入至所述图像生成模型，得到多个所述目标图像；基于多个所述目标图像生成数字人，包括：根据多个所述目标图像生成无声视频，其中，所述无声视频每一帧包括一个所述目标图像，所述无声视频为没有声音的视频；将所述无声视频与所述音频数据进行融合，得到融合视频，其中，所述融合视频为包括图像和声音的视频；将所述融合视频与背景视频进行融合，得到所述数字人的视频，其中，所述背景视频为包括场景类型、人物服装、人物发型的视频。

全文数据：

权利要求：

百度查询：无锡捷通数智科技有限公司数字人的生成方法、装置和数字人的生成系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种可溯源可监控的监狱针车分发装置及系统

下一篇：一种分层架构下的无人机网络动态任务卸载方法

相关技术

一种可溯源可监控的监狱针车分发装置及系统

一种分层架构下的无人机网络动态任务卸载方法

一种多功能磨毛机

基于场景感知的自动化编队群组引导方法

一种能自动弹出的抽屉式车载冰箱

一种基于子载波间隔压缩的非正交chirp多载波传输方法

一种双层基质与立体模式的茶树种质资源保存和快速繁育方法

一种汽车零部件冲压加工用夹具

一种可组装与分离的混合装置及其使用方法

一种高压线路电气控制机构

一种铅碳电池用改性多孔炭的制备方法及铅碳电池

一种PCF板的连接结构及其使用方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

数字人的生成方法、装置和数字人的生成系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务