首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

数字人的生成方法、装置和数字人的生成系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:无锡捷通数智科技有限公司

摘要:本申请提供了一种数字人的生成方法、装置和数字人的生成系统。该方法包括:获取音频数据;将音频数据输入至第一人工智能模型,得到音频数据对应的人脸图像;根据人脸图像创建多个目标图像,并基于多个目标图像生成数字人。本方案中,无需录制说话的目标对象的视频,只需要获取目标对象的音频即可,根据预先训练得到的第一人工智能模型的音频生成人脸技术,再通过图生图技术,得到数据量充足的与目标对象的真实人脸相近的多个目标图像,进而可以根据这些图像生成数字人,降低了成本的同时,还可以避免侵犯肖像权。

主权项:1.一种数字人的生成方法,其特征在于,包括:获取音频数据,其中,所述音频数据是目标对象说话过程中的语音的数据;构建第一人工智能模型,其中,所述第一人工智能模型是使用多组训练数据训练得到的,所述多组训练数据中的每一组训练数据均包括历史时间段内获取的:历史音频数据和所述历史音频数据对应的历史人脸图像;将所述音频数据输入至所述第一人工智能模型,得到所述音频数据对应的人脸图像;根据所述人脸图像创建多个目标图像,并基于多个所述目标图像生成数字人,其中,多个所述目标图像之间的相似度小于相似度阈值,任意一个所述目标图像与所述人脸图像之间的相似度小于所述相似度阈值;根据所述人脸图像创建多个目标图像,包括:获取多个目标参数,其中,所述目标参数为预先输入的人物面部形象的参数以及表情的参数;构建图像生成模型,其中,所述图像生成模型是使用多组训练数据训练得到的,所述多组训练数据中的每一组训练数据均包括历史时间段内获取的:历史目标参数、所述历史人脸图像以及多个历史目标图像,其中,各所述历史目标图像是通过所述历史目标参数对所述历史人脸图像进行调整得到的;将所述目标参数和所述人脸图像输入至所述图像生成模型,得到多个所述目标图像;基于多个所述目标图像生成数字人,包括:根据多个所述目标图像生成无声视频,其中,所述无声视频每一帧包括一个所述目标图像,所述无声视频为没有声音的视频;将所述无声视频与所述音频数据进行融合,得到融合视频,其中,所述融合视频为包括图像和声音的视频;将所述融合视频与背景视频进行融合,得到所述数字人的视频,其中,所述背景视频为包括场景类型、人物服装、人物发型的视频。

全文数据:

权利要求:

百度查询: 无锡捷通数智科技有限公司 数字人的生成方法、装置和数字人的生成系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。