一种虚拟谈话数字人生成方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：南昌航空大学;江西睿创科技有限公司;联想新视界(南昌)人工智能工研院有限公司

摘要：一种虚拟谈话数字人生成方法，包括：S1，基于获取的真实录像的谈话视频，通过编码器结合语音特征分离出身份特征和脸部表情特征；S2，将脸部表情特征编码到隐变量空间中，得到谈话视频中的每一帧图像对应的表情隐变量表示；S3，在得到表情隐变量表示后，通过基于注意力机制的Transformer神经网络拟合出谈话音频对应的表情隐变量；S4，解码器基于身份特征和谈话音频对应的表情隐变量生成谈话头像视频；S5，根据谈话视频中的音频特征从全身的身体动作库选取对应的动作组；S6，对谈话头像视频和动作组进行融合，得到全身的虚拟谈话数字人。本发明能够得到形象更加逼真、更接近现实生活中人物的谈话虚拟数字人。

主权项：1.一种虚拟谈话数字人生成方法，其特征在于，包括以下步骤：S1，基于获取的真实录像的谈话视频，通过编码器结合语音特征分离出身份特征和脸部表情特征；S2，将脸部表情特征编码到隐变量空间中，得到谈话视频中的每一帧图像对应的表情隐变量表示，所述隐变量空间是一个可学习的面部表情表征字典，代表面部运动的合集；S3，在得到表情隐变量表示后，通过基于注意力机制的Transformer神经网络拟合出谈话音频对应的表情隐变量；S4，解码器基于身份特征和谈话音频对应的表情隐变量生成谈话头像视频，通过基于图像分块的对抗网络来提升图像质量；S5，根据谈话视频中的音频特征从全身的身体动作库选取对应的动作组；S6，对谈话头像视频和动作组进行融合，得到全身的虚拟谈话数字人；步骤S1具体包括：S11，将获取的真实录像的谈话视频分离出每一帧图像，将每一帧图像中的人像根据眼部位置及嘴部位置裁剪并对齐头像位置，以得到多个谈话头像图片；S12，对得到的谈话头像图片提取对应的音频信号特征，根据音频信号特征和对应身份的无表情头像图片获取表情掩码特征；S13，编码器根据获取的表情掩码特征分离谈话头像图片的身份特征和脸部表情特征；步骤S2具体包括：S21，设计一个可学习的面部表情表征字典，将获取到的脸部表情特征投影到该面部表情表征字典的线性组合空间中；S22，联合优化面部表情表征字典及其线性组合系数，使面部表情表征字典能最大程度表示脸部表情特征，从而得到谈话视频中的每一帧图像对应的表情隐变量表示，进而得到包含了所有面部表情的动作合集；步骤S3具体包括：S31，根据步骤S2获取到的每一帧图像对应的表情隐变量表示，将其聚合到谈话视频的面部表情表征字典空间中作为训练时的监督；S32，获取谈话视频中的每一帧图像的对应的音频信号特征，设计一个基于注意力机制的Transformer神经网络，其输入为每一帧和其前面所有的图像对齐的音频信号特征，输出为这一帧图像的面部表情表征字典空间的拟合结果，迭代训练该神经网络，使拟合结果与步骤S31中的结果误差达到最小；S33，将谈话视频中的谈话音频输入到循环神经网络中，获取到谈话音频的表情隐变量，在测试时，将任意一段音频输入到神经网络中，获取到该音频未在面部表情表征字典空间中的表情隐变量。

全文数据：

权利要求：

百度查询：南昌航空大学江西睿创科技有限公司联想新视界(南昌)人工智能工研院有限公司一种虚拟谈话数字人生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种具有表面清理功能的不锈钢带拉矫装置

下一篇：一种移动医疗推车

相关技术

一种具有表面清理功能的不锈钢带拉矫装置

一种移动医疗推车

一种市政道路铺砖装置

一种金属制品加工用数控刀头

含氟甲醛基的哌啶型阴离子交换膜及其制备方法

一种刹车盘保护盖

基于AI的PCB或半导体多工序生产设备组合优化方法

一种液压潜水泵

一种浅层地下水污染用治理装置

一种水力发电装置及清洁装置

一种大数据支持的交通碳排放监测方法及监测系统

一种具有抹平结构的高分子胶涂胶设备

谈话相关技术

一种非接触式留置谈话虚假音频检测方法及系统_金纪科技有限公司_202411035296.0

一种单人谈话疏导桌_李月成_202323189148.8

一种快速生成谈话数字人的方法、系统、设备及存储介质_小哆智能科技(北京)有限公司_202410571446.3

一种谈话区智能屏蔽装置_南通阿尔法机电有限公司_202323075426.7

用于自然谈话话音系统的不流畅检测模型_谷歌有限责任公司_202280073377.2

用于与计算机实现的自动助理进行人机对话会话的依赖图谈话建模_谷歌有限责任公司_202410167600.0

用于与计算机实现的自动助理进行人机对话会话的依赖图谈话建模_谷歌有限责任公司_201880093458.2

一种虚拟谈话数字人生成方法_南昌航空大学_202310602029.6

一种基于区块链的谈话管理方法和系统_福建榕基软件股份有限公司_202210704646.2

一种虚拟谈话数字人生成方法_南昌航空大学_202310602029.6

虚拟相关技术

虚拟存储系统及其控制方法_株式会社日立制作所_202111180393.5

组推荐的虚拟助理生成_谷歌有限责任公司_202110324175.8

虚拟三维场景构建方法_中国人民解放军陆军工程大学_202410753356.6

虚拟角色的切换方法、装置、设备及存储介质_腾讯科技(深圳)有限公司_202310252198.1

虚拟道具的放置方法、装置、设备及存储介质_腾讯科技(深圳)有限公司_202310246057.9

控制虚拟游戏角色的方法及装置_网易(杭州)网络有限公司_202410659048.7

一种虚拟场景交互方法和系统_深圳市星野信息技术有限公司_202410799538.7

虚拟化车载系统构建方法及装置_米塔盒子科技有限公司_202410627422.5

基于虚拟WIFI的上网实现方法和装置_山东信通电子股份有限公司_202310242106.1

基于虚拟农作物的服务系统及方法_农协生明保险株式会社_202310916515.5

方法相关技术

拼接处理方法、显示方法及装置_北京嗨动视觉科技有限公司_202410789924.8

焊接方法_华为技术有限公司_202310265226.3

刻蚀方法_中微半导体设备(上海)股份有限公司_201911358929.0

防滑刹车系统、控制方法、余压故障告警方法及处置方法_成都飞机工业(集团)有限责任公司_202410495891.6

应用风险指数生成方法、模型构建方法、检测方法及设备_武汉安天信息技术有限责任公司_202310222148.9

模具模拟方法、模具补偿设计方法以及模具加工制作方法_中信戴卡股份有限公司_202411020603.8

封装方法_立锜科技股份有限公司_202310232492.6

主动降噪系统及其失稳检测方法、控制方法、设备_宁波方太厨具有限公司_202411080503.4

参考信号的发送方法,接收方法和装置_华为技术有限公司_202310260761.X

视频解码方法、视频编码方法和装置_三星电子株式会社_202410898515.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种虚拟谈话数字人生成方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务