【发明公布】基于深度回归网络的语音3D驱动数字人脸的方法和系统_云知声智能科技股份有限公司_202410329686.2

申请/专利权人：云知声智能科技股份有限公司

申请日：2024-03-21

公开（公告）日：2024-06-21

公开（公告）号：CN118230756A

主分类号：G10L21/10

分类号：G10L21/10;G06T13/40;G06F17/10;G06N3/0455;G06N3/08;G06F18/10;G06F18/213;G10L21/0232;G10L25/24;G10L25/30;G10L25/57;G10L25/63

优先权：

专利状态码：在审-公开

法律状态：2024.06.21#公开

摘要：基于深度回归网络的语音3D驱动数字人脸的方法和系统，该方法调用语音特征处理模块，采用预加重、分帧、加窗、傅立叶变换、梅尔频率滤波器、对数运算、离散余弦变换方式对语音信号进行处理，得到语音的梅尔倒谱特征；采用ASR的模型提取方式对语音的梅尔倒谱特征进行处理，去掉语音梅尔倒谱特征中的身份信息；调用3D人脸blendshape参数转化模块，采用基于transformer结构的网络来提取语音特征参数，把语音特征参数转换成3D人脸blendshape参数；调用人脸表情控制模块，将语音特征参数和相应的所述语音模型预测的情感特征进行合并，控制人脸表情信息，输出相应的3D人脸运动信息。本发明解决了实现困难，口型单一，鲁棒性差，人脸表情僵硬的问题。

主权项：1.基于深度回归网络的语音3D驱动数字人脸的方法，其特征在于，包括：调用语音特征处理模块，采用预加重方式对语音信号进行处理，恢复语音信号中音频的高频；采用加权窗方式对语音信号进行帧处理，采用滑动窗口方式使语音信号前后帧平滑；采用傅立叶变换方式对加窗后的语音信号进行处理，得到语音信号的频域信号；采用梅尔频率滤波器对语音信号进行滤波处理，去掉语音信号中的高频信息；对去掉高频信息的语音信号进行对数变换处理，得到语音信号的梅尔频谱倒谱；对具备梅尔特征的语音信号进行离散余弦变换处理，得到梅尔倒谱特征；采用ASR的模型提取方式对语音的梅尔倒谱特征进行处理，去掉语音梅尔倒谱特征中的身份信息；调用3D人脸blendshape参数转化模块，采用基于transformer结构的网络来提取语音特征参数，把语音特征参数转换成3D人脸blendshape参数；调用人脸表情控制模块，采用语音模型预测输入语音的情感特征，对语音数据进行自动化标记；采用所述语音模型提取语音中的情感特征；将语音特征参数和相应的所述语音模型预测的情感特征进行合并，控制人脸表情信息，输出相应的3D人脸运动信息。

全文数据：

权利要求：

百度查询：云知声智能科技股份有限公司基于深度回归网络的语音3D驱动数字人脸的方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：股骨头坏死植入支架_中国人民解放军联勤保障部队第九二〇医院_202410475083.3

下一篇：一种采棉机摘锭座管测量装置_浙江亚嘉采棉机配件有限公司_202410465107.7

相关技术

股骨头坏死植入支架_中国人民解放军联勤保障部队第九二〇医院_202410475083.3

一种采棉机摘锭座管测量装置_浙江亚嘉采棉机配件有限公司_202410465107.7

基于学生T过程的微带天线优化方法和优化系统_江苏科技大学_202111415452.2

一种车钩安装座高效焊接装置_南京海高德新技术有限公司_202311587530.6

一种柔性低密度烧蚀防热涂料及其制备方法_上海箬宇新材料有限公司_202310043235.8

一种搅拌式反应釜_江苏中特特种金属装备有限公司_202410183133.0

一种齿轮加工成型设备_兴化金马鹿机电科技有限公司_202410356685.7

一种发动机仿真模型的精度评估方法、装置以及电子设备_西安航天动力研究所_202410282665.X

一种大型铜套离心铸造方法及铸造设备_扬州市雪龙铜制品有限公司_202210381652.9

AGV磁寻迹偏移量计算方法、存储介质及AGV_广东嘉腾机器人自动化有限公司_202111406161.7

一种汽车风窗玻璃试验中AB区的投射设备_中汽研汽车检验中心(武汉)有限公司_202410456408.3

一种双层保温日光温室_山东同岚农业发展集团有限公司_202410511060.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】基于深度回归网络的语音3D驱动数字人脸的方法和系统_云知声智能科技股份有限公司_202410329686.2

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务