当前位置 : 首页 > 专利喜报 > 北京语言大学柯登峰获国家专利权

北京语言大学柯登峰获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉北京语言大学申请的专利一种用于语音驱动的口型生成方法及装置获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN119252275B 。

龙图腾网通过国家知识产权局官网在2025-05-13发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202411775994.4，技术领域涉及：G10L21/10；该发明授权一种用于语音驱动的口型生成方法及装置是由柯登峰;徐艳艳;周晨设计研发完成，并于2024-12-05向国家知识产权局提交的专利申请。

本一种用于语音驱动的口型生成方法及装置在说明书摘要公布了：本发明提供一种用于语音驱动的口型生成方法及装置，涉及自然语言处理技术领域。该方法包括：基于ffmpeg工具，根据原始视频数据进行图像处理，获得拼接帧图像数据以及面部特征点；根据原始音频数据，通过深度音频特征提取器进行特征提取，获得音频特征；通过音频‑视频序列特征融合器进行特征融合，获得融合特征；根据面部特征点以及融合特征，通过唇部动作生成器进行视频生成，获得合成视频数据；根据原始视频数据以及合成视频数据对唇部动作生成器优化；基于深度音频特征提取器、音频‑视频序列特征融合器和优化唇部动作生成器进行视频生成，获得目标合成视频数据。本发明一种针对于语音驱动的视频分辨率高且面部纹理细节保留充分的口型生成方法。

本发明授权一种用于语音驱动的口型生成方法及装置在权利要求书中公布了：1.一种用于语音驱动的口型生成方法，其特征在于，所述方法包括：获取包含完整人脸的原始视频数据；根据所述原始视频数据，获得原始音频数据；基于ffmpeg工具，根据所述原始视频数据进行图像处理，获得拼接帧图像数据以及面部特征点；对所述拼接帧图像数据进行二维卷积处理，获得拼接图像特征；根据所述原始音频数据，通过深度音频特征提取器进行特征提取，获得音频特征；根据所述拼接图像特征以及所述音频特征，通过音频-视频序列特征融合器进行特征融合，获得融合特征；根据所述面部特征点以及所述融合特征，通过唇部动作生成器进行视频生成，获得合成视频数据；根据所述原始视频数据以及所述合成视频数据进行计算，得到损失函数；根据所述损失函数，对所述唇部动作生成器进行反向优化，获得优化唇部动作生成器；获取目标音频数据；基于预设的参考序列视频，根据所述目标音频数据，通过所述深度音频特征提取器、所述音频-视频序列特征融合器和所述优化唇部动作生成器进行视频生成，获得目标合成视频数据。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人北京语言大学，其通讯地址为：100083 北京市海淀区学院路15号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

北京语言大学柯登峰获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务