Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 西安工程大学朱欣娟获国家专利权

西安工程大学朱欣娟获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉西安工程大学申请的专利基于U-net注意力增强解码器的情感动画生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118505860B

龙图腾网通过国家知识产权局官网在2025-06-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410448894.4,技术领域涉及:G06T13/40;该发明授权基于U-net注意力增强解码器的情感动画生成方法是由朱欣娟;张欣茹设计研发完成,并于2024-04-15向国家知识产权局提交的专利申请。

基于U-net注意力增强解码器的情感动画生成方法在说明书摘要公布了:本发明公开基于U‑net注意力增强解码器的情感动画生成方法,具体为:步骤1:融入面部情感的人脸关键点预测;步骤2:基于U‑net注意力增强解码器的人脸关键点解码,在解码人脸关键点生成谈话头部视频阶段,将从步骤1中获得的预测人脸关键点视频帧与目标人物图像输入到基于U‑net的注意力增强解码器中,生成逼真的会说话的头部视频。该方法最终输出的目标人物既有唇部又有头部和面部情感动画的高保真的视频帧,可以提高生成视频的质量,使得输出的图像能保持更多的细节。

本发明授权基于U-net注意力增强解码器的情感动画生成方法在权利要求书中公布了:1.基于U-net注意力增强解码器的情感动画生成方法,其特征在于,具体为: 步骤1:融入面部情感的人脸关键点预测; 步骤2:基于U-net注意力增强解码器的人脸关键点解码,在解码人脸关键点生成谈话头部视频阶段,将从步骤1中获得的预测人脸关键点视频帧与目标人物图像输入到基于U-net的注意力增强解码器中,生成逼真的会说话的头部视频; 步骤2具体为: 步骤2.1构建并训练基于U-net的注意力增强解码器; 步骤2.1具体为: 步骤2.1.1、下载公开的VoxCeleb2数据集、MEAD数据集,这些数据集都拥有不同说话人的高质量头部视频和相应音频; 步骤2.1.2、将步骤2.1.1的数据集中的会说话的头部视频转换为25fps; 步骤2.1.3、通过face_alignment库提取步骤2.1.2处理后的数据集中头部视频的2D人脸关键点信息,接着用标准的面部关键点进行归一化处理,最后存储在文档中; 步骤2.1.4、通过在U-net模型上添加CBAM模块来构建基于U-net的注意力增强解码器,除U-net最后一层上采样外,U-net每层上采样之前都添加有CBAM模块; 步骤2.1.5、在步骤2.1.2处理后的数据集中任选一个视频帧,随机抓取两张不同的图像,一张作为输入目标图像,另一张作为输出目标图像;采用面部对齐的方式,通过输出目标图像预测人脸关键点的热图获得关键点信息;从步骤2.1.3存储2D人脸关键点信息的文档中提取该输出目标图像的唇部关键点信息,用来取代热图获得的关键点信息中的唇部信息,最终获得74位面部关键点信息; 步骤2.1.6、将步骤2.1.5获得的面部关键点信息和步骤2.1.5随机抓取的输入目标图像通过通道进行连接,输入到步骤2.1.4构建的基于U-net的注意力增强解码器中,最后生成高仿的目标图像,将该生成图像与步骤2.1.5随机抓取的输出目标图像进行对比损失来训练基于U-net的注意力增强解码器,使得该解码器最终生成高保真的图像; 步骤2.2将随机选择的目标人物图像与预测人脸关键点视频帧输入基于U-net的注意力增强解码器中,生成逼真的谈话头部视频。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安工程大学,其通讯地址为:710048 陕西省西安市碑林区金花南路19号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。