首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】联合音频视频面部动画系统_斯纳普公司_201880069766.1 

申请/专利权人:斯纳普公司

申请日:2018-10-26

公开(公告)日:2024-06-14

公开(公告)号:CN111279413B

主分类号:G10L21/003

分类号:G10L21/003;G10L21/055;G10L15/183

优先权:["20171026 US 62/577,548","20171229 US 15/858,992"]

专利状态码:有效-授权

法律状态:2024.06.14#授权;2020.07.07#实质审查的生效;2020.06.12#公开

摘要:本发明涉及一种联合自动音频视频驱动的面部动画系统,在一些示例实施例中,该系统包括具有强大语言模型的完整规模的最新的大型汇量连续语音识别LVCSR,用于语音识别和从词格中获得音素对齐。

主权项:1.一种方法,包括:在客户端设备处接收音频数据和视频数据,所述音频数据包括语音信号;通过以下操作来确定所述语音信号的音素序列:使用训练的声学模型、用于将所述声学模型的输出状态映射到音素的决策树、词典和预训练的N元语法模型用于生成加权有限状态转换器;将所述加权有限状态转换器的输出传送到词格;从所述词格确定在广度优先搜索中的最可能的口语单词序列;以及从所述最可能的口语单词序列和所述词格推断出最终的音素序列以及每个音素的开始时间和结束时间;基于所述视频数据确定面部界标集合的位置,所述面部界标与人脸的语义面部特征相对应;通过跟踪所述面部界标的相对位置并基于所跟踪的面部界标重建三维面部模型,以及基于所跟踪的位置确定面部表情,来基于所述面部界标集合的位置生成包括所述面部的三维3D重建的第一面部模型;基于所述音频数据中的所述音素序列生成包括所述面部的所估计面部表情的三维3D重建的第二面部模型;基于所述第一面部模型和所述第二面部模型构建复合面部模型;以及导致在所述客户端设备处显示所述复合面部模型。

全文数据:

权利要求:

百度查询: 斯纳普公司 联合音频视频面部动画系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。