恭喜马栏山音视频实验室甘伟豪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜马栏山音视频实验室申请的专利一种音视频口型翻译方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119274574B 。
龙图腾网通过国家知识产权局官网在2025-03-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411775219.9,技术领域涉及:G10L21/10;该发明授权一种音视频口型翻译方法、装置、设备及存储介质是由甘伟豪设计研发完成,并于2024-12-05向国家知识产权局提交的专利申请。
本一种音视频口型翻译方法、装置、设备及存储介质在说明书摘要公布了:本申请公开了一种音视频口型翻译方法、装置、设备及存储介质,涉及视频翻译领域,包括:确定各人物ID的运动轨迹以确定各人物ID对应的待翻译音频;对待翻译音频进行语音识别以获取待翻译文本及当前翻译后文本,以生成当前翻译后音频,判断当前翻译后音频的音频时长是否满足预设重译条件;若满足,则进行重译以得到新的当前翻译后文本,跳转至生成当前翻译后音频的步骤;若不满足,则基于待翻译音频对当前翻译后音频进行音频对齐以得到目标翻译后音频;合成各目标翻译后音频以得到目标音频,基于目标音频和参考帧生成各口型画面并生成目标视频,将目标视频与目标音频合并以获取翻译后音视频。本申请实现了对待翻译音视频进行口型翻译。
本发明授权一种音视频口型翻译方法、装置、设备及存储介质在权利要求书中公布了:1.一种音视频口型翻译方法,其特征在于,包括:基于原始视频文件确定各人物ID对应的运动轨迹,并利用说话人识别模型基于各所述运动轨迹确定原始音频文件中各所述人物ID对应的待翻译音频;对所述待翻译音频进行语音识别以获取待翻译文本,基于所述待翻译文本获取目标语言对应的当前翻译后文本,基于当前翻译后文本生成对应的当前翻译后音频,并判断当前翻译后音频的音频时长是否满足预设重译条件;若当前翻译后音频的音频时长满足预设重译条件,则对所述待翻译文本进行重译以得到新的当前翻译后文本,并跳转至所述基于当前翻译后文本生成对应的当前翻译后音频的步骤;若当前翻译后音频的音频时长不满足预设重译条件,则基于所述待翻译音频对当前翻译后音频进行音频对齐,以得到对齐后的目标翻译后音频;合成各所述待翻译音频对应的各所述目标翻译后音频以得到目标音频,并基于所述目标音频和所述原始视频文件中的参考帧生成所述原始视频文件中的各视频帧对应的各口型画面,基于所述口型画面生成目标视频,并将所述目标视频与所述目标音频合并以获取翻译后音视频。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人马栏山音视频实验室,其通讯地址为:410000 湖南省长沙市开福区月湖街道文创路6号马栏山创意中心B栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。