爱汇葆力(广州)数据科技有限公司刘瑾获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉爱汇葆力(广州)数据科技有限公司申请的专利一种高保真度实时渲染的视频合成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118803172B 。
龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410905178.4,技术领域涉及:H04N5/265;该发明授权一种高保真度实时渲染的视频合成方法及系统是由刘瑾;刘泓毅;舒一展;韦懿伦设计研发完成,并于2024-07-08向国家知识产权局提交的专利申请。
本一种高保真度实时渲染的视频合成方法及系统在说明书摘要公布了:本发明公开了一种高保真度实时渲染的视频合成方法及系统,涉及视频合成技术领域,本发明的方法通过精确的音频处理和头部、躯干特征的精确提供,实现了音频与视频的高度同步,利用先进的NeRF技术,合成的人物动作逼真,包括唇部动作、面部表情和全身动作,通过音色提取、转换、嵌入和合成等步骤,本发明能够复制特定说话者的音色特征,提供个性化的语音输出,本发明的方法具备实时渲染能力,适合于需要快速响应的应用场景,如直播、视频会议等,同时支持高分辨率视频流的生成,提供了清晰的图像细节。
本发明授权一种高保真度实时渲染的视频合成方法及系统在权利要求书中公布了:1.一种高保真度实时渲染的视频合成方法,其特征在于,包括如下步骤:D1:采集视频素材;D2:对采集的视频素材进行预处理;D3:将视频素材中的音频分离出来,并进行降噪和增强处理;D4:对视频素材的视频流进行关键帧的提取;D5:通过机器学习算法分析唇部动作与语音之间的关联,训练出模拟人物头部特征的模型;D6:获取训练出的头部特征以及关键帧,使用计算机视觉技术提取人物的躯干关键点,训练出感知并模拟人物躯干动作的模型;D7:采集待合成的音频信号;D8:对待合成的音频信号进行预处理;D9:获取训练得到的头部特征信息,并传输至推理渲染器;D10:获取训练得到的躯干感知特征信息,并传输至推理渲染器;D11:根据待合成的音频信号、头部特征信息和躯干感知特征信息,使用先进的神经辐射场技术进行实时渲染;对视频素材的视频流进行关键帧的提取,具体为:将视频流转换成多个视频影像帧,将所有视频影像帧按照时间顺序依次排序,将排序后相邻的两个视频影像帧打包为对比影像帧组,获取对比影像帧组的动作状态变值,设置动作状态高变值与动作状态低变值;当动作状态变值大于等于动作状态高变值时,将该对比影像帧组的状态标记为高波动状态;当动作状态变值小于等于动作状态低变值时,将该对比影像帧组的状态标记为稳定状态;当动作状态变值介于动作状态高变值与动作状态低变值之间时,将该对比影像帧组的状态标记低波动状态;获取视频流的关键帧提取值,设置关键帧提取阈值,当关键帧提取值大于等于关键帧提取阈值时,将所有视频影像帧标记为关键帧,当关键帧提取值小于关键帧提取阈值时,从视频影像帧中抽取设定比例的视频影像帧标记为关键帧;视频流的关键帧提取值通过下述方式获取得到:获取高波动状态的对比影像帧组的总数量并标记为TWS,将所有对比影像帧组按照时间先后顺序进行排序,当排序后相邻两个对比影像帧组的状态不同时,不做相应处理,当排序后相邻两个对比影像帧组的状态相同时,将连续稳定次数增加一次,将连续稳定次数进行求和处理,得到连续稳定总次数并标记为RKM,利用公式得到该视频流的关键帧提取值GPY,其中,a1为高波动状态总数量系数,a2为连续稳定总次数系数;对比影像帧组的动作状态变值通过下述方式获取得到:将对比影像帧组作为动作状态分析模型的输入数据,输出得到动作状态变值;动作状态分析模型通过下述方式获取得到:获取多个对比影像帧组,将对比影像帧组作为神经网络模型的训练数据,对训练数据赋予动作状态变值,动作状态变值的取值范围为[0~10),将训练数据按照设定比例划分成训练集和验证集,对训练集和验证集进行神经网络迭代训练,训练完成后得到动作状态分析模型,动作状态变值的数值越大,表示该人物主体在两个视频影像帧中的头部状态、躯干状态变化越大,动作状态变值的数值越小,表示该人物主体在两个视频影像帧中的头部状态、躯干状态变化越小。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人爱汇葆力(广州)数据科技有限公司,其通讯地址为:510000 广东省广州市黄埔区开源大道11号B8栋201室之261室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。