基于AI模型的人脸风格化处理方法、装置及计算机设备

导航：龙图腾网> 最新专利技术> 基于AI模型的人脸风格化处理方法、装置及计算机设备

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：北京汇畅数宇科技发展有限公司

摘要：本发明涉及图像处理技术领域，具体涉及基于AI模型的人脸风格化处理方法、装置及计算机设备，包括以下步骤：根据第一人脸图像和一组目标风格，通过第二AI模型在第二人脸视频中的每个视频帧时序处进行权重确定，得到每个视频帧时序处的风格权重；根据一组目标风格和每个视频帧时序处的风格权重，通过第一AI模型对第一人脸图像在第二人脸视频中的各个视频帧时序处进行风格化处理，得到第三人脸视频。本发明提出利用风格权重对各个目标风格进行组合，将动态视频中不同时序处的人像风格进行融合，生成具有多重风格元素的人脸图像，实现静态图像的动态化风格处理，而且构建第二AI模型自适应地确定每个风格的权重，从而实现不同风格之间的平衡和融合。

主权项：1.一种基于AI模型的人脸风格化处理方法，其特征在于：包括以下步骤：获取第一人脸图像，以及第二人脸视频，所述第二人脸视频包含依视频帧时序连续排列的一组第二人脸视频帧，所述第一人脸图像为待风格化处理的原始人脸图像，所述第二人脸视频帧为包含第一人脸图像风格化处理的目标风格的参考人脸图像；根据一组第二人脸视频帧，通过第一AI模型进行风格化编码，得到一组目标风格，所述目标风格对应于风格编码，所述第一AI模型对应于StarGAN风格化处理模型；根据第一人脸图像和一组目标风格，通过第二AI模型在第二人脸视频中的每个视频帧时序处进行权重确定，得到每个视频帧时序处的风格权重，所述风格权重对应于第一人脸图像中各个目标风格的融合权重，所述第二AI模型对应于表征第一人脸图像和目标风格与风格权重间映射关系的神经网络；根据一组目标风格和每个视频帧时序处的风格权重，通过第一AI模型对第一人脸图像在第二人脸视频中的各个视频帧时序处进行风格化处理，得到第三人脸视频，所述第三人脸视频由各个视频帧时序处的第三人脸图像依视频帧时序排列而成，所述第三人脸图像对应于经目标风格进行风格化处理后的第一人脸图像；根据第一人脸图像和一组目标风格，通过第二AI模型在第二人脸视频中的每个视频帧时序处进行权重确定，得到每个视频帧时序处的风格权重，包括：将第一人脸图像和一组目标风格，以及第二人脸视频中的每个视频帧时序，依次输入至第二AI模型中，得到每个视频帧时序处的各个目标风格的风格权重；其中，所述第二AI模型的构建，包括：在样本图像库中随机选取两组样本图像分别作为第一样本图像和第二样本图像；获取每个第二样本图像的目标风格，得到一组样本风格；对每个第一样本图像随机设定出一组样本风格的多组风格权重，得到每个第一样本图像的多组样本权重；对每个第一样本图像，利用多组样本权重将一组样本风格进行风格融合，得到每个第一样本图像的多组风格化处理图像；在每个第一样本图像中，将风格权重作为CNN神经网络的输入项，将第一样本图像的风格化处理图像作为CNN神经网络的输出项，利用CNN神经网络对CNN神经网络的输入项和CNN神经网络的输出项进行深度学习，得到风格化处理结果预测网络，其中，所述风格化处理结果预测网络的表达式为：g=CNNG,{W1,W2,W3,…,Wn}；式中，g为第一样本图像的风格化处理图像，G为第一样本图像，W1为第1种目标风格的风格权重，W2为第2种目标风格的风格权重，W3为第3种目标风格的风格权重，Wn为第n种目标风格的风格权重，n为目标风格的总数量，CNN为CNN神经网络；在每个第一样本图像中，利用风格化处理结果预测模型对风格权重所有组合进行逐一运算，得到风格权重所有组合的风格化处理图像；将最优风格化处理图像对应的风格权重作为第一样本图像的最优静态风格权重；将第一样本图像和样本风格作为第二CNN神经网络的输入项，将最优静态风格权重作为第二CNN神经网络的输出项，利用第二CNN神经网络对第二CNN神经网络的输入项和第二CNN神经网络的输出项进行深度学习，得到静态权重预测网络，其中，所述静态权重预测网络的表达式为：{W1best1,W2best1,W3best1,…,Wnbest1}=CNN2G,{F1,F2,F3,…,Fn}；式中，W1best1为第1种目标风格的风格权重的最优静态风格权重，W2best1为第2种目标风格的风格权重的最优静态风格权重，W3best1为第3种目标风格的风格权重的最优静态风格权重，Wnbest1为第n种目标风格的风格权重的最优静态风格权重，n为目标风格的总数量，G为第一样本图像，F1为第1种目标风格，F2为第2种目标风格，F3为第3种目标风格，Fn为第n种目标风格，CNN2为第二CNN神经网络；利用静态权重预测模型结合多目标优化算法获取第一人脸图像在每个视频帧时序处的最优动态风格权重；将第一人脸图像和一组目标风格作为第三CNN神经网络的输入项，将最优动态风格权重作为第三CNN神经网络的输出项，利用第三CNN神经网络对第三CNN神经网络的输入项和第三CNN神经网络的输出项进行深度学习，得到动态权重预测网络，其中，所述动态权重预测网络的表达式为：{W1best2,W2best2,W3best2,…,Wnbest2}=CNN3G2,{F1,F2,F3,…,Fn}；式中，W1best2为第1种目标风格的风格权重的最优动态风格权重，W2best2为第2种目标风格的风格权重的最优动态风格权重，W3best2为第3种目标风格的风格权重的最优动态风格权重，Wnbest2为第n种目标风格的风格权重的最优动态风格权重，n为目标风格的总数量，G2为第一人脸图像，F1为第1种目标风格，F2为第2种目标风格，F3为第3种目标风格，Fn为第n种目标风格，CNN3为第三CNN神经网络；所述最优风格化处理图像的确定，包括：将各个风格化处理图像与第一样本图像的风格特征和内容特征进行比较，其中，将与第一样本图像的风格特征相似度最小，且与第一样本图像的内容特征相似度最大对应的风格化处理图像作为第一样本图像的最优风格化处理图像；所述最优动态风格权重的确定，包括：利用静态权重预测模型获得第一人脸图像在每个视频帧时序处的最优静态风格权重；设定第一动态目标，所述第一动态目标对应于经动态风格权重进行风格化处理后的第一人脸图像在相邻视频帧时序间风格特征变化程度最小化，所述第一动态目标的表达式为：；式中，K1为第一动态目标，min为最小化运算符，sim为相似度运算符，G3Ht为经动态风格权重进行风格化处理后的第一人脸图像在第t个视频帧时序处的风格特征，G3Ht+1为经动态风格权重进行风格化处理后的第一人脸图像在第t+1个视频帧时序处的风格特征，m为视频帧时序的总数量，simG3Ht,G3Ht+1为G3Ht和G3Ht+1间的相似度，t为计数变量；设定第二动态目标，所述第二动态目标对应于经动态风格权重进行风格化处理后的第一人脸视频在相邻视频帧时序间内容特征变化程度最大化，所述第二动态目标的表达式为：；式中，K2为第二动态目标，max为最小化运算符，sim为相似度运算符，G3St为经动态风格权重进行风格化处理后的第一人脸图像在第t个视频帧时序处的内容特征，G3St+1为经动态风格权重进行风格化处理后的第一人脸图像在第t+1个视频帧时序处的内容特征，m为视频帧时序的总数量，simG3St,G3St+1为G3St和G3St+1间的相似度，t为计数变量；G3为经动态风格权重{W12,W22,W32,…,Wn2}进行风格化处理后的第一人脸图像，W12为第1种目标风格的风格权重的动态风格权重，W22为第2种目标风格的风格权重的动态风格权重，W32为第3种目标风格的风格权重的动态风格权重，Wn2为第n种目标风格的风格权重的动态风格权重，n为目标风格的总数量；将最优静态风格权重作为求解约束条件，对第一动态目标和第二动态目标进行求解，得到动态风格权重{W12,W22,W32,…,Wn2}的最优解；将动态风格权重{W12,W22,W32,…,Wn2}的最优解作为第一人脸图像在每个视频帧时序处进行风格化处理的最优动态风格权重{W1best2,W2best2,W3best2,…,Wnbest2}。

全文数据：

权利要求：

百度查询：北京汇畅数宇科技发展有限公司基于AI模型的人脸风格化处理方法、装置及计算机设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：多屏显示方法、装置、设备和介质

下一篇：一种基于物联网的辐射源智能监管方法及系统

相关技术

多屏显示方法、装置、设备和介质

一种基于物联网的辐射源智能监管方法及系统

黏合剂组合物、电路连接用黏合剂膜及连接结构体的制造方法

多重自动光学复判系统以及多重自动光学复判方法

被动式腰部外骨骼

一种用于纺织品生产的输送装置

一种扩散片的自动化生产装置及其使用方法

一种多端口变换器及其紧凑化设计方法

基于前视超声的血管内实时成像方法

一种林业剪枝器

神经调节导管

一种酶法合成硒酸软骨素的生物合成方法及其应用

处理相关技术

溶液处理装置和溶液处理方法_日本特殊陶业株式会社_202280091787.X

基板处理装置及基板处理方法_株式会社斯库林集团_202210509128.5

气体处理装置、处理方法及其应用_宣城品宙洁净科技有限公司_202410845394.4

处理盒_珠海奔图电子有限公司_202410895275.X

信息处理装置、信息处理系统、信息处理方法和程序_索尼集团公司_201980080700.7

信息处理方法、信息处理系统以及信息处理装置_松下知识产权经营株式会社_202080031968.4

信息处理程序、信息处理方法和信息处理系统_CY游戏公司_202380021511.9

信息处理装置、信息处理方法和信息处理程序_索尼半导体解决方案公司_202080055560.0

图像处理装置、图像处理方法和图像处理系统_索尼集团公司_201980080331.1

一种船舶尾气处理装置及处理方法_山东交通学院_202410873539.1

方法相关技术

DAI配置方法、指示方法、发送方法、装置及介质_OPPO广东移动通信有限公司_202310133314.8

显示方法、查询方法、导航方法、辅助乘车方法及装置_阿里巴巴集团控股有限公司_202010178368.2

封装方法_法国圣戈班玻璃厂_202410826928.9

一种数据压缩方法、解压方法、位宽确定方法和系统_网易(杭州)网络有限公司_202410842860.3

成本测算方法、确定方法、装置、设备、介质及产品_广汽丰田汽车有限公司_202410916022.6

电极构件及其制造方法、电池构件及其制造方法、以及电池的制造方法_三井金属矿业株式会社_202380022373.6

问答模型训练方法、文本处理方法及奖励模型训练方法_恒生电子股份有限公司_202410779372.2

内存扩展方法、内存访问方法、装置及系统_山东浪潮科学研究院有限公司_202410582247.2

图像编码/解码方法和图像数据的发送方法_LX半导体科技有限公司_202410979222.6

工件台测试方法、平面光栅测试方法及系统测试方法_北京华卓精科科技股份有限公司_202111597212.9

风格化相关技术

基于对比学习的风格化三维人体运动生成方法_重庆理工大学_202410877371.1

驾驶风格识别方法、装置、车辆、介质及程序_深蓝汽车科技有限公司_202410906425.2

一种基于图像的油画风格识别方法_阿坝师范学院_202111413706.7

一种基于图像解耦的轻量化卡通风格迁移方法_安徽理工大学_202410765760.5

一种基于解耦模块挖掘的文本风格迁移方法_合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)_202410810413.X

基于风格内容解耦的跨域遥感图像目标检测方法_大连理工大学_202110911051.X

基于AI模型的人脸风格化处理方法、装置及计算机设备_北京汇畅数宇科技发展有限公司_202311550362.3

图案化组合物、图案化薄膜、图案化基底、半导体器件及其制造方法_珠海基石科技有限公司_202411200625.2

模块化水杯_黄冈市卓源智能科技有限公司_202411154947.8

α化淀粉干燥粉末的制造方法、α化淀粉干燥粉末、α化荞麦干燥粉末及α化淀粉干燥粉末的制造装置_株式会社阿尔法科技_202380021546.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于AI模型的人脸风格化处理方法、装置及计算机设备

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务