基于深度对抗网络的视频-动画风格迁移方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：北京电影学院

摘要：本发明公开了一种基于深度对抗网络的视频‑动画风格迁移方法。使用本发明能够从无配对、仅含风格标签的训练数据中学习，能迁移从未见过的新风格。本发明采用生成‑对抗网络，通过内容编码器和风格编码器实现动作片段的动作内容和动作风格解耦，通过解码器进行动作内容、风格匹配，并利用判别器对匹配结果的风格包括真实性、动作内容进行判断，进而完成风格迁移。该方法能在无配对的数据上训练，且风格编码器具有一般性，能够迁移全新的风格，此外，该方法能绕过三维重建，直接从二维视频中提取风格，迁移到三维动作上，大大拓展了动作风格迁移的应用范围。

主权项：1.一种基于深度对抗网络的视频-动画风格迁移方法，其特征在于，包括如下步骤：步骤1，构建生成-对抗网络；其中，生成-对抗网络包括生成器和判别器，生成器包括内容编码器EC、风格编码器ES和解码器F；内容编码器EC包含实例归一化的一维时序卷积层和实例归一化的残差卷积层，将输入的内容动作片段ms编码为包含时序信息的内容向量zc；风格编码器ES包含2个一维时序卷积层和一个池化层，将输入的风格动作片段nt编码为不含时序信息的固定长度的风格向量zs；其中，风格编码器ES包括二维风格编码器和三维风格编码器，分别接收并编码二维风格动作片段和三维风格动作片段；解码器F包含AdaIN层、残差卷积层、上采样层和无激活函数的卷积层，对内容向量zc进行卷积与上采样，并利用AdaIN层注入风格向量zs的信息，得到风格迁移后的动作片段mt＝FECms|ESnt；判别器判别动作片段mt的动作是否属于风格t的真实动作；步骤2，分别以“Ladv”与“Lcon+αadvLadv+αjointLjoint+αtripLtrip”为损失函数，交替训练步骤1构建的生成器和判别器，得到训练好的生成-对抗网络；其中，Ladv为对抗损失函数：对于输入内容动作片段ms、风格动作片段nt，判别器D希望最大化对真实片段nt的评分Dtnt，最小化对生成器输出片段的评分DtFECms|ESnt；生成器G希望最大化对其输出片段的评分DtFECms|ESnt；其中，E表示期望；M为训练集，DtFECms|ESnt为判别器对生成器输出片段的评分；F为解码器，EC为内容编码器、ES为风格编码器；Lcon为内容一致性损失函数：当内容输入为ms、风格输入为ns，与内容输入具有相同风格时，生成器应当重建内容输入ms；其中，E表示期望；M为训练集，FECms|ESns为生成器的输出；EC为内容编码器、ES为风格编码器；Ltrip为风格三元组损失函数：标签相同的动作对应风格向量之间距离至少比标签不同的动作对应风格向量之间的距离小设定值；其特征在于，其中，E表示期望，nt,xt为两个风格为t的动作片段，ws为风格为s的动作片段，ES表示风格编码器，||ESnt-ESxt||为两个相同风格动作片段的编码之间的距离，为两个不同风格动作片段的编码之间的距离，δ为设定的距离阈值；最外层的[]+函数在变量取值为负数、即相同风格动作片段的编码间距离比不同风格动作片段的编码间距离至少小δ时，函数取值为0；在变量取值为正数时，取值为变量本身；Ljoint为二维-三维共享嵌入损失函数：将三维动作nt投影为二维动作Pnt；p，希望ES2D,ES3D将Pnt；p,nt映射为同一个风格向量；其中，E表示期望，M为训练集，nt为风格动作片段，ES3D为三维风格编码器，ES2D为二维风格编码器，P为一个投影算子，Pnt；p为三维动作nt根据投影参数p向二维的投影；ES3Dnt,ES2DPnt；p分别为三维风格编码器对三维动作的编码、二维风格编码器对投影后二维动作的编码；αadv、αjoint、αtrip分别为对应损失函数的权重；步骤3，将待迁移风格的内容动作片段和拟采用风格的风格动作片段输入训练好的生成器，实现风格迁移。

全文数据：

权利要求：

百度查询：北京电影学院基于深度对抗网络的视频-动画风格迁移方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：回环检测方法、装置、电子设备和存储介质

下一篇：一种大花海棠染色体加倍的诱导方法

相关技术

回环检测方法、装置、电子设备和存储介质

一种大花海棠染色体加倍的诱导方法

一种高矫顽力的R-T-B永磁体及其制备方法和应用

一种电驱机械振动辅助负压可弯导引鞘

一种坐浴盆

一种刹车盘保护盖

一种玉米栽培供水装置

一种移动医疗推车

一种具有表面清理功能的不锈钢带拉矫装置

一种静载试验接桩循环护筒

振镜和激光雷达

一种应用于硅碳复合材料的反应装置

视频相关技术

跟随器模式视频操作_苹果公司_202410649941.1

面向通用视频编码标准的监控视频重压缩取证方法_西安邮电大学_202410237021.9

红外视频噪声仿真方法和装置及红外视频去噪方法和装置_南京大学_202410786364.0

视频解码方法和设备以及视频编码方法和设备_三星电子株式会社_202410851630.3

视频解码方法、装置、设备和介质_腾讯美国有限责任公司_202180005549.8

视频或图像编译方法及其装置_LG电子株式会社_202410824083.X

一种视频通话系统_厦门平安通网络科技有限公司_202323658687.1

视频处理方法及相关装置_湖南快乐阳光互动娱乐传媒有限公司_202410821581.9

一种顶盖视频检查装置_核动力运行研究所_202010674800.7

一种用于智慧视频生成的多源视频数据智能选择方法及系统_浩神科技(北京)有限公司_202411107803.7

-相关技术

风格相关技术

基于切画的图像风格迁移方法及其迁移系统_四川新视创伟超高清科技有限公司_202410806239.1

一种基于风格向量的语音驱动数字人面部视频生成方法_湖北大学_202410775608.5

一种基于人工智能的荆楚风格数字绘画生成方法及系统_武汉软件工程职业学院(武汉开放大学)_202410926542.5

一种跨说话人语音风格建模方法及计算机可读存储介质_清华大学深圳国际研究生院_202111535836.8

进风格栅、面板和空气处理设备_大金工业株式会社_202323003323.X

驾驶风格分类方法、装置、设备、介质及产品_采埃孚股份公司_202410865089.1

字体风格迁移网络的训练方法、装置、设备及存储介质_京东方科技集团股份有限公司_202380000008.5

一种基于全局信息引导网络实现真实图像风格迁移的方法_光华临港工程应用技术研发(上海)有限公司_202110891687.2

一种过风格栅、罩壳及热泵热水器_广东美的制冷设备有限公司_202323167820.3

一种基于驾驶员风格诊断的智能交通推荐方法_淮阴工学院_202410776714.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于深度对抗网络的视频-动画风格迁移方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务