面向可控人类图像生成的姿态修正方法及计算机设备

导航：龙图腾网> 最新专利技术> 面向可控人类图像生成的姿态修正方法及计算机设备

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：南京邮电大学

摘要：本发明公开了面向可控人类图像生成的姿态修正方法及计算机设备，其中方法包括：S1：对可控人类图像生成模型提取文本特征张量；S2：将文本特征张量池化后进行裁剪、展平，得到一维文本张量；S3：将一维文本张量与扩散步张量相加，得到条件张量；S4：将预测噪音张量做切片处理，得到噪音张量；S5：将位置编号张量与噪音张量相加，得到新噪音张量；S6：将新噪音张量按序输入至层归一化网络及多头自注意力网络中，得到输出张量；S7：将输出张量与条件张量同时输入至多头交叉注意力网络中，得到最终预测噪音张量；S8：生成姿态控制精度更高的最终图像。本发明能够提高姿态控制的精确度。

主权项：1.面向可控人类图像生成的姿态修正方法，其特征在于，包括以下步骤：S1：记预训练的可控人类图像生成模型中噪音预测网络UNet输出的预测噪音张量为Noutput，记预训练的可控人类图像生成模型中提取后的文本特征张量为TCLIP；S2：将文本特征张量TCLIP输入一维最大池化网络进行最大池化，池化后进行裁剪、展平，得到一维文本张量T；S3：将一维文本张量T与预训练的可控人类图像生成模型中的扩散步张量t相加，得到条件张量C；S4：将预测噪音张量Noutput做切片处理，得到噪音张量N'output；S5：将位置编号张量P与噪音张量N'output相加，得到新噪音张量N；S6：将新噪音张量N按序输入至层归一化网络及多头自注意力网络SA中，再输入至一层层归一化网络中，得到输出张量N4；S7：将输出张量N4与条件张量C同时输入至多头交叉注意力网络CA中，并将结果按序输入至层归一化网络及位置逐元素前馈网络中，得到最终预测噪音张量N'；S8：将最终预测噪音张量N'输入回预训练的可控人类图像生成模型的后续过程，生成姿态控制精度更高的最终图像。

全文数据：

权利要求：

百度查询：南京邮电大学面向可控人类图像生成的姿态修正方法及计算机设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：超临界晶圆清洗/干燥介质回收方法以及系统

下一篇：牙冠的宽度数值确定方法、装置、设备及存储介质

相关技术

超临界晶圆清洗/干燥介质回收方法以及系统

牙冠的宽度数值确定方法、装置、设备及存储介质

纵置混动变速箱机械泵

一种双层基质与立体模式的茶树种质资源保存和快速繁育方法

一种靶向铜绿假单胞菌凝集素的仿生多功能纳米制剂及其制备方法和应用

机载光电设备反射镜均热化控温装置

一种PCF板的连接结构及其使用方法

一种基于重载群组列车群组通信的列车运行预测方法、系统及电子设备

一种新型鹅星状病毒疫苗及其制备方法与应用

一种用于光伏板边框的铝合金型材

自移动设备大区域移动方法、自移动设备及存储介质

一种线控转向系统动态负载模拟装置及控制方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

面向可控人类图像生成的姿态修正方法及计算机设备

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务