【发明公布】一种文本驱动的多概念个性化图像编辑方法_杭州电子科技大学_202410370133.1

导航：龙图腾网> 最新专利技术> 一种文本驱动的多概念个性化图像编辑方法_杭州电子科技大学_202410370133.1

申请/专利权人：杭州电子科技大学

申请日：2024-03-29

公开（公告）日：2024-06-14

公开（公告）号：CN118196238A

主分类号：G06T11/60

分类号：G06T11/60;G06T5/70

优先权：

专利状态码：在审-公开

法律状态：2024.06.14#公开

摘要：本发明公开了一种文本驱动的多概念个性化图像编辑方法，该方法首先训练包含个性化目标的概念模型，得到对应的文本嵌入向量。其次使用文本嵌入向量，修改源输入文本，得到修改后的文本。然后使用稳定扩散模型加载训练的包含个性化目标的概念模型参数得到扩散模型，将源输入文本和修改后的文本分别输入到文本编码器中得到文本嵌入，将文本嵌入输入扩散模型中引导去噪过程，并在去噪过程中进行替换注意力图和噪声的操作。最后重复迭代N次，得到目标图像，在进行解码得到真实目标图像，完成图像编辑。本发明实现用户通过文本输入实现多目标个性化编辑的需求，扩展AIGC领域图像编辑的应用范围。

主权项：1.一种文本驱动的多概念个性化图像编辑方法，其特征在于，包括以下步骤：步骤1、训练包含个性化目标的概念模型，得到对应的文本嵌入向量new1，new2引导图像编辑；步骤2、使用文本嵌入向量new1和new2，修改源输入文本P源，得到修改后的文本P目标；步骤3、使用稳定扩散模型加载训练的包含个性化目标的概念模型参数得到扩散模型，将源输入文本P源和修改后的文本P目标分别输入到文本编码器中得到文本嵌入，将文本嵌入输入扩散模型中引导去噪过程，并在去噪过程中进行替换注意力图和噪声的操作；步骤4、重复步骤3的操作，迭代N次，得到目标图像；步骤5、对目标图像进行解码得到真实目标图像，完成图像编辑。

全文数据：

权利要求：

百度查询：杭州电子科技大学一种文本驱动的多概念个性化图像编辑方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种MiniLED遮光膜激光修切方法_深圳铭创智能装备有限公司_202311373560.7

下一篇：阀孔自动清洗装置_中国计量大学_202010367509.5

相关技术

一种MiniLED遮光膜激光修切方法_深圳铭创智能装备有限公司_202311373560.7

阀孔自动清洗装置_中国计量大学_202010367509.5

一种除草组合物_江苏龙灯化学有限公司_202210014748.1

磁力可控轮足模块及轮腿机构及轮腿复合爬行机器人_广东工业大学_202211550727.8

一种适用于液压多路阀的气密性检测装置_徐州阿马凯液压技术有限公司_202111585252.1

一种适用于太阳能建筑一体化的集热器_华春新能源股份有限公司_202111271524.0

一种长距离通信的电网无人机巡检系统及方法_国网山东省电力公司金乡县供电公司_202310722098.0

一种用于预制多边形桥墩拼装定位的导向装置及设计方法_上海城建市政工程(集团)有限公司_202010952940.6

一种联合内容缓存和传输路由的网络优化方法_北京邮电大学_202210989943.6

隧道沉降测点装置_湖北文理学院_202111486983.0

长叶轮模具_株洲凯丰实业股份有限公司_202111628814.6

一种分区域机床热误差补偿方法_安徽工业大学_202210604031.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】一种文本驱动的多概念个性化图像编辑方法_杭州电子科技大学_202410370133.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务