恭喜华南理工大学赖博润获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜华南理工大学申请的专利基于门控交叉单词-视觉注意力驱动的文本生成图像方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115438211B 。
龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210947726.0,技术领域涉及:G06F16/583;该发明授权基于门控交叉单词-视觉注意力驱动的文本生成图像方法是由赖博润;马丽红;韦岗;张中豪设计研发完成,并于2022-08-05向国家知识产权局提交的专利申请。
本基于门控交叉单词-视觉注意力驱动的文本生成图像方法在说明书摘要公布了:本发明公开了一种基于门控交叉单词‑视觉注意力驱动的文本生成图像方法,包括以下步骤:从文本描述中提取句子特征向量和单词特征矩阵,并将句子特征向量通过条件增强处理得到条件特征向量,然后和随机噪声向量输入视觉特征转换器和生成器,得到低分辨率图像;将单词特征矩阵和视觉特征矩阵输入门控交叉单词‑视觉注意力单元,得到细化的单词特征矩阵和细化的视觉特征矩阵,然后将细化的视觉特征矩阵输入视觉特征转换器和生成器,得到高分辨率图像;重复以上步骤,得到更高分辨率的图像;引入改进的目标函数,增强生成图像的真实性和与文本描述的语义一致性,并将分辨率最高的图像作为最终生成图像。通过本发明的方法,可以生成质量更高的图像。
本发明授权基于门控交叉单词-视觉注意力驱动的文本生成图像方法在权利要求书中公布了:1.一种基于门控交叉单词-视觉注意力驱动的文本生成图像方法,其特征在于,所述文本生成图像方法包括以下步骤:S1、从文本描述中提取句子特征向量和第一阶段的单词特征矩阵,并将句子特征向量通过条件增强处理得到条件特征向量,然后将条件特征向量和随机噪声向量一起输入第一阶段的视觉特征转换器,得到第一阶段的视觉特征矩阵,再将第一阶段的视觉特征矩阵输入第一阶段的生成器,得到第一分辨率图像;S2、将第一阶段的单词特征矩阵和视觉特征矩阵输入第一阶段的门控交叉单词-视觉注意力单元,得到第一阶段细化的单词特征矩阵和细化的视觉特征矩阵,并将第一阶段细化的单词特征矩阵作为第二阶段的单词特征矩阵,然后将第一阶段细化的视觉特征矩阵输入第二阶段的视觉特征转换器,得到第二阶段的视觉特征矩阵,再将第二阶段的视觉特征矩阵输入第二阶段的生成器,得到第二分辨率图像;S3、将第二阶段的单词特征矩阵和视觉特征矩阵输入第二阶段的门控交叉单词-视觉注意力单元,得到第二阶段细化的单词特征矩阵和细化的视觉特征矩阵,并将第二阶段细化的单词特征矩阵作为第三阶段的单词特征矩阵,然后将第二阶段细化的视觉特征矩阵输入第三阶段的视觉特征转换器,得到第三阶段的视觉特征矩阵,再将第三阶段的视觉特征矩阵输入第三阶段的生成器,得到第三分辨率图像;S4、引入改进的目标函数,通过最小化目标函数增强每个阶段生成图像的真实性以及生成图像与文本描述的语义一致性,并将第三阶段生成的第三分辨率图像作为最终生成的高质量图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510640 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。