Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜华东师范大学杨静获国家专利权

恭喜华东师范大学杨静获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜华东师范大学申请的专利一种基于类别感知一致性的文本生成图像方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114565865B

龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210099097.0,技术领域涉及:G06V20/30;该发明授权一种基于类别感知一致性的文本生成图像方法是由杨静;汪志伟设计研发完成,并于2022-01-27向国家知识产权局提交的专利申请。

一种基于类别感知一致性的文本生成图像方法在说明书摘要公布了:本发明公开了一种基于类别感知一致性的文本生成图像方法,包括如下步骤:通过结合度量学习和图像分类网络得到每个图片的特征;之后聚合每一类物体下多张图像特征获得类别感知的公共特征。利用提前获取的类别感知特征作为模型训练过程中的监督信息,对文本生成图像的过程做一个约束,从而使得图像更加完整,更具细节。本发明的有效性,相对于引用图像标签和目标位置作为监督信息,能够有效的对生成图的类别相应特征进行约束,且不会引入大量计算复杂度;生成图像更加完整、更具细节。

本发明授权一种基于类别感知一致性的文本生成图像方法在权利要求书中公布了:1.一种基于类别感知一致性的文本生成图像方法,其特征在于,该方法包括以下步骤:步骤1:获取数据集从网络中或者图库中通过爬虫获取到某种物体不同类别的图片,按照类别信息进行分类,之后人工对每张图片进行文本描述,得到图片与对应文本信息的数据集;数据集中有该物体数种类别的物体图片,每类有数十张的图片、每张图片对应有数条相应描述文本,将所述的数据集划分为80%的训练集和20%的测试集,用于之后模型训练;其中,所述训练集与测试集无类别的交集;步骤2:获取类别感知特征结合度量学习,搭建基于CNN网络的图像编码器,对训练集图片进行编码,从而得到图像特征;在所述图像编码网络中,应用交叉熵损失函数,并引用三元组损失tripletloss使得图像特征的类间距离变大、类内距离变小,两损失的比重分别为0.6和0.4;编码网络的主干由通用的感知网络inception-v3网络组成,训练过程中保持固定;将所有图片通过该编码器进行编码,获得所有图片对应的图像特征,然后将所有图像特征进行归类,之后将每类物体下的多个图像特征通过平均、聚类算法,获得一个512维的特征,作为每个类别物体的类别感知特征;最后将获取的类别感知特征存储在文件中,作为先验知识参与训练;步骤3:类别感知特征参与训练,生成文本对应的真实图像加载数据集中图像对应的文本,经过通用的文本编码器进行编码,得到全局文本表示特征,与100维的高斯噪声拼接,然后输入到生成对抗网络(GAN)的生成器中,得到256x256的生成图像IG;其中生成器网络由上采样层、卷积层和LeakyReLU层组成;将所述图像IG输入到图像编码器中得到图像的特征表示,之后从文件中找到该类别对应的类别感知特征,最后采取一个基于余弦相似度距离的损失函数来作为额外的约束条件;通过在生成器损失函数中添加该约束条件,随着网路反向传播进行不断优化,使得数据流能够感知类别对应信息,生成更加完整,更具细节的图像;测试集文本编码过后,与随机噪声进行拼接后输入到训练好的生成器模型中,生成文本对应的图片。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华东师范大学,其通讯地址为:200241 上海市闵行区东川路500号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。