恭喜浙江大学;杭州高新区(滨江)区块链与数据安全研究院褚志轩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浙江大学;杭州高新区(滨江)区块链与数据安全研究院申请的专利一种基于扩散模型的文本增强图像生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119379866B 。
龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411961541.0,技术领域涉及:G06T11/60;该发明授权一种基于扩散模型的文本增强图像生成方法是由褚志轩;孙浥尘;王渤轩;郑昊伦;任奎设计研发完成,并于2024-12-30向国家知识产权局提交的专利申请。
本一种基于扩散模型的文本增强图像生成方法在说明书摘要公布了:本发明公开了一种基于扩散模型的文本增强图像生成方法,通过场景文本解析与关系建模机制,本框架通过深度整合大语言模型,显著提升了文本理解能力,实现了对复杂场景关系的精确解析和语义理解,创新性地设计了物体提取、关系提取和物体定位等核心模块,实现了对场景中物体位置、属性等细节的精确把控、通过巧妙集成外部搜索引擎和专业的文本生成模块,有效突破了传统模型在图像文字渲染和专有名词物体生成方面的局限性,显著提升了生成内容的准确性和真实性,通过整合知识图谱,将物体关系表示为图结构,并以入度最多的物体为核心锚点生成场景布局。本机制显著提升了场景布局的语义一致性与视觉美观性。
本发明授权一种基于扩散模型的文本增强图像生成方法在权利要求书中公布了:1.一种基于扩散模型的文本增强图像生成方法,其特征在于,包括:获得提示词文本;对提示词文本中的物体单词进行提取,输出结构化形式的物体的名称、数量、属性特征信息;根据得到物体的名称,将物体分类为一般物体类别、图像中的文字内容类别、现实世界中存在的专有名词物体类别,输出分类后的物体清单;根据分类后的物体清单和提示词文本,预测物体之间的空间关系和交互关系;基于物体之间的空间关系和交互关系,构建以三元组形式表示的物体关系结构;根据物体关系结构,构建完整的关系图并分析图结构,输出场景中的核心锚点物体的位置及其在画布中的基准位置;根据核心锚点物体的位置以及物体之间的空间关系,计算每个物体的具体边界框参数,输出所有物体的空间布局信息和尺寸比例,所述的边界框参数包括坐标位置和尺寸大小;根据分类后的物体清单和所有物体的空间布局信息和尺寸比例,针对不同的物体类别采用相应的生成策略,输出与提示词文本相符的完整的图像内容。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学;杭州高新区(滨江)区块链与数据安全研究院,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。