恭喜国网安徽省电力有限公司电力科学研究院;国网安徽省电力有限公司郝雨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜国网安徽省电力有限公司电力科学研究院;国网安徽省电力有限公司申请的专利面向复杂电力视觉场景的多模态模型风格嵌入方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119295895B 。
龙图腾网通过国家知识产权局官网在2025-03-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411814814.9,技术领域涉及:G06V10/82;该发明授权面向复杂电力视觉场景的多模态模型风格嵌入方法及系统是由郝雨;罗沙;方登洲;孙伟;汪玉;刘辉;赵龙;陈凡;仇茹嘉;肖家锴;王鑫;邢璐;史伟豪设计研发完成,并于2024-12-11向国家知识产权局提交的专利申请。
本面向复杂电力视觉场景的多模态模型风格嵌入方法及系统在说明书摘要公布了:面向复杂电力视觉场景的多模态模型风格嵌入方法及系统,属于图像处理技术领域,解决如何增强视觉语言预训练模型的风格表达能力的问题;本发明利用扩散模型辅助多模态模型建立连续空间的领域级风格提示词,将扩散模型的知识迁移到多模态模型中,在面向复杂电力视觉场景时具有更丰富的风格表达和建模能力,可以描述更加细致的风格信息;本发明通过建立实例级风格特征提取模型,将实例级风格特征提取模型与领域级风格信息库的风格信息对齐,推理过程中针对单张图像输入,能够生成高效精确的风格提示词,适用于电力真实场景中的缺陷识别、目标检测等任务,有效增强下游任务中的视觉文本预训练模型的风格泛化性能。
本发明授权面向复杂电力视觉场景的多模态模型风格嵌入方法及系统在权利要求书中公布了:1.面向复杂电力视觉场景的多模态模型风格嵌入方法,其特征在于,包括:S1、获取电力视觉场景的图像数据和语义类别文本数据并构建训练集,所述训练集包括图像和语义类别文本;S2、基于Pytorch深度学习框架,建立领域级风格信息模型,所述领域级风格信息模型包括CLIP模型、扩散模型和可学习的风格提示词库;利用CLIP模型和扩散模型联合学习,对风格提示词库进行梯度更新,获取领域级风格信息库;所述S2包括:S21、构建可学习的风格提示词库;S22、结合语义类别数据集与风格提示词库,得到含有特定风格的文本,输入CLIP模型的文本分支,获取特定风格的文本特征;S23、将特定风格的文本特征输入扩散模型,生成文本特征对应的图像,将图像输入CLIP模型的视觉分支,获取特定风格的图像特征;S24、基于特定风格的文本特征和特定风格的图像特征,计算内容一致性约束和风格空间一致性损失,对风格提示词库进行梯度更新,得到领域级风格信息库;所述扩散模型采用基于UNet的StableDiffusion模型结构;S3、对训练集图像进行随机裁剪,将所有训练集图像大小缩放到统一尺寸,再进行数值归一化处理;S4、基于Pytorch深度学习框架,建立实例级风格特征提取模型,提取对单个图像的风格信息,进行跨模态知识交互,对实例级风格特征提取模型进行梯度更新。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网安徽省电力有限公司电力科学研究院;国网安徽省电力有限公司,其通讯地址为:230000 安徽省合肥市经济开发区紫云路299号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。