恭喜平一科技(杭州)有限公司钟伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜平一科技(杭州)有限公司申请的专利一种基于Transformer的视觉大模型训练系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119169414B 。
龙图腾网通过国家知识产权局官网在2025-05-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411666890.X,技术领域涉及:G06V10/774;该发明授权一种基于Transformer的视觉大模型训练系统是由钟伟;侯文峰;张杭烽;王英军;王魏强;朱钱华设计研发完成,并于2024-11-21向国家知识产权局提交的专利申请。
本一种基于Transformer的视觉大模型训练系统在说明书摘要公布了:本发明涉及模型训练技术领域,具体为一种基于Transformer的视觉大模型训练系统,系统包括:模糊区域选择模块基于输入图像数据,获取模糊区域和清晰区域的分布信息,根据图像的模糊区域和清晰区域进行权重分配,获取区域加权图,将区域加权图用于Transformer自注意力层中,生成权重调整后的注意力分布图。本发明中,通过对图像的亮度、颜色变化、对比度、边缘清晰度和纹理密集度等特征信息进行处理,动态区分模糊和清晰区域,并赋予清晰区域更高权重,使模型更加聚焦高信息量的区域,提升了在细节丰富场景中的分辨能力。基于相似度伪标签,通过标注样本与无标签样本之间的特征相似性关系,提高了无标签样本在特征学习过程中的准确性和效率。
本发明授权一种基于Transformer的视觉大模型训练系统在权利要求书中公布了:1.一种基于Transformer的视觉大模型训练系统,其特征在于,所述系统包括:模糊区域选择模块基于输入图像数据,获取模糊区域和清晰区域的分布信息,根据图像的模糊区域和清晰区域进行权重分配,获取区域加权图,将区域加权图用于Transformer自注意力层中,生成权重调整后的注意力分布图;所述区域加权图的获取步骤具体为:基于输入图像数据,将图像划分为若干大小的区域块,采用公式: 计算模糊程度得分,得到区域的模糊度评价值;其中,、是组合权重系数,用于调整亮度、颜色变化、对比度与边缘清晰度、空间频率的相对影响,是区域的亮度值,是亮度归一化上限,即亮度的最大值,是颜色变化值,是颜色变化的归一化上限,是对比度差异值,是对比度的归一化上限,是边缘清晰度,是边缘清晰度的归一化上限,是空间频率,是空间频率的归一化上限,、、、、是特征权重系数;根据所述区域的模糊度评价值,对区域块的模糊程度进行分析,并设定相应权重,通过将每个区域块的权重数据填充至与区域大小相同的权重矩阵,将权重矩阵按区域在图像中的位置拼接组合,得到区域加权图;相似度伪标签分配模块参照所述权重调整后的注意力分布图对图像区域的权重,构建样本间的相似度矩阵,为无标签样本分配伪标签,并将无标签样本分配至最相似的标注样本所属的类别,得到伪标签分配结果;协同特征关联模块基于所述区域加权图中高权重区域的图像局部细节区域,以及伪标签分配结果中样本间的相似度矩阵的信息,构建上下文关联矩阵,动态调整局部特征和全局特征的权重,得到跨层次特征关联图;层级多尺度建模模块基于所述跨层次特征关联图,对输入图像特征进行尺度划分,通过跨层信息传递的方式,将小尺度区域特征嵌入大尺度区域实现特征的融合,将融合后的特征输入至后续的Transformer层,生成多尺度特征训练结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平一科技(杭州)有限公司,其通讯地址为:311100 浙江省杭州市余杭区余杭街道中国人工智能小镇8号楼503;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。