恭喜数据堂(北京)科技股份有限公司齐红威获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜数据堂(北京)科技股份有限公司申请的专利多模态大模型训练数据采集方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119380144B 。
龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411946438.9,技术领域涉及:G06V10/774;该发明授权多模态大模型训练数据采集方法及系统是由齐红威;丰强泽;王大亮;高禹;郑继龙;史红欣设计研发完成,并于2024-12-27向国家知识产权局提交的专利申请。
本多模态大模型训练数据采集方法及系统在说明书摘要公布了:本申请涉及计算机技术领域,其具体地公开了一种多模态大模型训练数据采集方法及系统,其采用基于深度学习的数据处理技术对语义对齐的图像数据和图像内容文本描述数据进行语义特征提取和跨模态联合编码,以捕捉到模态间的语义关联,实现跨模态的语义信息融合,并在此基础上进一步进行图像样本的生成,进而,通过对生成的图像样本与原始图像数据进行语义偏移度量,以智能识别生成的图像样本是否为合格增强样本。通过这种方式,可以有效地丰富多模态训练数据集,确保数据的质量,解决多模态数据增强过程中跨模态语义一致性的问题,从而提高多模态大模型的训练效率。
本发明授权多模态大模型训练数据采集方法及系统在权利要求书中公布了:1.一种多模态大模型训练数据采集方法,其特征在于,包括:获取被标记为对齐的第一模态数据和第二模态数据,其中,所述第一模态数据为图像,所述第二模态数据为图像内容文本描述;对所述第一模态数据和所述第二模态数据分别进行语义特征提取以得到图像语义编码特征图和图像内容文本描述语义编码特征向量;对所述图像语义编码特征图和所述图像内容文本描述语义编码特征向量进行跨模态联合编码以得到图像-图像文本描述跨模态提示引导联合编码特征图;基于所述图像-图像文本描述跨模态提示引导联合编码特征图进行图像生成以得到生成图像样本;基于所述生成图像样本与所述第一模态数据之间的语义偏移,确定所述生成图像样本是否为合格增强样本;其中,对所述图像语义编码特征图和所述图像内容文本描述语义编码特征向量进行跨模态联合编码,包括:对所述图像语义编码特征图和所述图像内容文本描述语义编码特征向量进行细粒度局部查询编码以得到图像-图像文本描述局部查询提示语义编码向量的集合;以所述图像-图像文本描述局部查询提示语义编码向量的集合作为提示信息,对所述图像语义编码特征图进行细粒度特征调制以得到所述图像-图像文本描述跨模态提示引导联合编码特征图。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人数据堂(北京)科技股份有限公司,其通讯地址为:100080 北京市海淀区宝盛南路1号院11号楼1层101-01;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。