恭喜中国科学技术大学周熠获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中国科学技术大学申请的专利一种用于低资源数据环境的工具调用语义解析方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119623478B 。
龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510169480.2,技术领域涉及:G06F40/30;该发明授权一种用于低资源数据环境的工具调用语义解析方法及系统是由周熠;梁子翔;李秉千;钟成莉设计研发完成,并于2025-02-17向国家知识产权局提交的专利申请。
本一种用于低资源数据环境的工具调用语义解析方法及系统在说明书摘要公布了:本发明公开了一种用于低资源数据环境的工具调用语义解析方法及系统,涉及语义解析技术领域,该方法包括以下步骤:基于上下文无关文法,构建各个工具的逻辑表达式,并结合提示词工程和大语言模型,生成初始的训练数据;针对获取的训练数据,结合自训练方法,对预先配置的语义解析模型进行迭代训练,得到优化后的语义解析模型;通过召回模型,对工具候选数据和训练数据进行相似度计算,得到工具候选数据和训练数据的向量分数,并筛选出不符合用户语义的工具,得到最终的语义解析模型。本发明通过构建基于上下文无关文法的初始解析数据集,并结合自训练策略增强模型的解析能力,提高其在低资源环境下的表现,有效扩展语义解析的能力。
本发明授权一种用于低资源数据环境的工具调用语义解析方法及系统在权利要求书中公布了:1.一种用于低资源数据环境的工具调用语义解析方法,其特征在于,该用于低资源数据环境的工具调用语义解析方法包括以下步骤:S1、基于上下文无关文法,构建各个工具的逻辑表达式,并结合提示词工程和大语言模型,生成初始的训练数据;S2、针对获取的训练数据,结合自训练方法,对预先配置的语义解析模型进行迭代训练,得到优化后的语义解析模型;S3、通过召回模型,对工具候选数据和训练数据进行相似度计算,得到工具候选数据和训练数据的向量分数,并筛选出不符合用户语义的工具,得到最终的语义解析模型;所述针对获取的训练数据,结合自训练方法,对预先配置的语义解析模型进行迭代训练,得到优化后的语义解析模型包括以下步骤:S21、对获取的训练数据进行标注,得到标注数据集和无标注数据集;S22、利用标注数据集,对语义解析模型进行初始化训练,得到初始化语义解析模型;S23、依据初始化语义解析模型,对无标注数据集进行迭代优化,得到优化后的语义解析模型;所述通过召回模型,对工具候选数据和训练数据进行相似度计算,得到工具候选数据和训练数据的向量分数,并筛选出不符合用户语义的工具,得到最终的语义解析模型包括以下步骤:S31、通过召回模型,将无标注数据转换成向量形式的无标注数据;S32、采用最大相似度方式,对向量形式的无标注数据与工具候选数据的全部向量进行相似度度量,得到无标注数据和工具候选数据的向量分数;S33、基于预先设定的相似度分数阈值,筛选出向量分数超过阈值的工具,得到最终的语义解析模型;所述无标注数据和工具候选的向量分数的计算公式为: 式中,vi表示无标注数据的第i个向量;tj表示工具候选的第j个向量;M表示无标注数据的向量个数;Score表示无标注数据与工具候选集的向量分数;其中,CosineSim的计算公式为: 式中,CosineSim表示余弦相似度公式;vi,l表示vi向量的各个分量;tj,l表示tj向量的各个分量;n表示向量的维度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学技术大学,其通讯地址为:230000 安徽省合肥市金寨路96号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。