Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜浙江大学计算机创新技术研究院赵瑶获国家专利权

恭喜浙江大学计算机创新技术研究院赵瑶获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜浙江大学计算机创新技术研究院申请的专利一种基于语义对齐和分层Agent生成SQL的方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119377255B

龙图腾网通过国家知识产权局官网在2025-05-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411960119.3,技术领域涉及:G06F16/2452;该发明授权一种基于语义对齐和分层Agent生成SQL的方法和装置是由赵瑶;方科彬;夏瑞晨;罗尚虎;梁敏;罗大伟;祝栗设计研发完成,并于2024-12-30向国家知识产权局提交的专利申请。

一种基于语义对齐和分层Agent生成SQL的方法和装置在说明书摘要公布了:本发明公开了一种基于语义对齐和分层Agent生成SQL的方法和装置。本发明通过对教育数据库的Schema信息进行增强处理,结合对用户查询问题的语义理解和语义映射,实现动态调用智能体Agents自主定义结构化查询语言SQL生成的流程,然后执行生成的结构化查询语言SQL查询语句,捕捉生成结果,最终实现面向教育领域数据库从简单到复杂的快速查询操作。本发明具有接近较高的查询成功率,能够有效地帮助用户从复杂的数据库结构中查询到正确的结果,大幅提高了用户的工作效率。

本发明授权一种基于语义对齐和分层Agent生成SQL的方法和装置在权利要求书中公布了:1.一种基于语义对齐和分层Agent生成SQL的方法,其特征在于,包括:步骤1在用户进行查询时,将原始的用户的查询问题和包含若干教育信息表的教育数据库进行语义信息对齐,包括信息增强、语义理解和语义映射处理,获得有效的用户的查询问题及其相关的若干增强后的教育信息表,有效的用户的查询问题为原始的用户的查询问题或语义理解处理后的用户的查询问题;步骤2调用大模型智能体以使用大语言模型对有效的用户的查询问题及其相关的各个增强后的教育信息表进行处理,包括问题拆解、候选表选择和候选字段选择处理,获得二次处理后的用户的查询问题及其相关的候选表和候选字段,二次处理后的用户的查询问题为有效的用户的查询问题或问题拆解后的有效的用户的查询问题;步骤3根据二次处理后的用户的查询问题相关的候选表和候选字段,使用常见问题解答FAQ方法生成结构化查询语言SQL并进行反思,获得最终的答复文本并反馈至用户;所述的步骤1中,在进行语义信息对齐时,首先将教育数据库中的各个教育信息表的定义信息Schema进行信息增强,加入关键信息和预设的特殊标记及其说明,从而获得各个教育信息表的增强后的定义信息schemae;然后对用户的查询问题进行类别划分后查询重写,获得有效的用户的查询问题,并对增强后的各个教育信息表进行业务层级划分处理,再将有效的用户的查询问题通过大语言模型进行语义映射后映射到相应的业务层级,从而在映射到的业务层级中查询到有效的用户的查询问题的相关的若干增强后的教育信息表;所述的用户的查询问题进行类别划分时,将用户的查询问题划分为两类,涉及时间术语的用户的查询问题划分为时间混淆问题,将其它的用户的查询问题划分为语义混淆问题;当查询问题属于时间混淆问题时,则在查询问题中注入额外的时间信息Rt,包括当前时间和查询问题中的起止时间;当查询问题属于语义混淆问题时,首先构建预设的歧义数据集D,歧义数据集D中包含若干带有歧义的句子或短语,然后根据歧义数据集D对对话预训练模型ChatGLM3进行微调,获得微调后的对话预训练模型Gt,将用户的查询问题输入微调后的对话预训练模型Gt中进行处理,进而判断用户的查询问题是否存在歧义,若存在歧义则进行用户的查询问题的重写,直至不存在歧义,获得有效的用户的查询问题;所述的步骤2中,在进行候选表选择时,首先创建选择候选表大模型智能体,当二次处理后的用户的查询问题的相关的增强后的教育信息表的张数小于等于预设阈值时,则不调用选择候选表大模型智能体,直接将各张相关的增强后的教育信息表作为二次处理后的用户的查询问题的候选表;当二次处理后的用户的查询问题的相关的增强后的教育信息表的张数大于预设阈值时,则根据二次处理后的用户的查询问题的各张相关的增强后的教育信息表及其增强后的定义信息schemae,使用大语言模型生成二次处理后的用户的查询问题的每张相关的增强后的教育信息表的特定描述,然后将二次处理后的用户的查询问题及其各张相关的增强后的教育信息表的特定描述通过大语言模型进行处理,最终选择出二次处理后的用户的查询问题的若干候选表,将各个候选表注入大语言模型的指令Instruction信息中;所述的步骤2中,在进行候选字段选择时,首先创建选择候选字段大模型智能体,通过选择候选字段大模型智能体使用大语言模型,并采用机器学习Few-Shot方法,在二次处理后的用户的查询问题的各个候选表中自动判断选择最相关的候选字段,将各个候选字段将注入到大语言模型的指令Instruction信息中;所述的步骤3中,使用常见问题解答FAQ方法,创建若干条常见问题及其对应的结构化查询语言SQL结果,在查询过程中,若用户的查询问题属于常见问题,则将常见问题的结构化查询语言SQL结果作为额外信息注入到大语言模型的指令Instruction中,并根据二次处理后的用户的查询问题及其候选字段通过大语言模型进行处理后生成最终可执行的结构化查询语言SQL语句;然后对生成的结构化查询语言SQL语句进行反思,在教育数据库中执行生成的结构化查询语言SQL语句,然后返回结构化查询语言SQL的运行结果,若结构化查询语言SQL正确执行,则认为结构化查询语言SQL正确;若结构化查询语言SQL执行失败,则将结构化查询语言SQL失败的错误信息,以及当前失败的结构化查询语言SQL的查询问题重新输入到大语言模型中进行处理,从而重新生成新的结构化查询语言;最终将执行后的重新生成新的结构化查询语言通过大语言模型处理后输出文本结果并返回给用户。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学计算机创新技术研究院,其通讯地址为:311200 浙江省杭州市萧山区利一路188号天人大厦33楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。