首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种Text2Sql方法、系统、电子设备及存储介质_成都四方伟业软件股份有限公司_202410070981.0 

申请/专利权人:成都四方伟业软件股份有限公司

申请日:2024-01-18

公开(公告)日:2024-04-05

公开(公告)号:CN117609281B

主分类号:G06F16/2452

分类号:G06F16/2452;G06F16/242;G06F16/2455;G06N3/0442;G06N3/0455

优先权:

专利状态码:有效-授权

法律状态:2024.04.05#授权;2024.03.15#实质审查的生效;2024.02.27#公开

摘要:本发明涉及自然语言处理技术领域,具体涉及一种Text2Sql方法、系统、电子设备及存储介质,步骤如下:获取问题编码以及数据库模式编码,编码器内部各LSTM分别执行对应子句类型的预测任务,获取SQL草图语句,编码内部为基于注意力机制的双向LSTM;基于问题编码的上下文向量,计算问题编码中所有列、运算符以及子查询的概率分布,基于预测结果对SQL草图语句内缺失信息进行补充;采用启发式规则生成FROM子句,以及基于子查询的预测结果生成内部查询的FROM子句,得到SQL语句。本方法在提高了数据查询准确性的同时,可在多种类型的数据库模式上运行,通用性和普适性更强;且通过子查询递归,可以进行嵌套查询的预测。

主权项:1.一种Text2Sql方法,其特征在于,包括以下步骤:获取问题编码以及数据库模式编码,编码器内部各LSTM分别执行对应子句类型的预测任务,获取SQL草图语句,所述编码器内部为基于注意力机制的双向LSTM;基于问题编码的上下文向量,通过将向量分别与数据库模式编码中各列内的表名和列名进行比较,计算问题编码中所有列、运算符以及子查询的概率分布,进行意图预测,基于预测结果对SQL草图语句内的缺失信息进行补充;采用启发式规则生成FROM子句,以及基于子查询的预测结果生成内部查询的FROM子句,得到SQL语句;基于SQL的语法关系对所述SQL语句进行SQL语句校验;所述数据库模式编码的获取方式如下:采用基于LSTM的数据库模式编码器分别对数据库中每一列的单词序列进行预测,得到每一列的单词序列预测结果,所述单词序列由数据库中各列内的表名和列名构成;基于所述单词序列预测结果,按照如下计算过程获取数据库模式编码: 上式中,表示第列的LSTM输出,表示的加权表示,表示可训练的权重矩阵,表示编码器内部LSMT数量,表示单词序列编码矩阵,表示倒置,表示列token个数,表示第列的单词序列编码;获取每一列单词序列的加权表示作为数据库模式编码表示;所述SQL草图语句的获取方式如下:取问题编码作为各LSTM的输入,表示问题的tokens向量表示,按照如下计算过程获取SQL草图语句: 上式中,表示的加权表示,表示可训练权重参数,表示序列表述,表示第一可训练参数,表示第二可训练参数,表示草图个数,表示中所有子句类型的概率分布;基于各子预测模块的概率分布输出结果确定SQL草图语句。

全文数据:

权利要求:

百度查询: 成都四方伟业软件股份有限公司 一种Text2Sql方法、系统、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。