首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于Coarse2Fine网络的相似问题匹配方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:江苏科技大学

摘要:本发明公开了一种基于Coarse2Fine网络的相似问题匹配方法,包括以下步骤:步骤1:运用数据集训练得到对应的Coarse2Fine模型;步骤2:运用Coarse2Fine模型中的BM25模型将待处理语句与数据库中的语句进行粗粒度的相似度匹配,得到数条匹配语句;步骤3:在ESIM网络中提取待处理语句、匹配语句的特征值,将待处理语句的特征值逐一与数条匹配语句的特征值计算差异性值;步骤4:在ESIM网络中提取出差异性值小的匹配语句,作为相似语句的输出结果。本发明解决了单使用ESIM网络匹配导致的太多高分项而无法选择出最佳匹配结果的问题。

主权项:1.一种基于Coarse2Fine网络的相似问题匹配方法,其特征在于,包括以下步骤:步骤1:上传数据集至数据库中,运用数据集训练得到对应的Coarse2Fine模型;步骤2:通过Coarse2Fine模型接口的上传接口上传待处理语句,运用Coarse2Fine模型中的BM25模型将待处理语句与数据库中的语句进行粗粒度的相似度匹配,得到数条匹配语句,将待处理语句、数条匹配语句作为Coarse2Fine模型的ESIM网络的输入,其中,运用Coarse2Fine模型中的BM25模型将待处理语句与数据库中的语句进行粗粒度的相似度匹配,得到数条匹配语句,具体为:将待处理语句与数据库中某一语句进行语素分析,再求两个语句之间相关性的得分,得分计算公式如下: 其中,Q表示输入的语句,d表示数据库中的待匹配语句,qi表示问句匹配的基本单位,Wi表示qi的权重;Rqi,d表示语素qi与d的相关性得分;最后根据相关性的得分高低,提取出得分高的且满足需求的数条匹配语句;步骤3:在ESIM网络中提取待处理语句、匹配语句的特征值,将待处理语句的特征值逐一与数条匹配语句的特征值计算差异性值,其中,在ESIM网络中提取待处理语句、匹配语句的特征值具体方法如下:ESIM网络使用词嵌入和BiLSTM根据上下文重新学习待处理语句、匹配语句的单词表示,得到待处理语句、匹配语句的编码表示,具体公式如下: 其中,a和b分别表示输入的两个语句,i和j表示句子中某个词语的序号,la和lb表示句子a和b的长度,和则分别为输入语句a和b中某个单词的向量表示;根据注意力权重得到待处理语句、匹配语句的加权编码表示,具体方法为:运用attention机制,计算待处理语句、匹配语句的词向量联系: 其中,表示输入语句a各个词向量的转置和输入语句b中各个词向量之间的乘积;再根据如下公式计算待处理语句、匹配语句的权重加权后的值,得到待处理语句、匹配语句的加权编码表示的具体公式如下: 其中,和分别表示输入语句a和b中某个词的加权编码表示;将和分别进行差和点积运算,得到差异性值ma和mb,差异性值计算公式如下: 其中,和分别表示输入语句a和b的编码值和加权编码值;将编码表示和加权编码表示作为特征值;步骤4:在ESIM网络中提取出差异性值小的匹配语句,作为相似语句的输出结果。

全文数据:

权利要求:

百度查询: 江苏科技大学 基于Coarse2Fine网络的相似问题匹配方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。