基于多层次注意力和层次类别特征的小样本意图识别方法

导航：龙图腾网> 最新专利技术> 基于多层次注意力和层次类别特征的小样本意图识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：北京理工大学

摘要：本发明涉及一种基于多层次注意力和层次类别特征的小样本意图识别方法，属于自然语言处理和问答系统技术领域。第一，引入词级、短语级、语义角色级别的三层注意力机制，从词频、反文档频率、类内分布均匀度、类间分布均匀度共四个角度融合层次类别特征，计算混合特征因子，充分挖掘不同层次、不同粒度、不同角度的文本特征，能够有效提升小样本意图识别的准确率。第二，不同于对样本表示取均值生成类别表示的方法，本发明基于胶囊网络中动态路由的思想，学习样本表示和类别表示之间的非线性映射关系，提高从样本中归纳学习类别表示的能力。

主权项：1.基于多层次注意力和层次类别特征的小样本意图识别方法，其特征在于该方法的步骤包括：步骤1：构建支撑集和查询集；步骤2：获得步骤1中构建的支撑集和查询集中文本的句法短语标签序列，生成短语标签嵌入矩阵；步骤3：获得步骤1中构建的支撑集和查询集中文本的语义角色标签序列，生成语义角色标签嵌入矩阵；步骤4：生成支撑集和查询集中文本的词级别的语义特征向量；步骤5：生成支撑集和查询集中文本的短语级别的语义特征向量；步骤6：生成支撑集和查询集中文本的语义角色级别的语义特征向量；步骤7：生成支撑集和查询集中文本的混合语义特征向量即样本向量，生成查询问句的混合语义特征向量即查询向量；步骤8：将支撑集中样本的混合语义特征向量映射为意图类别表示；首先，将支撑集中的样本向量sju输入到胶囊网络之后，使用转换权重Ws对其进行维度变换：其中，样本向量sju为意图类别j支撑集中的第u个样本向量；对于该支撑集里的所有样本向量，转换权重Ws是共享的；转换权重Ws会在训练中不断更新；加权求和得到类别j的预测类向量其中，dju称为耦合系数；其次，使用挤压Squash函数来代替激活函数：其中，x是任一变量；然后，通过非线性挤压函数，可以将预测意图类向量缩放到0～1之间得到意图类向量cj：计算意图类向量cj与各个样本的内积；最后，更新耦合系数Couplingcoefficientdju， dju＝softmaxbju,17步骤9：基于点积相似度方法计算查询问句和意图类别表示的相似度；计算从步骤7中获得的查询向量q与从步骤8中获得的各个意图类别表示cj的相似度：score1＝SIMq,cj,18其中，SIM·表示采用点积计算相似度；步骤10：获取词语的层次类别特征；对于数据集中的标注数据，设共有H个意图类别；首先去除掉停用词，统计其词汇总数M，并给每个特征词t编号，转换成特征词词典DW；对于词典DW中的每一个特征词a，计算其混合特征因子θ，并构建混合特征因子字典计算特征词词频、反文档频率、类别频率因子、类内分布均匀因子，相乘后获得所有特征词的混合特征因子，并构建混合特征因子字典；首先，特征词词频的计算方法如公式19所示：其中，fa,cj表示在类别cji＝1,2,3,...,H，H为意图类别数量中特征词a出现的次数；fcj表示在类别cj中所有的词条总数；其次，反文档频率的计算方法如公式20所示：其中，N1表示训练集中样本总数，N2表示所有意图类别中包含特征词t的样本数；然后，类别频率因子β的计算方法如公式21所示：其中，Na,cj表示在类别cj中包含特征词a的样本数，Ncj表示类别cj中包含的样本总数，Na,co表示在除了类别cj之外的其他类别样本集中，包含特征词a的样本数；最后，类内分布均匀因子γ的计算方法如公式22所示：其中，fa,cjm表示在类别cj中第m个样本中特征词a的词频，为类别cj中样本总数，表示在类别ci中特征词α的平均词频，ε是一个较小的常数；混合特征因子的计算方法如公式23所示：θ＝TF*IDF*β*γ,23步骤11：计算基于层次类别特征的查询问句和意图类别的相似度；对于类别cj中的所有支撑集样本，根据混合特征因子字典构建样本的混合特征因子序列，取均值后作为该类别的表示对于待分类的查询问句，计算其混合特征因子序列qθ，与各个类别表示计算相似度：其中，SIM·表示采用点积计算相似度；步骤12：生成查询问句所属意图类别的概率分布融合步骤9中的相似度分数和步骤12中的相似度分数，经过softmax函数后，获得一个查询问句属于每个类别的最终概率分布；对于意图待分类的查询问句，在步骤9中获得相似度分数score1，在步骤12中获得相似度分数score2；融合两个相似度分数，获得查询问句与各个类别的意图最终相似度分数score：score＝score1+λscore2,25其中，λ为平衡因子；经过softmax函数后，得到该查询问句属于每个类别的概率分布fE：fE＝softmaxscore26。

全文数据：

权利要求：

百度查询：北京理工大学基于多层次注意力和层次类别特征的小样本意图识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种鱼类产卵行为与生态水文指标响应关系量化方法

下一篇：一种用于光伏板边框的铝合金型材

相关技术

一种鱼类产卵行为与生态水文指标响应关系量化方法

一种用于光伏板边框的铝合金型材

一种硼酸钾/石墨烯纳米复合润滑添加剂及其制备方法和复合润滑油

慢性低度炎症刺激形成衰老成纤维细胞模型的构建方法

一种道路靶向安全警示系统、其使用方法及多个系统之间建立私有局域网的使用方法

一种新型鹅星状病毒疫苗及其制备方法与应用

一种线控转向系统动态负载模拟装置及控制方法

一种磷酸铈钴锂改性类单晶富锂锰基正极材料的制备方法及其产物

一种基于可逆热致变色微胶囊的复合绝缘材料及其制备方法

一种铅碳电池用改性多孔炭的制备方法及铅碳电池

一种靶向铜绿假单胞菌凝集素的仿生多功能纳米制剂及其制备方法和应用

一种应用于水利水电地下洞室高薄岩墙开挖方法

特征相关技术

基于EEG敏感导联的特征选择和特征融合方法_北京工业大学_202211054620.4

基于特征选择与特征提取的情绪分类方法_西安理工大学_202410694393.4

生成特征向量和基于特征向量进行文本分类的方法和装置_北京京东尚科信息技术有限公司_201810034609.9

一种基于PCC提取负荷周期特征与时变趋势特征的精准短期负荷预测方法_郑州轻工业大学_202410678317.4

具有防短路特征部的钉仓_爱惜康有限责任公司_201980021220.3

特征评估方法、装置、电子设备及存储介质_北京达佳互联信息技术有限公司_202010642000.7

身体特征采集式心理测试装置_合肥霁宸教育科技有限公司_202420602809.0

一种基于机器学习的特征增强方法_内蒙古卫数数据科技有限公司_202310969773.X

具有曲面特征薄壁件的增材方法_苏州融速智造科技有限公司_202410751353.9

特征处理方法、装置、设备和存储介质_腾讯科技(深圳)有限公司_202410560941.4

类别相关技术

一种多类别发票识别方法、系统、电子设备和存储介质_北京思特奇信息技术股份有限公司_202410606931.X

基于多层次注意力和层次类别特征的小样本意图识别方法_北京理工大学_202211452106.6

一种可指定类别零样本海面舰船提取方法_长光卫星技术股份有限公司_202410686782.2

多类别电力负荷的自适应预测方法、系统、设备及介质_国网浙江省电力有限公司双创中心_202410926935.6

基于WSAGAN的类别不平衡加密流量数据增强方法及系统_中国人民解放军战略支援部队信息工程大学_202410647734.2

基于类别引导与词汇增强的农业病害命名实体识别方法_河北农业大学_202410731098.1

图像中像素的实例类别确定方法、装置、设备及存储介质_腾讯科技(深圳)有限公司_202011040874.1

一种根据故障码类别进行永久故障信息和非永久故障信息自行删除方法_中国第一汽车股份有限公司_202210575228.8

一种基于隧洞埋深及风化层的围岩类别判断方法和应用_中水北方勘测设计研究有限责任公司_202410808615.0

基于信道接入优先级类别的侧链路逻辑信道优先级排序_联想(新加坡)私人有限公司_202380020466.5

样本相关技术

样本分析仪及样本架转运结构_深圳迈瑞生物医疗电子股份有限公司_201880074688.4

样本分析仪及样本分析方法_深圳市帝迈生物技术有限公司_202410918567.0

样本复温装置_中国科学院理化技术研究所_202310252552.0

用于样本检测设备的散热系统和样本检测设备_湖南元景智造科技有限公司_202323631281.4

用于样本分装的温控系统、样本分装系统及方法_深圳赛桥生物创新技术有限公司_202310309473.9

一种试剂样本盘_宏葵生物(中国)股份有限公司_202323447744.1

一种样本转运装置_广州金墁利医药科技有限公司_202420282525.8

样本检测方法及相关装置_深圳麦科田生物医疗技术股份有限公司_202410604401.1

一种生物样本储存设备_上海原能细胞生物低温设备有限公司_202410929395.7

基因测序仪、样本载体紧固装置_郑州思昆生物工程有限公司_202410840439.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于多层次注意力和层次类别特征的小样本意图识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务