首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种用于低资源语音命令识别的量子多核学习方法 

申请/专利权人:西北工业大学;西北工业大学深圳研究院

申请日:2024-03-08

公开(公告)日:2024-06-25

公开(公告)号:CN118248127A

主分类号:G10L15/06

分类号:G10L15/06;G06N10/60;G06N20/10;G06F18/2411;G06F18/214;G10L15/02;G10L15/08;G10L15/22;G10L25/24

优先权:

专利状态码:在审-公开

法律状态:2024.06.25#公开

摘要:本发明公开了一种用于低资源语音命令识别的量子多核学习方法,可以在有限的训练数据情况下,利用量子多核算法对低资源语音信号进行处理,较经典机器学习方法获得更高的算法识别精度。包括如下步骤:1提取语音的MFCC特征;2构建量子多核模型,通过使用量子测量投影将MFCC等声学特征映射到潜在特征嵌入;3在模型训练阶段训练原型网络模型,在核SVM的训练过程中,以原型损失函数作为优化目标,最大化潜在特征空间的类间距离;实验结果表明,在有限数据的情况下,基于量子多核的低资源语音识别算法明显优于现有方法,QMKL的平均测试准确率分别提高了9.8%和10.7%,从而验证了QMKL在训练数据充足和有限情况下的优越性。

主权项:1.一种用于低资源语音命令识别的量子多核学习方法,其特征在于,包括如下步骤:步骤1:提取语音的MFCC特征;步骤2:构建量子多核模型;量子多重核函数的数学形式表示为:kxi,xj=Φxi,Φxj 其中θm表示参数化每个量子核函数,xixj均表示特征数据,kxi,xj为Φxi和Φxj的内积,表示核函数k:Φ·表示核方法中的特征映射;km表示第m个核函数,M表示核的数目;代表组合核函数;所述量子多核函数通过QKL架构m次生成,更新后的分类函数f为: 其中xn、x均表示特征数据,βn表示N维向量β的一个元素,N表示核的数目;步骤3:利用量子多核模型,通过量子测量投影将MFCC声学特征映射到潜在特征嵌入中;步骤4:训练原型网络;在每个训练阶段中对量子内核进行调整,通过最大化类间距离和最小化潜在特征空间中的类间相似性增强特征表示对QMKL参数进行优化;步骤5:对核SVM进行训练分类;步骤6:收集全连接层之后的特征,使用T-SNE在高维空间中可视化特征数据,再将可视化特征数据送入语音口语识别器中,获得模型的识别精度。

全文数据:

权利要求:

百度查询: 西北工业大学;西北工业大学深圳研究院 一种用于低资源语音命令识别的量子多核学习方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。