一种用于低资源语音命令识别的量子多核学习方法

导航：龙图腾网> 最新专利技术> 一种用于低资源语音命令识别的量子多核学习方法

申请/专利权人：西北工业大学;西北工业大学深圳研究院

申请日：2024-03-08

公开（公告）日：2024-06-25

公开（公告）号：CN118248127A

主分类号：G10L15/06

分类号：G10L15/06;G06N10/60;G06N20/10;G06F18/2411;G06F18/214;G10L15/02;G10L15/08;G10L15/22;G10L25/24

优先权：

专利状态码：在审-公开

法律状态：2024.06.25#公开

摘要：本发明公开了一种用于低资源语音命令识别的量子多核学习方法，可以在有限的训练数据情况下，利用量子多核算法对低资源语音信号进行处理，较经典机器学习方法获得更高的算法识别精度。包括如下步骤：1提取语音的MFCC特征；2构建量子多核模型，通过使用量子测量投影将MFCC等声学特征映射到潜在特征嵌入；3在模型训练阶段训练原型网络模型，在核SVM的训练过程中，以原型损失函数作为优化目标，最大化潜在特征空间的类间距离；实验结果表明，在有限数据的情况下，基于量子多核的低资源语音识别算法明显优于现有方法，QMKL的平均测试准确率分别提高了9.8％和10.7％，从而验证了QMKL在训练数据充足和有限情况下的优越性。

主权项：1.一种用于低资源语音命令识别的量子多核学习方法，其特征在于，包括如下步骤：步骤1：提取语音的MFCC特征；步骤2：构建量子多核模型；量子多重核函数的数学形式表示为：kxi，xj＝Φxi，Φxj 其中θm表示参数化每个量子核函数，xixj均表示特征数据，kxi，xj为Φxi和Φxj的内积，表示核函数k：Φ·表示核方法中的特征映射；km表示第m个核函数，M表示核的数目；代表组合核函数；所述量子多核函数通过QKL架构m次生成，更新后的分类函数f为：其中xn、x均表示特征数据，βn表示N维向量β的一个元素，N表示核的数目；步骤3：利用量子多核模型，通过量子测量投影将MFCC声学特征映射到潜在特征嵌入中；步骤4：训练原型网络；在每个训练阶段中对量子内核进行调整，通过最大化类间距离和最小化潜在特征空间中的类间相似性增强特征表示对QMKL参数进行优化；步骤5：对核SVM进行训练分类；步骤6：收集全连接层之后的特征，使用T-SNE在高维空间中可视化特征数据，再将可视化特征数据送入语音口语识别器中，获得模型的识别精度。

全文数据：

权利要求：

百度查询：西北工业大学;西北工业大学深圳研究院一种用于低资源语音命令识别的量子多核学习方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：铠甲式轮胎保护链

下一篇：一种工业物联网网关

相关技术

铠甲式轮胎保护链

一种工业物联网网关

一种可快速拼接的安装架

一种刀片可调节的修边机

一种具有分级过滤功能的纳滤膜元件

一种颈部支撑可调节的枕头

用于车辆顶板的显示装置和车辆

一种钻机润滑专用压缩机

一种金属管件抛光打磨装置

一种铝箔手提袋

一种人造花定印装置

一种芦笋种植用废料混合装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种用于低资源语音命令识别的量子多核学习方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务