买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:世优(北京)科技股份有限公司
摘要:本发明公开了一种基于AI的语音意图的识别方法及装置。其中,该方法包括:获取待识别的语音;基于待识别的语音,利用基于深度学习的语音意图识别模型,来识别待识别的语音的意图;其中,语音意图识别模型是通过以下得到的:对第一句子向量和第二句子向量进行张量转换得到第一句子张量和第二句子张量;分别对第一句子张量和第二句子张量进行张量分解,计算分解后的第一句子张量和分解后的第二句子张量之间的主成分差异,并基于主成分差异对训练样本进行决策边界增强,得到语音意图识别模型的损失;基于语音意图识别模型的损失来更新语音意图识别模型的网络参数。本发明解决了现有技术中语音意图识别不准确的技术问题。
主权项:1.一种基于AI的语音意图的识别方法,其特征在于,包括:获取待识别的语音;基于所述待识别的语音,利用基于深度学习的语音意图识别模型,来识别所述待识别的语音的意图;其中,所述语音意图识别模型是通过迭代执行以下步骤直至所述语音意图识别模型的损失达到预设的损失阈值而得到的:获取训练样本,所述训练样本包括与语音信号对应的语音识别文本以及人工识别文本;利用所述语音意图识别模型分别提取所述语音识别文本的第一句子向量和所述人工识别文本的第二句子向量,并分别对所述第一句子向量和所述第二句子向量进行张量转换得到第一句子张量和第二句子张量;分别对所述第一句子张量和所述第二句子张量进行张量分解,计算分解后的所述第一句子张量和分解后的所述第二句子张量之间的主成分差异,并基于所述主成分差异对所述训练样本进行决策边界增强,得到所述语音意图识别模型的损失;基于所述语音意图识别模型的损失来更新所述语音意图识别模型的网络参数;其中,分别对所述第一句子向量和所述第二句子向量进行张量转换得到第一句子张量和第二句子张量,包括:按照预设的扩展维度,分别对所述第一句子向量和所述第二句子向量进行张量维度扩展,并分别对维度扩展后的所述第一句子向量和所述第二句子向量进行融合和激活;将经过融合和激活的所述第一句子向量和所述第二句子向量进行张量的标准化处理,得到所述第一句子张量和所述第二句子张量;其中,分别对维度扩展后的所述第一句子向量和所述第二句子向量进行融合和激活,包括:将所述扩展维度中的每个维度作为特征通道,通过卷积操作,分别对维度扩展后的所述第一句子向量和所述第二句子向量进行多维特征的融合,得到融合后的所述第一句子向量和融合后的所述第二句子向量;分别对融合后的所述第一句子向量和融合后的所述第二句子向量进行激活以引入非线性特征,得到激活的所述第一句子向量和激活的所述第二句子向量;其中,分别对所述第一句子张量和所述第二句子张量进行张量分解,包括:分别将所述第一句子张量和所述第二句子张量沿着所述扩展维度方向展开,得到所述第一句子张量的多个矩阵和所述第二句子张量的多个矩阵;分别对所述第一句子张量的多个矩阵和所述第二句子张量的多个矩阵中的每个矩阵进行奇异值分解,得到所述第一句子张量的多个因子矩阵以及所述第二句子张量的多个因子矩阵;基于所述第一句子张量的多个因子矩阵计算所述第一句子张量的核心向量,并基于所述第二句子张量的多个因子矩阵计算所述第二句子张量的核心向量;将所述第一句子张量的核心向量和所述第一句子张量的多个因子矩阵作为分解后的所述第一句子张量,并将所述第二句子张量的核心向量和所述第二句子张量的多个因子矩阵作为分解后的所述第二句子张量。
全文数据:
权利要求:
百度查询: 世优(北京)科技股份有限公司 基于AI的语音意图的识别方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。