买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京小米移动软件有限公司;北京小米松果电子有限公司
摘要:本公开是关于一种语音识别模型训练方法、语音识别方法、装置及存储介质。其中,语音识别模型训练方法包括:获取多通道语音样本集,将所述多通道语音样本集输入到第一深度残差网络编码器中,得到第一样本特征集,对所述多通道语音样本集进行转换处理,得到单通道语音样本集,将所述单通道语音样本集输入到第二深度残差网络编码器中,得到第二样本特征集;从所述第一样本特征集和所述第二样本特征集中选择目标样本特征集;将所述目标样本特征集输入至预设的递归神经网络模型,对所述递归神经网络模型进行训练直至收敛,得到语音识别模型。通过本公开的语音识别模型训练方法进行语音识别,能够提高语音识别性能。
主权项:1.一种语音识别模型训练方法,其特征在于,所述语音识别模型训练方法包括:获取多通道语音样本集,其中,所述多通道语音样本集包括多个多通道语音样本,每个多通道语音样本包括一段多通道语音数据以及对应的文本数据,所述文本数据为所述多通道语音数据中所包含的文字形式自然语言;每段所述多通道语音数据包含一个扬声器的信号参考通道和至少一个麦克风的信号通道;将所述多通道语音样本集输入到第一深度残差网络编码器中,得到第一样本特征集,其中,所述第一深度残差网络编码器用于将不同维度的多通道语音样本转化为相同维度的特征,所述第一样本特征集包含多个第一样本特征,每个样本特征对应一个所述多通道语音样本;对所述多通道语音样本集进行转换处理,得到单通道语音样本集,其中,所述单通道语音样本集包括多个单通道语音样本,每个单通道语音样本包括:一段单通道语音数据以及对应的文本数据,所述文本数据为所述多通道语音数据中所包含的文字形式自然语言,每段单通道语音样本对应于所述单通道语音样本中包含的自然语言含义相同的多通道语音样本;将所述单通道语音样本集输入到第二深度残差网络编码器中,得到第二样本特征集;从所述第一样本特征集和所述第二样本特征集中选择目标样本特征集;将所述目标样本特征集输入至预设的递归神经网络模型,对所述递归神经网络模型进行训练直至收敛,得到语音识别模型。
全文数据:
权利要求:
百度查询: 北京小米移动软件有限公司 北京小米松果电子有限公司 语音识别模型训练方法、语音识别方法、装置及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。