买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京邮电大学
摘要:本发明提供了一种结合文本纠错的流式语音识别方法。该方法包括:将待识别的音频数据进行分块处理后,将各个块的音频数据输入到流式语音识别系统,流式语音识别系统输出各个块的识别文本;将各个块的识别文本划分为等长文本块,再输入到纠错模型;纠错模型通过编码模块输出各个块的编码表示,再通过解码模块将各个块的编码表示逐块进行解码,利用记忆库计算当前帧与历史帧的相关性,输出纠错处理后的各个块;将纠错处理后的各个块发送至边缘补偿模块,边缘补偿模块利用历史块共同解码结果对各个块的右边缘进行修正补偿,得到各个块的音频数据的最终的识别文本。本发明方法实现了纠错模型的流式输出,使用边缘补偿机制解决了边缘错误纠正的问题。
主权项:1.一种结合文本纠错的流式语音识别方法,其特征在于,包括:将待识别的音频数据进行分块处理后,将各个块的音频数据输入到流式语音识别系统,所述流式语音识别系统输出各个块的识别文本;将各个块的识别文本划分为等长文本块,将所述等长文本块输入到纠错模型;所述纠错模型通过编码模块输出各个块的编码表示,再通过解码模块将各个块的编码表示逐块进行解码,利用记忆库计算当前帧与历史帧的相关性,输出纠错处理后的各个块;将所述纠错处理后的各个块发送至边缘补偿模块,所述边缘补偿模块利用历史块共同解码结果对各个块的右边缘进行修正补偿,得到各个块的音频数据的最终的识别文本。
全文数据:
权利要求:
百度查询: 北京邮电大学 一种结合文本纠错的流式语音识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。