【发明授权】一种端到端语音识别方法、系统及存储介质_网络通信与安全紫金山实验室_202210202455.6

申请/专利权人：网络通信与安全紫金山实验室

申请日：2022-03-03

公开（公告）日：2024-06-07

公开（公告）号：CN114596839B

主分类号：G10L15/02

分类号：G10L15/02;G10L15/06;G10L19/16;G06N3/0442;G06N3/0464;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.06.07#授权;2022.06.24#实质审查的生效;2022.06.07#公开

摘要：本发明提供一种端到端语音识别方法及系统，包括：基于VGGNet模型使用源语料库训练初始语音特征提取模型；移除所述初始语音特征提取模型中的全连接层并冻结预设数量的卷积层参数，使用目标语料库对经过移除和冻结后的初始语音特征提取模型进行训练，得到频域特征提取网络；构建端到端语音识别框架，所述框架包括编码器和解码器；使用目标语料库训练所述端到端语音识别框架，并基于训练好的端到端语音识别框架进行端到端语音识别。本发明可以有效解决数据受限情况下的模型过拟合问题，同时提高了语音识别的正确率且具有很好的噪声鲁棒性。

主权项：1.一种端到端语音识别方法，其特征在于，所述方法包括以下步骤：基于VGGNet模型使用源语料库训练初始语音特征提取模型；移除所述初始语音特征提取模型中的全连接层并冻结预设数量的卷积层参数，使用目标语料库对经过移除和冻结后的初始语音特征提取模型进行训练，得到频域特征提取网络；构建端到端语音识别框架，在所述频域特征提取网络后连接预设数量的循环卷积网络作为时域特征提取网络，所述频域特征提取网络和时域特征提取网络构成所述端到端语音识别框架的编码器；在所述编码器后连接预设数量的循环卷积网络、全连接网络、语音识别准则层构成端到端语音识别框架的解码器；使用目标语料库训练所述端到端语音识别框架，并基于训练好的端到端语音识别框架进行端到端语音识别。

全文数据：

权利要求：

百度查询：网络通信与安全紫金山实验室一种端到端语音识别方法、系统及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种用于建筑外墙施工的水泥输送设备_中铁五局集团第二工程有限责任公司_202410292775.4

下一篇：一种2或3头短幅内摆线螺杆泵型线设计方法_大庆石油管理局有限公司_202211592309.5

相关技术

一种用于建筑外墙施工的水泥输送设备_中铁五局集团第二工程有限责任公司_202410292775.4

一种2或3头短幅内摆线螺杆泵型线设计方法_大庆石油管理局有限公司_202211592309.5

一种金铈纳米复合材料的制备方法_陕西中医药大学_202410222687.7

双面组件平单轴跟踪支架的间距确定方法、装置及设备_龙源(北京)新能源工程设计研究院有限公司_202410223271.7

一种基于枝状界面层控制的钛钢复合板及其焊接方法_西安建筑科技大学_202410100672.3

一种纳米硅@SiOx/MXene复合负极材料及其制备方法_昆明理工大学_202410350580.0

一种输电线路远距离监测装置_国网浙江省电力有限公司双创中心_202410239417.7

一种模拟指令淡化电路及指令淡化方法_中国航空工业集团公司西安飞行自动控制研究所_202410098406.1

故障的检测方法、装置、存储介质和处理器_广东电网有限责任公司_202410223104.2

一种应用于房产交易风控系统的客户详情展示方法_成都旺小宝科技有限公司_202410153589.2

可折叠的电子设备及其控制方法_OPPO广东移动通信有限公司_202211611706.2

一种隔膜的制备方法、隔膜及其电池_深圳市豪鹏科技股份有限公司_202410185367.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】一种端到端语音识别方法、系统及存储介质_网络通信与安全紫金山实验室_202210202455.6

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务