首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于双判别器生成对抗网络的蒙古语语音识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:内蒙古工业大学

摘要:本发明公开了一种基于双判别器生成对抗网络的蒙古语语音识别方法,应用于蒙古语语音识别领域,包括:语音生成器根据域外说话人特征和蒙古语文本序列,生成域外说话人蒙古语语音;目标特征判别器根据域外说话人特征和域外说话人蒙古语语音的说话人特征,输出第一判定结果;辅助特征判别器根据蒙古语文本序列对应的Mel频谱图和域外说话人蒙古语语音的Mel频谱图,输出第二判定结果;根据判定结果对语音生成器的参数调整优化,得到基于双判别器生成对抗网络的语音数据增广模型;输入待测集至语音数据增广模型,得到蒙古语语音识别结果。本发明在保证生成语音满足域外说话人特征的情况下,减少了生成语音中的误读现象,提高了语音识别准确率。

主权项:1.一种基于双判别器生成对抗网络的蒙古语语音识别方法,其特征在于,包括:步骤1:语音生成器根据域外说话人特征和蒙古语文本序列,生成域外说话人蒙古语语音;步骤2:目标特征判别器根据所述域外说话人特征和所述域外说话人蒙古语语音的说话人特征,输出第一判定结果;辅助特征判别器根据所述蒙古语文本序列对应的Mel频谱图和所述域外说话人蒙古语语音的Mel频谱图,输出第二判定结果;步骤3:根据所述第一判定结果和所述第二判定结果对所述语音生成器的参数进行调整优化,得到基于双判别器生成对抗网络的语音数据增广模型;步骤4:输入待测集至所述语音数据增广模型,得到蒙古语语音识别结果;步骤2中,所述目标特征判别器根据所述域外说话人特征和所述域外说话人蒙古语语音的说话人特征,输出第一判定结果,具体为:将所述域外说话人特征和所述域外说话人蒙古语语音的说话人特征输入至二维卷积层,通过Relu激活函数和批量归一化输出特征向量;将所述特征向量输入至GRU网络,使用层归一化法,计算所述GRU网络的隐藏层中神经元节点输入的平均值和方差,利用标准化操作标准化所述特征向量;将标准化后的所述特征向量输入至全连接层,将特征映射到全连接层的特征空间,使用Relu激活函数对特征空间内的说话人特征进行分类;步骤2中,所述辅助特征判别器根据所述蒙古语文本序列对应的Mel频谱图和所述域外说话人蒙古语语音的Mel频谱图,输出第二判定结果,具体为:将所述蒙古语文本序列对应的Mel频谱图和所述域外说话人蒙古语语音的Mel频谱图输入至由三个一维卷积层和一个全连接层组成的卷积神经网络结构;每个所述卷积层输入的特征通过BN和Relu激活函数处理特征;卷积后的特征通过所述全连接层,采用Sigmoid激活函数分为正常和误读两类。

全文数据:

权利要求:

百度查询: 内蒙古工业大学 一种基于双判别器生成对抗网络的蒙古语语音识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。