首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种记者采访语音增强方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:电子科技大学

摘要:本发明属于数字音频处理技术领域,具体提供一种记者采访语音增强方法,用以改善背景噪声复杂多变的采访语音的增强效果。本发明提供的记者采访语音增强方法中,通过说话人识别将输入语音按说话人类别进行分段,在此基础上,对属于语音库中说话人的语音采用个性化语音增强方法进行增强,对不属于语音库中说话人的语音采用无监督语音增强方法进行增强,从而结合了有监督和无监督两类语音增强方法的优点,达到了更好的语音增强效果;同时,在个性化语音增强处理后,利用提取的背景噪声信息对无监督语音增强预训练模型进行微调,提高了无监督语音增强模型的性能,增强了该方法对复杂噪声环境的适应性。

主权项:1.一种记者采访语音增强方法,其特征在于,包括以下步骤:A1.语音分段;A1-1.设语音库中包含S个说话人的多条纯净语音,每条纯净语音均为单个说话人的语音,根据语音库中的语音训练得到说话人识别模型;A1-2.将输入语音按固定长度进行分段,得到K个语音段;A1-3.对每一个语音段作:对第k、1≤k≤K个段,将该段的音频数据输入到说话人识别模型中进行说话人识别,得到第k个语音段对应的说话人编号sk及预测概率pk;将预测概率pk与预测阈值P作比较,若pk小于P,则更新说话人编号sk为S+1;A1-4.按时间顺序依次扫描各个语音段对应的说话人编号,将说话人编号相同的连续语音段合并为一段,得到L个语音段;A2.读取语音段;A2-1.初始化i=1;A2-2.读取第i个语音段的数据Xi及其对应的说话人编号si;A3.判断说话人是否在库中:若si≤S,则转到步骤A4进行语音增强,否则转到步骤A6进行语音增强;A4.个性化语音增强:从语音库中取出编号为si的说话人的任意一条纯净语音Ri,将语音段Xi和纯净语音Ri输入到个性化语音增强模型中进行增强,得到增强语音段Ei;A5.微调无监督模型;A5-1.构造微调训练样本:计算噪声Yi:Yi=Xi-Ei,从语音库中随机抽取m条纯净语音,将每一条语音与噪声Yi相加,生成m条加噪语音,将每条纯净语音与其加噪语音组成一个微调训练样本,共得到m个微调训练样本;A5-2.用微调训练样本对无监督语音增强预训练模型进行微调,得到微调后的无监督语音增强模型,转到步骤A7;A6.无监督增强:将语音段Xi输入到无监督语音增强模型中进行增强,得到增强语音段Ei;A7.语音段拼接:将增强语音段Ei追加到语音序列W中;A8.判断是否处理完语音段:若i小于语音段数目L,则更新i为i+1,转到A2-2,否则输出语音序列W。

全文数据:

权利要求:

百度查询: 电子科技大学 一种记者采访语音增强方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。