一种记者采访语音增强方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：电子科技大学

摘要：本发明属于数字音频处理技术领域，具体提供一种记者采访语音增强方法，用以改善背景噪声复杂多变的采访语音的增强效果。本发明提供的记者采访语音增强方法中，通过说话人识别将输入语音按说话人类别进行分段，在此基础上，对属于语音库中说话人的语音采用个性化语音增强方法进行增强，对不属于语音库中说话人的语音采用无监督语音增强方法进行增强，从而结合了有监督和无监督两类语音增强方法的优点，达到了更好的语音增强效果；同时，在个性化语音增强处理后，利用提取的背景噪声信息对无监督语音增强预训练模型进行微调，提高了无监督语音增强模型的性能，增强了该方法对复杂噪声环境的适应性。

主权项：1.一种记者采访语音增强方法，其特征在于，包括以下步骤：A1.语音分段；A1-1.设语音库中包含S个说话人的多条纯净语音，每条纯净语音均为单个说话人的语音，根据语音库中的语音训练得到说话人识别模型；A1-2.将输入语音按固定长度进行分段，得到K个语音段；A1-3.对每一个语音段作：对第k、1≤k≤K个段，将该段的音频数据输入到说话人识别模型中进行说话人识别，得到第k个语音段对应的说话人编号sk及预测概率pk；将预测概率pk与预测阈值P作比较，若pk小于P，则更新说话人编号sk为S+1；A1-4.按时间顺序依次扫描各个语音段对应的说话人编号，将说话人编号相同的连续语音段合并为一段，得到L个语音段；A2.读取语音段；A2-1.初始化i＝1；A2-2.读取第i个语音段的数据Xi及其对应的说话人编号si；A3.判断说话人是否在库中：若si≤S，则转到步骤A4进行语音增强，否则转到步骤A6进行语音增强；A4.个性化语音增强：从语音库中取出编号为si的说话人的任意一条纯净语音Ri，将语音段Xi和纯净语音Ri输入到个性化语音增强模型中进行增强，得到增强语音段Ei；A5.微调无监督模型；A5-1.构造微调训练样本：计算噪声Yi：Yi＝Xi-Ei，从语音库中随机抽取m条纯净语音，将每一条语音与噪声Yi相加，生成m条加噪语音，将每条纯净语音与其加噪语音组成一个微调训练样本，共得到m个微调训练样本；A5-2.用微调训练样本对无监督语音增强预训练模型进行微调，得到微调后的无监督语音增强模型，转到步骤A7；A6.无监督增强：将语音段Xi输入到无监督语音增强模型中进行增强，得到增强语音段Ei；A7.语音段拼接：将增强语音段Ei追加到语音序列W中；A8.判断是否处理完语音段：若i小于语音段数目L，则更新i为i+1，转到A2-2，否则输出语音序列W。

全文数据：

权利要求：

百度查询：电子科技大学一种记者采访语音增强方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：逆变器动态功率解耦控制方法及装置

下一篇：一种分层架构下的无人机网络动态任务卸载方法

相关技术

逆变器动态功率解耦控制方法及装置

一种分层架构下的无人机网络动态任务卸载方法

一种应用于水利水电地下洞室高薄岩墙开挖方法

一种道路靶向安全警示系统、其使用方法及多个系统之间建立私有局域网的使用方法

基于等几何的变刚度复合材料圆柱壳外压屈曲分析方法

挖掘装置极限工况的结构优化方法、装置、设备及介质

一种预防静脉血栓床上用踝关节辅助锻炼机构

一种1.0-2.0mm厚度热基镀锌原料的生产方法

一种可组装与分离的混合装置及其使用方法

一种多功能磨毛机

一种有效微生物群活性菌剂及其应用方法

一种组合式固定件依附锁定器

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种记者采访语音增强方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务