一种基于分类的齿音抑制方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：电子科技大学

摘要：本发明属于数字音频处理技术领域，提供一种基于分类的齿音抑制方法，用以解决现有技术由于没有对齿音和有用语音进行细粒度的区分、导致在抑制齿音时带来可感知的有用语音信息损失的问题。本发明包括分类器构建和齿音抑制两个阶段，提取训练音频帧的频谱，将齿音频率段的频谱幅度数据编组，计算组内频谱幅度之和，再将各组幅度和拼接形成特征，在此基础上训练齿音分类器；在齿音抑制中，根据齿音分类器输出的齿音类型概率，对待处理音频数据以帧为单位进行细粒度的类型预测，并通过中值滤波对连续帧的预测结果进行平滑，最后通过计算齿音和非齿音的相对能量，对齿音成分进行衰减，从而在保持原语音信息的基础上，有效地抑制了音频中的齿音。

主权项：1.一种基于分类的齿音抑制方法，其特征在于，包括分类器构建和齿音抑制两个阶段；所述分类器构建包括以下步骤：A1.生成训练样本：A1-1.初始化训练特征矩阵R、训练标签矢量L均为空；A1-2.根据训练音频组生成训练特征矩阵R和训练标签矢量L，训练音频组包含先验标注为齿音音频或非齿音音频的训练音频，对每一个训练音频作：A1-2-1.将音频数据按固定长度划分为各音频帧，相邻帧间有重叠，得到I个音频帧；并对各音频帧数据进行加窗处理，再进行短时傅里叶变换，得到其对应的频谱；A1-2-2.设频谱幅度数据中对应每个时刻共有N+1个数据，预设特征频率范围为[f1,f2]，则分别计算特征频率点与其中，f1和f2分别为最低特征频率和最高特征频率，为向下取整运算；A1-2-3.对每一个音频帧作：A1-2-3-1.对第i、1≤i≤I个音频帧，从到将每M个频率点对应的频谱幅度数据编成一组，当剩余频率点数目不足M时停止编组，其中，M为预设的编组长度；计算每一个组中所有频率点对应的幅度数据之和，将各个组的求和结果数据依次排列构成训练特征矢量ri；A1-2-3-2.将训练特征矢量ri按列追加到训练特征矩阵R中；A1-2-3-3.设li为第i个音频帧的类型标签，当前音频帧所属的音频为齿音音频，则置li＝1；否则，置li＝0；A1-2-3-4.将类型标签li追加到训练标签矢量L中；A2.训练齿音分类器：用训练特征矩阵R和训练标签矢量L训练得到分类器Q，该分类器为二分类器，其输入为训练特征矢量、输出为该训练特征矢量被预测为齿音类型的概率；所述齿音抑制包括以下步骤：B1.生成测试样本：B1-1.初始化测试特征矩阵R′为空；B1-2.生成测试特征矩阵R′，具体为：B1-2-1.将待处理音频数据按固定长度划分为各音频帧，相邻帧间有重叠，得到I′个音频帧；对各音频帧数据进行加窗处理，再进行短时傅里叶变换，得到其对应的频谱，其中，第i个音频帧的频谱幅度数据为ci；B1-2-2.对每一个音频帧作：B1-2-2-1.对第i、1≤i≤I′个音频帧，从到将每M个频率点对应的频谱幅度数据编成一组，当剩余频率点数目不足M时停止编组；计算每一个组中的所有频率点对应的幅度数据之和，将各个组的求和结果数据依次排列构成测试特征矢量ri′；B1-2-2-2.将ri′按列追加到测试特征矩阵R′中；B2.音频帧分类：B2-1.定义长度为I′的齿音类型数组K；B2-2.对每一个音频帧作：B2-2-1.将R′的第i列特征矢量ri′输入到分类器Q中，得到该特征矢量被预测为齿音类型的概率pi；B2-2-2.对齿音类型数组K的第i个元素K[i]赋值：其中，T0和T2分别为设定的可信非齿音概率阈值和可信齿音概率阈值；B2-3.对齿音类型数组K的数据进行中值滤波；B3.衰减齿音：B3-1.初始化i＝1，参考能量Y0＝1；B3-2.计算特征矢量ri′的所有元素的值之和，记为Yi；B3-3.若K[i]＝1，则更新Y0为Yi；否则，转到步骤B3-4；B3-4.若K[i]＝2，则更新频谱幅度数据矢量ci的第个至第个元素：其中，ci[j]为ci的第j个元素；否则，转到步骤B3-5；B3-5.更新i为i+1，并判断i是否大于I′，若是，转到步骤B3-6；否则，转到步骤B3-2；B3-6.使用更新后的频谱数据进行短时傅里叶逆变换，得到处理后的音频。

全文数据：

权利要求：

百度查询：电子科技大学一种基于分类的齿音抑制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种避免结焦的草酸酯蒸发器及草酸酯气化方法

下一篇：一种像控点坐标生成方法、系统、设备及存储介质

相关技术

一种避免结焦的草酸酯蒸发器及草酸酯气化方法

一种像控点坐标生成方法、系统、设备及存储介质

装置、方法和计算机程序

一种基于自适应特征选择的单样本部件分割方法

一种氧化亚硅负极材料及其制备方法

有向图处理方法、装置、电子设备、存储介质及程序产品

流媒体推流方法、流媒体推流系统和存储介质

带有非自驱动吸入阀的往复式压缩机

一种充油海缆的防扩裂导油装置

一种投影区域的确定方法、装置、设备及存储介质

一种多级循环递进式抽奖系统

基于空间差分技术的动作捕捉方法和系统

齿音相关技术

齿音调整方法、装置、电子设备及计算机可读存储介质_杭州网易云音乐科技有限公司_202110163186.2

一种可消除高频齿音的有源音箱电路架构_深圳市卓乐科技有限公司_202311307336.8

齿音识别、消除方法、系统、介质及设备_上海艾为电子技术股份有限公司_202210375304.0

一种基于稀疏分解的齿音抑制方法_电子科技大学_202310102948.7

一种基于分类的齿音抑制方法_电子科技大学_202310097348.6

一种齿音消除方法和齿音消除装置_上海艾为电子技术股份有限公司_202111564376.1

齿音处理方法、装置、电子设备及存储介质_杭州网易云音乐科技有限公司_202310179188.X

耳机及其可有效减少齿音的耳机帽_深圳市沃听科技有限公司_202222409026.4

基于检测音频信号中的特定声音来调整齿音检测_杜比实验室特许公司_202080051216.4

齿音调整方法、装置、电子设备及计算机可读存储介质_杭州网易云音乐科技有限公司_202110163186.2

抑制相关技术

激酶抑制剂及其用途_戴纳立制药公司_201880047293.5

PRMT5抑制剂_默沙东有限责任公司_201980065660.9

涡激振动的抑制装置_南京航空航天大学_202410973996.8

PARP1抑制剂_突触活化疗法股份有限公司_202280091727.8

一种施工噪音抑制装置_安徽启港建筑工程有限公司_202323429690.6

大环BTK抑制剂_克罗斯费尔肿瘤学控股有限公司_202280091552.0

一种用于静止轨道卫星云图的杂散光抑制方法及抑制装置_国家卫星气象中心(国家空间天气监测预警中心)_202410856488.1

抑制β淀粉样蛋白聚集的碳点抑制剂及合成方法和应用_天津大学_202211219978.8

抑制智能扬声器串扰的方法_音品电子(深圳)有限公司_202411155119.6

用于消费后树脂的气味抑制组合物_陶氏环球技术有限责任公司_202080016036.2

方法相关技术

记录方法_精工爱普生株式会社_202410329157.2

分类方法_株式会社半导体能源研究所_202080059927.6

分离方法_大金工业株式会社_202380021486.4

唤醒信号的接收方法、发送方法、配置方法、装置及设备_OPPO广东移动通信有限公司_202280091619.0

原版、确定原版的图案的方法、曝光的方法、以及制造物品的方法_佳能株式会社_202410311669.6

信号传输方法、信号检测方法、装置及通信设备_维沃移动通信有限公司_202310304876.4

验证方法_上海兆芯集成电路股份有限公司_202011127602.5

接入处理方法、信息处理方法、配置发送方法及设备_维沃移动通信有限公司_202310290704.6

训练SEM图像选择方法及使用该方法的SEM设备对准方法_三星电子株式会社_202410252998.8

图像编码/解码方法及发送图像数据的方法_LG电子株式会社_202411023693.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于分类的齿音抑制方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务