买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:深圳同创音频技术有限公司
摘要:本发明涉及计算机技术领域,尤其涉及一种基于动态门限的混音方法、设备、系统和存储介质,包括:响应于接收到若干个通道的语音信号,将每个通道的语音信号分块,并计算每一块语音信号的RMS值;取所有的RMS值中的最大值作为自适应阈值ThrA,并根据预设帧移对自适应阈值ThrA进行更新;获得经过更新的自适应阈值ThrA处理的语音信号生成的离散布尔序列中取值为1的概率p;根据概率p和预设门限值Tp之间的大小关系,筛选出待混音的语音信号进行混音合成后输出。可见,根据预设帧移动态更新自适应阈值ThrA,并通过动态更新的自适应阈值ThrA筛选出待混音的语音信号,以便将待混音的语音信号混音合成后输出,混音效果好。
主权项:1.一种基于动态门限的混音方法,其特征在于,包括:响应于接收到若干个通道的语音信号,按照预设分块规则将每个通道的所述语音信号分块,并计算每一块语音信号的RMS值;取所有的RMS值中的最大值作为自适应阈值ThrA,并根据预设帧移对所述自适应阈值ThrA进行更新;获得经过更新的所述自适应阈值ThrA处理的语音信号生成的离散布尔序列,并计算所述离散布尔序列中取值为1的概率p;根据所述概率p和预设门限值Tp之间的大小关系,筛选出待混音的语音信号,并将所述待混音的语音信号混音合成后输出;其中,所述获得经过更新的所述自适应阈值ThrA处理的语音信号生成的离散布尔序列,并计算所述离散布尔序列中取值为1的概率p;根据所述概率p和预设门限值Tp之间的大小关系,筛选出待混音的语音信号,包括:获得经过更新的所述自适应阈值ThrA处理的语音信号生成的离散布尔序列fi,并计算所述离散布尔序列fi中取值为1的概率p;其中,所述离散布尔序列fi的计算公式为: ;其中,为预设灵敏度;所述概率p的计算公式为:;其中,为分块的块数;获得所述概率p和预设门限值Tp之间的大小关系;若所述概率p大于所述预设门限值Tp,则确定对应的语音信号中包含语音信息的可能性高;对所述可能性高的语音信号启动相关性检测功能,以便筛选出近似的语音信号作为待混音的语音信号;其中,所述相关性检测功能,包括:从满足所述概率p大于所述预设门限值Tp的条件的语音信号中,选择具有瞬时RMS值中最大值的语音信号作为参考信号,其他的语音信号作为被比较信号;根据自相关函数和,以及互相关函数,计算归一化互相关系数;其中,计算公式为: 其中,为语音信号x在时间点n处的取值,为语音信号x在时间点(n+m)处的取值,m为时间延迟; 其中,y为语音信号y在时间点n处的取值,y为语音信号y在时间点(n+m)处的取值,m为时间延迟; 其中,x(n)为语音信号x在时间点n处的取值,y(n+τ)为语音信号y在时间点(n+τ)处的取值,为时间延迟,为所述参考信号,为所述被比较信号; 若计算出的所述归一化互相关系数的绝对值属于0.3,1]的范围,则认为所述参考信号和所述被比较信号之间具有相似性;其中,所述认为所述参考信号和所述被比较信号之间具有相似性之后,还包括:根据计算公式:计算;其中,wlen为窗口长度,为语音信号x在时间点(n+m)处的取值,为语音信号x在时间点(n+m-k)处的取值;根据所述的计算结果,计算归一化短时平均幅度差NSTAMDFn,k;其中,所述归一化短时平均幅度差NSTAMDFn,k的计算公式为: 获得计算得出的所述的数值和预设近似阈值之间的大小关系;若所述数值小于或等于所述预设近似阈值,则确定所述参考信号和所述被比较信号之间近似。
全文数据:
权利要求:
百度查询: 深圳同创音频技术有限公司 基于动态门限的混音方法、设备、系统和存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。