首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】用于智能办公的语音数据增强优化方法_深圳市西昊智能家具有限公司_202410358854.0 

申请/专利权人:深圳市西昊智能家具有限公司

申请日:2024-03-27

公开(公告)日:2024-06-18

公开(公告)号:CN117953914B

主分类号:G10L21/0216

分类号:G10L21/0216;G10L21/0264

优先权:

专利状态码:有效-授权

法律状态:2024.06.18#授权;2024.05.17#实质审查的生效;2024.04.30#公开

摘要:本申请涉语音增强技术领域,提出了用于智能办公的语音数据增强优化方法,包括:获取每个阵元采集的语音信号;基于语音信号的Mel谱图上所有点能量值的聚类结果确定谱图覆盖模糊评估因子;基于每帧语音信号包络的波动特征确定包络受噪随机影响系数;基于谱图覆盖模糊评估因子、包络受噪随机影响系数确定声纹模糊均衡系数;基于说话人情绪稳定性对语音信号的影响程度以及韵律特征的分析结果确定控制发音行为约束因子;基于声纹模糊均衡系数、控制发音行为约束因子确定动态优化因子;采用WPE算法基于动态优化因子得到语音信号的增强结果。本申请通过改进WPE算法提高了语音信号的增强效果。

主权项:1.用于智能办公的语音数据增强优化方法,其特征在于,该方法包括以下步骤:获取内置麦克风阵列中每个阵元采集的语音信号;基于每个阵元采集的语音信号的Mel谱图上所有点能量值的聚类结果确定每帧语音信号的谱图覆盖模糊评估因子;基于每个阵元采集的语音信号中每帧语音信号包络的波动特征确定每帧语音信号的包络受噪随机影响系数;基于每帧语音信号的谱图覆盖模糊评估因子、包络受噪随机影响系数确定每帧语音信号的声纹模糊均衡系数,所述声纹模糊均衡系数用于表征每一帧信号中的噪声成分的含量;基于工作人员发出语音指令时说话人情绪稳定性对语音信号的影响程度以及每个周期内语音信号韵律特征的分析结果确定每帧语音信号的控制发音行为约束因子;基于每帧语音信号的声纹模糊均衡系数、控制发音行为约束因子确定每帧语音信号的动态优化因子;采用WPE算法基于所述动态优化因子得到语音信号的增强结果;所述基于每帧语音信号的谱图覆盖模糊评估因子、包络受噪随机影响系数确定每帧语音信号的声纹模糊均衡系数的方法为:计算以自然常数为底数,以每帧语音信号的包络受噪随机影响系数为指数的计算结果,将所述计算结果与每帧语音信号的谱图覆盖模糊评估因子的乘积作为每帧语音信号的声纹模糊均衡系数;所述基于每帧语音信号的声纹模糊均衡系数、控制发音行为约束因子确定每帧语音信号的动态优化因子的方法为:计算每帧语音信号的声纹模糊均衡系数与每帧语音信号的控制发音行为约束因子的比值,将以自然常数为底数,以所述比值为幂的对数函数的结算结果与WPE算法中优化因子的估计值的乘积作为每帧语音信号的动态优化因子。

全文数据:

权利要求:

百度查询: 深圳市西昊智能家具有限公司 用于智能办公的语音数据增强优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术