申请/专利权人:平安科技(深圳)有限公司
申请日:2024-04-11
公开(公告)日:2024-06-07
公开(公告)号:CN118155634A
主分类号:G10L17/02
分类号:G10L17/02;G10L17/04;G10L17/18;G10L21/0208;G10L25/24;G10L15/06;G07C9/37
优先权:
专利状态码:在审-公开
法律状态:2024.06.07#公开
摘要:本发明涉及人工智能及医疗领域,揭露一种语音识别身份方法,包括:获取待识别用户的第一语音,对处理后的第一语音特征进行提取和处理,得到处理后特征,对第一语音加噪,得到高斯分布的信号,对高斯分布的信号去噪,得到去噪后信号,对去噪后信号处理,得到梅尔频率倒谱系数特征,将处理后特征和梅尔频率倒谱系数特征进行拼接和处理,得到生成语音,利用待识别用户的第二语音信号训练说话人语音识别网络,将生成语音和第一语音信号拼接,得到拼接语音,利用说话人语音识别网络对拼接语音进行识别,得到待识别用户的身份结果。本发明还提供一种装置及存储介质。本发明可用于医院门禁系统,提高短语音门禁识别的准确率。
主权项:1.一种语音识别身份方法,其特征在于,所述方法包括:获取待识别用户的第一语音信号,利用预设的特征提取模块对所述第一语音信号进行特征提取,得到第一特征向量;利用预设的扩散模块对所述第一语音信号进行加噪处理,得到高斯分布的信号,对所述高斯分布的信号进行去噪操作,得到去噪后的信号,及对所述去噪后的信号进行处理,得到去噪后的信号的梅尔频率倒谱系数特征向量;将所述第一特征向量和所述梅尔频率倒谱系数特征向量进行拼接,得到拼接向量,将拼接向量进行处理,得到生成语音信号,及利用所述待识别用户的第二语音信号训练初始语音识别网络,生成目标语音识别网络,第二语音信号的时长大于第一语音信号的时长;将所述生成语音信号和所述第一语音信号进行拼接,得到拼接语音信号,利用所述目标语音识别网络对拼接语音信号进行语音识别,得到所述待识别用户的身份结果。
全文数据:
权利要求:
百度查询: 平安科技(深圳)有限公司 语音识别身份方法、装置及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。