首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】语音识别身份方法、装置及存储介质_平安科技(深圳)有限公司_202410439452.3 

申请/专利权人:平安科技(深圳)有限公司

申请日:2024-04-11

公开(公告)日:2024-06-07

公开(公告)号:CN118155634A

主分类号:G10L17/02

分类号:G10L17/02;G10L17/04;G10L17/18;G10L21/0208;G10L25/24;G10L15/06;G07C9/37

优先权:

专利状态码:在审-公开

法律状态:2024.06.07#公开

摘要:本发明涉及人工智能及医疗领域,揭露一种语音识别身份方法,包括:获取待识别用户的第一语音,对处理后的第一语音特征进行提取和处理,得到处理后特征,对第一语音加噪,得到高斯分布的信号,对高斯分布的信号去噪,得到去噪后信号,对去噪后信号处理,得到梅尔频率倒谱系数特征,将处理后特征和梅尔频率倒谱系数特征进行拼接和处理,得到生成语音,利用待识别用户的第二语音信号训练说话人语音识别网络,将生成语音和第一语音信号拼接,得到拼接语音,利用说话人语音识别网络对拼接语音进行识别,得到待识别用户的身份结果。本发明还提供一种装置及存储介质。本发明可用于医院门禁系统,提高短语音门禁识别的准确率。

主权项:1.一种语音识别身份方法,其特征在于,所述方法包括:获取待识别用户的第一语音信号,利用预设的特征提取模块对所述第一语音信号进行特征提取,得到第一特征向量;利用预设的扩散模块对所述第一语音信号进行加噪处理,得到高斯分布的信号,对所述高斯分布的信号进行去噪操作,得到去噪后的信号,及对所述去噪后的信号进行处理,得到去噪后的信号的梅尔频率倒谱系数特征向量;将所述第一特征向量和所述梅尔频率倒谱系数特征向量进行拼接,得到拼接向量,将拼接向量进行处理,得到生成语音信号,及利用所述待识别用户的第二语音信号训练初始语音识别网络,生成目标语音识别网络,第二语音信号的时长大于第一语音信号的时长;将所述生成语音信号和所述第一语音信号进行拼接,得到拼接语音信号,利用所述目标语音识别网络对拼接语音信号进行语音识别,得到所述待识别用户的身份结果。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 语音识别身份方法、装置及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。