首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于CTC-Conformer的语音情绪识别方法_南京工业大学_202410089324.0 

申请/专利权人:南京工业大学

申请日:2024-01-22

公开(公告)日:2024-04-30

公开(公告)号:CN117953915A

主分类号:G10L25/30

分类号:G10L25/30;G10L25/63;G10L25/03;G10L25/24;G06N3/045;G06N3/08

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.17#实质审查的生效;2024.04.30#公开

摘要:本发明属于自然语言处理领域,具体是一种基于CTC‑Conformer的语音情绪识别方法。通过结合CTC的硬对齐特性以及Conformer软对齐特性来提高语音情绪的识别准确率。并且在特征提取环节加入语音特征融合技术增强了识别特征的全面性。该方法包含语音数据的预处理,其中包含预加重、分帧、快速傅里叶变换的操作,再者将提取的MFCC以及Fbank特征进行融合。搭建模型将ConformerEncnder作为SharedEnconder,CTC以及ConformerDeconder分别解码进行训练,最后识别阶段将两通道CTC结果以及ConformerDeconder结果进行投票处理得出最终的识别结果。

主权项:1.一种基于CTC-Conformer的语音情绪识别方法,融合语音特征并将CTC软对齐以及Conformer软对齐特征结合,其特征是包括以下步骤:步骤1对语音情绪数据集进行预处理。步骤2提取语音特征Fbank以及MFCC并进行融合。步骤3构建模型,结合CTC硬对齐特性以及Conformer软对齐特性,传入融合特征进行模型的训练。步骤4识别阶段,传入音频通过提取特征并进行融合后,传入模型,经CTC得到结果A,经Conformer得到结果B,进行投票处理后得到最终结果。

全文数据:

权利要求:

百度查询: 南京工业大学 一种基于CTC-Conformer的语音情绪识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。