买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东省计算中心(国家超级计算济南中心);齐鲁工业大学
摘要:本发明提供一种基于时频特征和全局注意力的语音情感识别方法及系统,涉及语音信号处理与模式识别技术领域,该方法通过提取三维对数梅尔谱图的时间特征和频率特征,并进行分析处理,以充分利用语音信号的静态特征和动态特征,以及静态特征和动态特征之间的通道联系,得到更深层次的特征联系,丰富了特征维度;并且,提取时间维度和空间频率维度数据,将其进行融合;利用空间特征提取模块和全局上下文注意力模块对时间‑频率特征进行分析,充分利用语音信号所包含的空间特征和时间特征,并对融合后的特征进行通道间的特征进行分析,其分析的特征更为全面,从而可以提高情感识别结果的准确率。
主权项:1.一种基于时频特征和全局注意力的语音情感识别方法,其特征在于,所述语音情感识别方法包括:对所获取的语音信号进行预处理,得到三维对数梅尔谱图;提取所述三维对数梅尔谱图的时间特征和频率特征,并进行融合,得到所述语音信号的时间-频率特征;将所述时间-频率特征输入至预设的空间特征提取模块中,输出得到语音信号的空间特征;以及,将所述时间-频率特征输入至全局上下文注意力模块中,输出得到语音信号的时序特征,并利用所述全局上下文注意力模块确定三维对数梅尔谱图通道之间的特征,将得到的空间特征和时序特征进行融合;对融合后的特征进行降维处理,并输入至分类器进行情感识别。
全文数据:
权利要求:
百度查询: 山东省计算中心(国家超级计算济南中心) 齐鲁工业大学 基于时频特征和全局注意力的语音情感识别方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。