基于三分支特征融合神经网络的声音事件检测方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：天津大学

摘要：本发明公开了一种基于三分支特征融合神经网络的声音事件检测方法，包括：将包含声音信号的数据集进行特征提取，得到log‑mel频谱图的数据集，并将其分为训练集、测试集和验证集；建立三分支特征融合网络模型，所述的三分支特征融合网络模型包括三分支采样、特征提取、三分支的特征融合和损失融合：将测试集和验证集作为训练后的模型的输入，该模型的输出即为该数据集的声音事件检测的结果，包括该音频所包含的声音事件类别和发生该事件的起始和终止时间。本发明通过三分支融合的方式获取到尾部类和难区分类别的判别性特征，并在一定程度上均衡了分类器的类别权重，提高了声音事件检测的效果。

主权项：1.一种基于三分支特征融合神经网络的声音事件检测方法，其特征在于，包括以下步骤：步骤1、数据预处理：将包含声音信号的数据集进行特征提取，得到log-mel频谱图的数据集，并按照一定比例划分为训练集、测试集和验证集；步骤2、建立三分支特征融合网络模型，所述的三分支特征融合网络模型包括三分支采样、特征提取、三分支的特征融合和损失融合：步骤如下：2-1分别对训练集进行均匀采样、逆采样和基于难例挖掘和多标签中的成对学习的难区分类别对矩阵采样，从而得到三个分支的训练样本；2-2采用CNN-Transformer模型对步骤2-1获得的三个分支的训练样本的声音事件特征进行提取，得到三个分支的特征；2-3采用随着学习过程逐渐减小的超参数将步骤2-2得到的三个分支的特征进行融合，根据融合后的特征分别计算三个分支的损失函数，根据损失函数反向传播修改模型的参数，完成模型的训练；步骤3、将测试集和验证集作为训练后的模型的输入，该模型的输出即为该数据集的声音事件检测的结果，包括音频所包含的声音事件类别和发生该事件的起始和终止时间。

全文数据：

权利要求：

百度查询：天津大学基于三分支特征融合神经网络的声音事件检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种电驱机械振动辅助负压可弯导引鞘

下一篇：一种用于搅拌摩擦焊冷板的CNC定位夹紧工装

相关技术

一种电驱机械振动辅助负压可弯导引鞘

一种用于搅拌摩擦焊冷板的CNC定位夹紧工装

一种防静电智能电子手环

一种电子设备、下载模式触发方法以及可读存储介质

一种电池耐火防护装置及可行驶设备

一种坐浴盆

一种便于安装的电力计量装置

一种市政道路铺砖装置

振镜和激光雷达

一种光纤光栅生命体征监测装置和方法

一种焊接加热装置

一种高矫顽力的R-T-B永磁体及其制备方法和应用

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于三分支特征融合神经网络的声音事件检测方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务