音频分类模型的训练方法、音频分类方法、装置及设备

导航：龙图腾网> 最新专利技术> 音频分类模型的训练方法、音频分类方法、装置及设备

申请/专利权人：北京远鉴信息技术有限公司

申请日：2020-03-13

公开（公告）日：2024-06-25

公开（公告）号：CN111369982B

主分类号：G10L15/06

分类号：G10L15/06;G10L15/08;G10L21/0272;G10L25/51;G10L25/81

优先权：

专利状态码：有效-授权

法律状态：2024.06.25#授权;2020.07.28#实质审查的生效;2020.07.03#公开

摘要：本申请提供一种音频分类模型的训练方法、音频分类方法、装置及设备，属于音频处理技术领域。音频分类模型的训练方法包括：获取音频样本，音频样本包括：语音音频样本、音乐音频样本；对各音频样本进行分帧，并提取帧特征；采用预设窗函数，提取各音频样本中每帧的窗特征，并根据帧特征获取组合特征，其中，组合特征标记语音标签或音乐标签；采用组合特征和预设神经网络，训练获取音频分类模型。本申请可以将复杂程度较高的音乐音频和语音音频进行分类，进而提高分类结果的准确性。

主权项：1.一种音频分类模型的训练方法，其特征在于，包括：获取音频样本，所述音频样本包括：语音音频样本、音乐音频样本，所述语音音频样本包括人声以及动物声，所述音乐音频样本包括单独的乐器声以及混合的伴奏声；对各所述音频样本进行分帧，并提取帧特征，其中，所述帧特征包括短时平均能量，所述短时平均能量用于表征每帧内的平均能量的大小；采用预设窗函数，提取各所述音频样本中每帧的窗特征，并根据所述帧特征获取组合特征，其中，所述组合特征标记语音标签或音乐标签，所述组合特征为将每帧内的所述帧特征和所述窗特征全部拼接起来作为一个整体的特征，所述窗特征包括谱变迁；采用所述组合特征和预设神经网络，训练获取音频分类模型。

全文数据：

权利要求：

百度查询：北京远鉴信息技术有限公司音频分类模型的训练方法、音频分类方法、装置及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种带液晶显示屏可调速的墙体切割机

下一篇：一种无纺布绑袋

相关技术

一种带液晶显示屏可调速的墙体切割机

一种无纺布绑袋

建筑工程管理招标装置

一种墙面保护用裁边边压片

一种羊毛毡制作用压实机

用于车辆顶板的显示装置和车辆

一种土工格栅注塑模具

一种具有分级过滤功能的纳滤膜元件

一种口腔扩张支撑装置

一种高层建筑双水系统分布式空调热交换装置

一种用于治疗小儿肌性斜颈的固定器

自穿刺铆钉、电池及用电设备

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

音频分类模型的训练方法、音频分类方法、装置及设备

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务