买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:河南科技大学
摘要:本发明提供一种基于卷积神经网络的古典音乐识别方法,使用基于提取梅尔频谱特征、色度特征矩阵以及短时均方根能量特征的卷积神经网络CNN的方法对古典音乐进行识别的技术方法。通过梅尔频谱特征可以提取音乐的频率特征,用于进行古典音乐的名称的分类,色度矩阵可以提取音乐的音高特征,用于进行古典音乐的风格类别分类,短时均方根能量特征是提取音乐的能量特征,用于进行古典音乐情感类型的分类。对比现有的只是针对单一的音乐特征进行提取从而进行音乐识别的技术方法,本方法提出的特征提取方法更加综合高效,本方法提出的特征提取方法不仅可以兼顾音乐的名称识别与分类,同时可以识别曲子风格与情感类别。
主权项:1.一种基于卷积神经网络的古典音乐识别方法,其特征在于:包括以下步骤:步骤1、收集古典音乐数据集,数据集涵盖不同类型的古典音乐曲目;步骤2、使用K-means算法对所有的曲子进行无监督学习的聚类分析,根据提取不同曲子的色度特征矩阵进行曲子风格的聚类;步骤3、将每首曲子分割为时间间隔等长的音乐片段,对所有分割后的音乐片段提取梅尔频谱特征、短时均方根能量特征以及实现的手动提取的色度特征矩阵并保存,并对每首曲子的最后一个音乐片段进行特征填充;步骤4、将高斯噪声、均值噪声、脉冲噪声与色噪声以不同的噪声水平添加到音乐片段中,通过调整噪声水平,模拟从非常安静到非常嘈杂的不同环境条件;将添加噪声的特征矩阵与原有的无噪声的特征矩阵进行混合并保持相同的曲子名称、风格与情感标签共同作为训练数据集;步骤5、构建模型结构,将提取过梅尔频谱特征、色度特征矩阵以及短时均方根能量特征的曲子使用Concatenate层进行连接,使三个不同的特征矩阵组合成为一个特征矩阵,然后将组合的特征矩阵输入到Embedding层,数据从Embedding层输出后传入若干个Conv层,Conv层的输出会分别输入给三个不同的Dense层,三个Dense层的输出对应了曲子类别、风格类别以及情感类别;步骤6、采用交叉熵损失公式评估模型对曲子、风格、情感识别的综合准确率。
全文数据:
权利要求:
百度查询: 河南科技大学 一种基于卷积神经网络的古典音乐识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。