一种融合GMM和ResNext的说话人确认方法

导航：龙图腾网> 最新专利技术> 一种融合GMM和ResNext的说话人确认方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：江西师范大学

摘要：本发明公开了一种融合GMM和ResNext的说话人确认方法，包括如下步骤：采用高斯混合模型以及多尺度ResNext模型组合成多尺度GMM‑ResNext模型，将多尺度GMM‑ResNext模型用于对实时的两条语音数据进行说话人确认；其中，多尺度ResNext模型是通过高斯混合模型提取的原始语音数据的对数高斯概率特征进行训练得到，高斯混合模型通过原始语音数据提取梅尔频率倒谱系数特征进行训练得到；本发明采用基于一维卷积的多尺度残差块，用高斯分量数为512的高斯混合模型对原始语音数据进行建模，提取相应的对数高斯概率特征，结合多尺度GMM‑MSNext模型能够有效提高说话人确认的性能。

主权项：1.一种融合GMM和ResNext的说话人确认方法，其特征在于，包括如下步骤：步骤S1：获取不同说话人的语音数据作为原始语音数据；步骤S2：计算原始语音数据的梅尔频率倒谱系数特征；步骤S3：在原始语音数据的梅尔频率倒谱系数特征上构建512阶高斯混合模型；步骤S4：将原始语音数据的梅尔频率倒谱系数特征作为512阶高斯混合模型的输入，计算得到512阶的对数高斯概率特征；步骤S5：构建多尺度ResNext模型，将计算得到的512阶的对数高斯概率特征作为多尺度ResNext模型的输入，对所述多尺度ResNext模型进行训练，将训练好的多尺度ResNext模型与512阶高斯混合模型组合成多尺度GMM-ResNext模型；多尺度ResNext模型由6个阶段组成；第一阶段依次由卷积核为3的一维卷积层、批量归一化层、ReLU非线性激活层组成，卷积核为3的一维卷积层的输入通道数和输出通道数均为512；第二阶段、第三阶段、第四阶段和第五阶段分别由3、3、9、3个多尺度残差块组成；第六阶段由注意力统计池化层和全连接层组成；第二阶段、第三阶段、第四阶段和第五阶段的多尺度残差块均为依次连接；步骤S6：将两条实时的语音数据导入多尺度GMM-ResNext模型对说话人进行确认，判断这两条实时的语音数据是否属于同一个说话人。

全文数据：

权利要求：

百度查询：江西师范大学一种融合GMM和ResNext的说话人确认方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种双层基质与立体模式的茶树种质资源保存和快速繁育方法

下一篇：一种组合式固定件依附锁定器

相关技术

一种双层基质与立体模式的茶树种质资源保存和快速繁育方法

一种组合式固定件依附锁定器

一种基于重载群组列车群组通信的列车运行预测方法、系统及电子设备

一种注册终端设备的方法及装置

一种铅碳电池用改性多孔炭的制备方法及铅碳电池

超临界晶圆清洗/干燥介质回收方法以及系统

人体属性的识别方法、装置、电子设备及存储介质

一种汽车零部件冲压加工用夹具

一种具有护针功能的旋梭及缝纫机

一种基于AI的纸币识别方法及纸币清分机

性别判定模型的生成方法、装置、电子设备及介质

牙冠的宽度数值确定方法、装置、设备及存储介质

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种融合GMM和ResNext的说话人确认方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务