首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于双向注意力残差网络的语音欺诈检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:哈尔滨理工大学

摘要:本发明提出了一种基于双向注意力残差网络的语音欺诈检测方法,能够有效提升欺诈语音检测系统的识别性能,防止欺诈语音通过自动说话人验证系统ASV。在训练过程中,本发明首先对语音进行预处理,并提取常数Q变换CQT特征矩阵,将其作为残差网络ResNet的输入,利用ResNet提取浅层特征,然后将此特征输入双向注意力网络,以区分特征中不同维度的重要程度,从而得到区分性更强的特征表示。在测试阶段,利用训练好的网络模型作为真实语音与欺诈语音的分类器,对语音进行打分,根据打分结果对真实语音与欺诈语音进行分类。实验结果表明,本发明方法能够明显提升欺诈检测系统的性能,保护ASV系统免受不法用户的侵害。本发明可应用在语音处理和生物识别领域。

主权项:1.基于双向注意力残差网络的语音欺诈检测方法,其特征在于,所述方法包括如下步骤:步骤1、对语音数据进行预处理,并提取CQT特征矩阵;步骤2、在训练网络模型阶段,将CQT特征矩阵作为双向注意力残差网络的输入,并利用交叉熵损失函数进行训练,更新网络参数;步骤2的具体过程为:步骤2-1、将CQT特征矩阵作为深度神经网络的输入,首先将CQT矩阵输入ResNet18网络提取浅层特征表示;ResNet18网络由1个卷积层、8个残差块、1个全连接层组成;其中,残差块表示为: 其中,xl为残差块输入,xl+1为输出,h·为映射函数,F·为残差函数,Wl为加权运算,f·为激活函数;每个残差块由两个卷积层组成,池化层采用最大池化,卷积之后会对数据进行归一化处理,激活函数采用ReLU函数;经过多个残差块的特征表示后,再将浅层特征表示通过平均池化层得到中层特征表示,最后将中层特征表示通过全连接层进行降维,得到语音的嵌入特征;步骤2-2、将语音的嵌入特征转换为一维时序序列,分别输入到正向门控制循环单元GRU和反向GRU网络中,提取时序特征;步骤2-3、将正向GRU网络、反向GRU网络得到的时序特征分别通过自注意力网络进行不同权重的归纳学习;其中自注意力机制的Query键、Key键、Value键由时序特征在进行随机失活后的数据构成;自注意力层的具体过程表示为公式: 其中,Q、K、V分别为Query键、Key键、Value键对应的矩阵,dk设置为Query键的最后一个维度;将序列通过自注意力层,能够通过归纳学习对时序特征赋予不同的权重,得到区分性更强的特征表示;步骤2-4、将正向、反向自注意力层的输出进行拼接,再通过一个全连接层;其中拼接过程表示为:x=x1;x23其中,x是拼接后的特征,x1是正向自注意力网络的输出,x2是反向自注意力网络的输出;步骤3、在测试阶段,利用训练好的网络模型作为真实语音与欺诈语音的分类器,对语音进行打分;步骤4、根据语音的打分结果进行真实语音与欺诈语音的分类。

全文数据:

权利要求:

百度查询: 哈尔滨理工大学 基于双向注意力残差网络的语音欺诈检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。