首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于Group-Res2Block网络的智能合成语音说话人确认方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:合肥工业大学

摘要:本发明公开了一种基于Group‑Res2Block网络的智能合成语音说话人确认方法,包括:1获取智能合成语音数据集;2建立基于Group‑Res2Block的特征提取网络模型;3训练建立的基于Group‑Res2Block的特征提取网络模型;4利用建立好的模型实现预测,以达到对智能合成语音的说话人主体进行确认的目的。本发明能最大限度获取到自然人声和智能合成语音的公共有效声纹特征,从而能有效实现智能合成语音说话人确认,并能提高确认准确度。

主权项:1.一种基于Group-Res2Block网络的智能合成语音说话人确认方法,其特征在于,是按如下步骤进行:步骤1、智能合成语音数据的收集和Fbank特征的预处理:步骤1.1、构建智能合成语音数据集:获取H个不同说话人的k条自然语音,并利用语音合成器对H个人的k条自然语音进行合成,得到H个人的k条合成语音,从而构建包含U=2×H×k条训练语音数据;获取N个不同说话人的q对测试组,每对测试组包含同一个人的一条自然语音和一条合成语音,从而得到V=2×q条测试语音数据;若任一对测试组中的自然语音和合成语音属于同一个说话人,则令相应一对测试组为正样本,并将标签设为“1”;否则,令相应一对测试组为负样本,并将标签设为“0”;由U条训练语音数据和V条测试语音数据构成智能合成语音数据集;步骤1.2、利用Fbank特征提取器对智能合成语音数据集进行初步特征提取,得到原始声纹Fbank特征;步骤2、建立基于Group-Res2Block网络的智能合成语音说话人确认特征提取模型,依次包括:多尺度通道注意力机制下的特征融合模块,Group-Res2Block模块、层注意力机制下的特征融合模块和输出模块:步骤2.1、所述多尺度通道注意力机制下的特征融合模块由a个不同大小卷积核单元、通道注意力机制模块构成,其中,每个单元是由二维卷积Conv2D、归一化层BN以及激活函数层ReLu依次构成,且每个单元并行连接;所述通道注意力机制模块由一层二维卷积Conv2D中间层、另一层二维卷积Conv2D以及Softmax函数依次组成,所述中间层由归一化层BN和激活函数层ReLu依次构成;将所述原始声纹Fbank特征分别输入a个不同大小卷积核单元中进行并行处理后,得到的a个特征在其通道维度上使用concatenate函数进行级联,得到级联后的不同尺度总特征scale_feature,再将scale_feature输入所述通道注意力机制模块中,并利用Softmax函数得到不同尺度总特征在通道上的权重矩阵WMCA,从而利用式1得到融合特征fusion_feature1;fusion_feature1=WMCA×scale_feature1步骤2.2、所述Group-Res2Block模块依次由b个Group-Res2Block单元构成,每个Group-Res2Block单元依次由1个残差单元、主体单元、激活函数层ReLu、归一化层BN构成;第i个Group-Res2Block单元中的主体单元与残差单元分别将所接收到的特征进行相加后,再依次经过激活函数层ReLu、归一化层BN的处理后得到第i个特征mid[i]_feature;第b个Group-Res2Block单元输出第b个特征mid[b]_feature为Group-Res2Block模块最终输出特征;步骤2.3、所述层注意力机制下的特征融合模块包括:层维度构建模块和注意力机制模块,用于得到融合层注意力机制下的特征fusion_feature2;其中,所述注意力机制模块由AdaptiveAvgPool层、AdaptiveMaxPool层、卷积模块以及Softmax函数构成;所述全连接层fc模块由两层二维卷积Conv2D和激活函数层ReLu构成,其中,激活函数层ReLu设置在两层二维卷积Conv2D之间;步骤2.4、所述输出模块依次包括数据处理模块和全连接层,用于输出说话人嵌入特征;步骤3、以交替训练和测试的方式对所述智能合成语音说话人确认特征提取模型进行迭代训练,从而得到最优智能合成语音说话人确认特征提取模型。

全文数据:

权利要求:

百度查询: 合肥工业大学 基于Group-Res2Block网络的智能合成语音说话人确认方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。