Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 重庆邮电大学罗元获国家专利权

重庆邮电大学罗元获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉重庆邮电大学申请的专利一种基于双注意力机制动态卷积的说话人识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115273864B

龙图腾网通过国家知识产权局官网在2025-03-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210836146.4,技术领域涉及:G10L17/18;该发明授权一种基于双注意力机制动态卷积的说话人识别方法是由罗元;朱奎林;王文豪;林子尧设计研发完成,并于2022-07-15向国家知识产权局提交的专利申请。

一种基于双注意力机制动态卷积的说话人识别方法在说明书摘要公布了:本发明请求保护一种基于通道‑空间注意力的动态卷积说话人识别方法,该方法包括步骤:S1,将声音信号切为多个片段,提取声音信号的声学特征;S2,为解决静态卷积以及一般动态卷积方法中注意力权重矩阵信息量不足的问题,使用通道注意力以及空间注意力融合的双注意力方法提取注意力权重矩阵;S3,将通道注意力与空间注意力权重矩阵融合作为动态卷积的注意力权重矩阵并与多个静态卷积核按权重相加,得到最终的动态卷积核。S4,将输入语音数据与该动态卷积核卷积得到说话人语音帧级特征。

本发明授权一种基于双注意力机制动态卷积的说话人识别方法在权利要求书中公布了:1.一种基于双注意力机制动态卷积的说话人识别方法,其特征在于,包括以下步骤:S1,获取说话人声音信号并将声音信号切为多个片段,提取声音信号的梅尔普特征;S2,使用通道注意力以及空间注意力融合的双注意力方法提取注意力权重矩阵;S3,将通道注意力与空间注意力权重矩阵融合作为动态卷积的注意力权重矩阵并与多个静态卷积核按权重相加,得到最终的动态卷积核;S4,将输入语音数据与动态卷积核卷积得到说话人语音信号的帧级特征数据,帧级数据作为后续全连接分层的输入用于说话人分类网络;所述S2使用通道注意力以及空间注意力融合的双注意力方法提取注意力权重矩阵,并将其进行每一个元素对应相加,所述权重矩阵生成模型建立步骤包括:S31:Mavg=convcin,k,1AvgPoolX,X为输入数据,AvgPool为全局平局池化层,conv为卷积层,其中参数cin为数据的输入通道,k为输出通道数,也是设置的静态卷积核的个数,1为卷积核大小;将输入数据进行全局平均池化后,再进行卷积,得到每个通道的注意力权重参数Mavg;S32:Mchannel=convk,k,1ReLUMavg将注意力权重参数矩阵Mavg经过非线性函数ReLU激活后,再进行k×k的卷积,即得到了最终的通道注意力参数矩阵Mchannel;S33:将输入数据经过最大值池化层MaxPooling以及全局平均池化层AvgPooling后维度降为2×H×W,其中H为每一帧语音数据的维度,W为语音数据的帧数,将多帧数据通过卷积使其维度降为1×H×W,得到Ms矩阵Ms=convcin,1,1MaxPool,AvgPoolX,Ms矩阵为空间上每个位置的权重参数矩阵;S34:将Ms矩阵进行展平操作Flatten后其维度为b×T,其中b为输入数据的批量大小,T为展平后数据的长度;卷积核参数中k为静态卷积核的个数,1为卷积核大小,MF=convT,k,1FlattenMs,MF为未经非线性激活的空间权重矩阵;S35:将MF矩阵经过ReLu非线性函数激活之后再进行k×k的卷积得到最终的空间注意力权重参数矩阵Mspatial,Mspatial=convk,k,1ReLuMF;所述步骤S3将通道注意力与空间注意力权重矩阵融合作为动态卷积的注意力权重矩阵并与多个静态卷积核按权重相加,得到最终的动态卷积核,具体包括:所述动态卷积核生成模型建立步骤包括:S41:首先将得到的通道注意力以及空间注意力参数进行每个元素对应相加其中Mcs即为融合了通道以及空间注意力的双注意力动态卷积核;S42:将Mcs进行k×k的卷积,再通过归一化指数函数SoftMax将输出数据归一化至0-1区间内,即得到了最终的动态卷积注意力权重Mattention,Mattention=SoftMaxconvk,k,1Mcs;S43:最终的动态卷积核参数计算公式为偏动态卷积核偏重数据b计算公式为其中为计算得到的动态卷积核参数,为动态卷积核的偏重数据,k为静态卷积核的个数,为多个静态卷积核的参数,πkx为动态卷积核注意力参数矩阵。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。