首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

音源定位模型的训练方法、音源对象定位方法及相关装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:腾讯科技(深圳)有限公司

摘要:本申请涉及数据处理技术领域,尤其涉及一种音源定位模型的训练方法、音源对象定位方法及相关装置,在模型训练过程中,该方法为:以一轮迭代过程为例,针对样本唤醒词包含的各发音单元,分别提取出单元内容向量,并依据多通道样本音频信号,提取出位置预测向量和音频内容向量;再基于各单元内容向量各自与音频内容向量之间的相关性,分别调整位置预测向量,获得各发音单元的音源位置指示向量,并基于各音源位置指示向量,确定音源对象的预测位置;之后,基于预测结果和位置标签的差异,调整模型参数。这样,能够学习到基于多通道样本语音信号和包含的样本唤醒词,对任意候选位置的音源对象进行定位的能力,并能够大幅提高定位的准确率。

主权项:1.一种音源定位模型的训练方法,其特征在于,采用各训练样本,对构建的初始音源定位模型进行多轮迭代训练,其中,在一轮迭代过程中,执行以下操作:读取训练样本;所述训练样本包括:标注出样本唤醒词的多通道样本音频信号,以及对应的位置标签;针对所述样本唤醒词包含的各发音单元,分别提取出对应的单元内容向量,并依据所述多通道样本音频信号,提取出融合有音频内容信息的位置预测向量,以及融合有各被采集对象的位置信息的音频内容向量;所述位置预测向量用于描述存在语音表达的至少一个被采集对象各自对应的空间位置;基于各单元内容向量各自与所述音频内容向量之间的相关性,分别调整所述位置预测向量,获得相应发音单元的音源位置指示向量,并基于获得的各音源位置指示向量,确定所述样本唤醒词的音源对象的预测位置;基于所述预测位置和相应的位置标签之间的结果差异,调整模型参数。

全文数据:

权利要求:

百度查询: 腾讯科技(深圳)有限公司 音源定位模型的训练方法、音源对象定位方法及相关装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。