首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】语音转换深度伪造中的源说话人溯源方法、设备及存储介质_中国人民解放军陆军工程大学_202410299133.7 

申请/专利权人:中国人民解放军陆军工程大学

申请日:2024-03-15

公开(公告)日:2024-06-14

公开(公告)号:CN118197330A

主分类号:G10L21/013

分类号:G10L21/013;G10L25/30

优先权:

专利状态码:在审-公开

法律状态:2024.06.14#公开

摘要:本发明公开了一种语音转换深度伪造中的源说话人溯源方法、设备及存储介质,采用特征提取块、说话人过滤块、维度匹配块以及基于梯度下降优化加性角度间隔损失,通过初步提取的转换语音说话人混合特征和目标语音说话人特征来求解包含源说话人身份信息高维潜在特征的软掩码,进而计算得到可识别源说话人嵌入。在语音转换方法已知或未知的情况下,所得源说话人嵌入在说话人确认识别模型中可以与源说话人再次匹配,具有较高的可信度。本发明将语音转换这一深度音频伪造方法从真伪鉴别进一步扩展至源说话人身份的溯源,能实现欺诈者身份的主动取证,解决实际应用场景中转换语音溯源的需求。

主权项:1.一种语音转换深度伪造中的源说话人溯源方法,其特征在于:包括如下步骤:获取到待识别的转换语音、目标语音和嫌疑人语音,当待识别的转换语音由已知的语音转换方法生成,分别将待识别的转换语音和目标语音以及嫌疑人语音和与嫌疑人语音等长度的补位0输入到对应已知语音转换方法的溯源网络中,分别输出N维的提取嵌入和N维的嫌疑人嵌入;获取到待识别的转换语音、目标语音和嫌疑人语音,当待识别的转换语音由未知的语音转换方法生成,分别将待识别的转换语音和目标语音以及嫌疑人语音和与嫌疑人语音等长度的补位0输入到未知语音转换方法的溯源网络中,分别输出N维的提取嵌入和N维的嫌疑人嵌入;计算N维的提取嵌入和N维的嫌疑人嵌入的余弦相似度值,如果余弦相似度值大于阈值,则嫌疑人与待识别的转换语音对应的源语音的说话人相一致。

全文数据:

权利要求:

百度查询: 中国人民解放军陆军工程大学 语音转换深度伪造中的源说话人溯源方法、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。