买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:平安科技(深圳)有限公司
摘要:本发明实施例涉及声纹识别技术,揭露了一种语音通话的噪声消除方法,包括:对通话音频进行语音端点检测,得到人声语音集;对所述人声语音集进行语音特征提取,得到语音特征集;依时间顺序从所述语音特征集中截取累计时长为预设时长阈值的待检测语音特征集,得到多个待检测语音特征集,对每个待检测语音特征集进行聚类处理,并对所述聚类进行评分;根据所述评分,将所述人声语音集分成第一说话人声和第二说话人声,并从所述第一说话人声和第二说话人声中区分出背景人声,并将所述背景人声从所述人声语音集中删除。本发明还涉及区块链技术,通话音频可存储于区块链中。本发明可以删除语音通话中的背景人声,从而提升语音通话质量。
主权项:1.一种语音通话的噪声消除方法,其特征在于,所述方法包括:对通话音频进行语音端点检测,得到人声语音集;对所述人声语音集进行语音特征提取,得到语音特征集;依时间顺序从所述语音特征集中截取累计时长为预设时长阈值的待检测语音特征集,得到多个待检测语音特征集,对每一个所述待检测语音特征集进行聚类处理以得到对应的两个标准类别,并利用预设的评估算法对得到的聚类结果进行评分,得到每一个所述待检测语音特征集的评分值;根据所述评分值,将所述人声语音集分成第一说话人声和第二说话人声;计算所述第一说话人声和第二说话人声的时长,并根据所述第一说话人声和第二说话人声的时长判断所述人声语音集中的背景人声,将所述背景人声从所述人声语音集中删除;其中,所述根据所述评分值,将所述人声语音集分成第一说话人声和第二说话人声,包括:选择其中一个待检测语音特征集,获取对应的评分值;将所述评分值与预设的评分阈值进行比较;当所述评分值大于预设的评分阈值时,将选择的所述待检测语音特征集的两个标准类别合并为单一语音类别,并计算所述单一语音类别的类别中心,根据所述单一语音类别和类别中心生成第一说话人声;当所述评分值小于或者等于预设的评分阈值时,根据所述两个标准类别生成第一说话人声和第二说话人声;选择下一个待检测语音特征集,获取对应的评分值,并根据所述评分值,将所述待检测语音特征集中的两个标准类别归类至所述第一说话人声或所述第二说话人声;所述根据所述评分值,将所述待检测语音特征集中的两个标准类别归类至所述第一说话人声或所述第二说话人声,包括:若所述评分值大于所述评分阈值,则将所述待检测语音特征集的两个标准类别合并为单一语音类别,计算所述单一语音类别的类别中心,并根据所述单一语音类别的类别中心与上述第一说话人声和第二说话人声的类别中心之间的余弦距离,将所述单一语音类别归类到所述第一说话人声或第二说话人声中;若所述评分值小于或等于评分阈值,根据所述待检测语音特征集中两个标准类别的类别中心与第一说话人声和第二说话人声的类别中心之间的余弦距离,将所述两个标准类别分别归类至所述第一说话人声和第二说话人声中;所述评分值越高,两个所述标准类别对应的语音属于同一说话人的可能性越大;所述评分值越低,则两个所述标准类别对应的语音属于同一说话人的可能性越小。
全文数据:
权利要求:
百度查询: 平安科技(深圳)有限公司 语音通话的噪声消除方法、装置、电子设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。