买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:谷歌有限责任公司
摘要:本发明涉及使用说话者相关语音模型的说话者感知。本文所公开的技术使能够训练和或利用对客户端装置的任何用户可个性化的说话者相关SD语音模型。各种实施方式包括通过使用所述SD语音模型处理对应于目标用户的说话者嵌入以及音频数据的实例来将所述目标用户的SD语音模型个性化。通过使用所述SD语音模型处理对应于额外目标用户的额外说话者嵌入以及音频数据的另一实例,可以针对所述额外目标用户将所述SD语音模型个性化。额外或替代实施方式包括使用师生学习基于说话者无关语音模型来训练所述SD语音模型。
主权项:1.一种由一个或多个处理器实现的方法,所述方法包括:接收捕获客户端装置的用户的一个或多个口头话语的音频数据的实例,其中,使用所述客户端装置的一个或多个麦克风捕获所述音频数据的实例;确定对应于所述客户端装置的目标用户的说话者嵌入;使用说话者相关话音活动检测模型(SDVAD模型)处理所述音频数据的实例以及所述说话者嵌入,以生成指示所述音频数据是否包括所述客户端装置的所述目标用户的话音活动的输出,其中,所述SDVAD模型对所述客户端装置的任何用户可个性化;以及基于所述输出来执行一个或多个动作。
全文数据:
权利要求:
百度查询: 谷歌有限责任公司 使用说话者相关语音模型的说话者感知
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。