买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:谷歌有限责任公司
摘要:本申请公开了端到端流关键词检出。一种用于检测热词的方法(600)包括:接收表征由用户设备(102)捕获的流音频(118)的输入帧(210)的序列,和使用记忆神经网络(300)生成指示在流音频中存在热词的概率分数(350)。该网络包括顺序堆叠的单值分解过滤器(SVDF)层(302),并且每个SVDF层包括至少一个神经元(312)。每个神经元包括相应的存储器组件(330);第一级(320),其被配置成单独地对每个输入帧的音频特征(410)执行过滤并输出到存储器组件;以及第二级(340),其被配置成对驻留在相应的存储器组件中的所有所过滤的音频特征执行过滤。该方法还包括确定概率分数是否满足热词检测阈值,以及在用户设备上发起唤醒过程以处理附加的词语。
主权项:1.一种计算机实现的方法,所述方法在数据处理硬件上执行时使所述数据处理硬件执行操作,所述操作包括:接收包含关键词的多个训练输入音频序列,每个训练输入音频序列包括:输入帧序列,所述输入帧各自包括表征所述关键词的语音成分的一个或多个相应音频特征;以及指派给所述输入帧的二进制标签;通过以下来在所述多个训练输入音频序列上训练端到端关键词检出模型,针对每个训练输入序列:将第一标签指派给至少一个输入帧,所述至少一个输入帧包括表征所述关键词的最后一个语音成分的一个或多个相应音频特征;以及将第二标签指派给剩余帧,所述剩余帧各自包括表征所述关键词的剩余语音成分的一个或多个相应音频特征;以及向用户设备提供经训练的端到端关键词检出模型,所述用户设备被配置为执行所述经训练的端到端关键词检出模型以在流式传输音频中检测所述关键词的存在,而不对所述流式传输音频执行语义分析或语音辨识处理。
全文数据:
权利要求:
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。