首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

用于语音和音频分析应用的多设备多通道注意力 

申请/专利权人:杜比实验室特许公司

申请日:2022-11-09

公开(公告)日:2024-06-28

公开(公告)号:CN118266021A

主分类号:G10L15/22

分类号:G10L15/22;G10L25/30

优先权:["20211109 US 63/277,231","20220907 US 63/374,870"]

专利状态码:在审-公开

法律状态:2024.06.28#公开

摘要:一些公开的方法涉及从环境中的多个设备中的每一个接收包括麦克风数据的传感器数据,产生与每个传感器对应的输入嵌入向量,产生与每个设备对应的设备级上下文向量,获得真值数据,以及将每个设备级上下文向量与真值数据进行比较以产生比较结果。比较可以涉及基于注意力的过程。一些公开的方法涉及至少部分地基于比较结果来生成一个或更多个当前输出分析令牌,以及至少部分地基于一个或更多个当前输出分析令牌来控制至少一个设备的操作。控制可以涉及控制扬声器操作或麦克风操作中的至少一个。

主权项:1.一种方法,包括:由控制系统从环境中的多个传感器中的每一个接收传感器数据,所述多个传感器与所述环境中的多个设备对应,所述传感器数据包括麦克风数据;由所述控制系统产生与所述多个传感器中的每个传感器对应的输入嵌入向量;由所述控制系统产生与所述环境中的所述多个设备中的每个设备对应的设备级上下文向量,以产生多个设备级上下文向量;由所述控制系统获得真值数据;由所述控制系统将所述多个设备级上下文向量中的每个设备级上下文向量与所述真值数据进行比较,以产生比较结果,其中所述比较涉及基于注意力的过程;由所述控制系统至少部分地基于所述比较结果来生成一个或更多个当前输出分析令牌;以及由所述控制系统至少部分地基于所述一个或更多个当前输出分析令牌来控制所述环境中的所述多个设备中的至少一个设备的操作,其中所述控制涉及控制喇叭操作或麦克风操作中的至少一个。

全文数据:

权利要求:

百度查询: 杜比实验室特许公司 用于语音和音频分析应用的多设备多通道注意力

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。