利用深度学习和有限数据进行多阵列声音应用的特征处理

导航：龙图腾网> 最新专利技术> 利用深度学习和有限数据进行多阵列声音应用的特征处理

申请/专利权人：国际商业机器公司

申请日：2020-08-06

公开（公告）日：2024-06-28

公开（公告）号：CN112560885B

主分类号：G06F18/213

分类号：G06F18/213;G06F18/214;G06N3/0464;G01S5/18

优先权：["20190910 US 16/565,576"]

专利状态码：有效-授权

法律状态：2024.06.28#授权;2021.04.13#实质审查的生效;2021.03.26#公开

摘要：本公开的实施例涉及利用深度学习和有限数据进行多阵列声音应用的特征处理。本公开提供了一种用于多源声音定位的计算机实现的方法。方法包括：由硬件处理器从被包括在两个或更多个麦克风阵列中的每个麦克风阵列中的相应多个麦克风提取频谱特征。方法还包括：由硬件处理器通过重新布置和复制来自被包括在两个或更多个麦克风阵列中的每个麦克风阵列中的相应多个麦克风的频谱特征，形成来自被包括在两个或更多个麦克风阵列中的每个麦克风阵列内的相应多个麦克风的频谱特征的对的相应集合。方法还包括：由硬件处理器将频谱特征的对的相应集合输入到神经网络中，以将频谱特征编码成深度特征，并对深度特征进行解码，以从神经网络输出一个或多个声音源的至少一个位置表示。

主权项：1.一种用于多源声音定位的计算机实现的方法，包括：由硬件处理器从被包括在两个或更多个麦克风阵列中的每个麦克风阵列中的相应多个麦克风提取频谱特征；由所述硬件处理器通过重新布置和复制来自被包括在所述两个或更多个麦克风阵列中的每个麦克风阵列中的所述相应多个麦克风的所述频谱特征，形成来自所述两个或更多个麦克风阵列中的每个麦克风阵列内的所述相应多个麦克风的所述频谱特征的对的相应集合；以及由所述硬件处理器将所述频谱特征的对的所述相应集合输入神经网络中，以将所述频谱特征编码成深度特征，并对所述深度特征进行解码，以从所述神经网络输出一个或多个声音源的至少一个位置表示。

全文数据：

权利要求：

百度查询：国际商业机器公司利用深度学习和有限数据进行多阵列声音应用的特征处理

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种NB模组驱动的摄像采集装置

下一篇：一种宽度紧凑型半导体封装结构

相关技术

一种NB模组驱动的摄像采集装置

一种宽度紧凑型半导体封装结构

一种上颌窦膜推起工具

一种汽车质量块加工用刀具

一种低交叉极化抑制的宽带UWB天线及穿戴设备

一种叠加机

一种摆动机构及鼓风干燥箱

一种用于3C零件组装的点胶设备

一种家用温湿度传感器

一种隔音效果好的橡塑制品

一种数控机床主轴箱冷却装置

一种液体沥青取样装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

利用深度学习和有限数据进行多阵列声音应用的特征处理

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务