买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:东南大学;东南大学—无锡集成电路技术研究所
摘要:本发明公开了基于模拟退火算法的SRP‑PHAT声源定位网格搜索方法,涉及声源定位技术,属于测量测试的技术领域。首先,将以MIC阵列为中心的搜索空间进行栅格化;然后,选择出现声源概率最大的栅格点作为模拟退火算法的初始当前解并计算对应的可控响应功率;将当前解随机移动到相邻的栅格点产生新解,计算可控响应功率,若新解可控响应功率大于当前解可控响应功率,则接收新解为当前解,否则以exp‑TdeltaT的概率接收为当前解;将当前温度T下降Tdelta,将当前解随机移动到相邻的栅格点,确定新的当前解和新解;依此循环,直至满足一定条件结束,最大可控响应功率对应的解即是声源位置。本申请在不损失定位精度的条件下快速找到最大可控响应功率点,提高了定位的实时性。
主权项:1.基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,其特征在于,对以MIC阵列为中心的搜索空间进行栅格化处理,初始化记录各栅格点声源出现频次值、各栅格点可控响应功率的计算时间及各栅格点可控响应功率值的栅格化表格,以声源出现概率最大的栅格点作为初始当前解,将随机移动步长演化为模拟退火温度,采用模拟退火算法寻求可控响应功率函数的全局最优解,更新栅格化表格中全局最优解所对应栅格点声源出现频次值,更新栅格化表格;采用模拟退火算法寻求可控响应功率函数的全局最优解的方法为:按照当前温度值移动当前解到与其相邻的栅格点产生新解,在当前解可控响应功率计算时间与当前时间的差满足实时性要求时,计算新解的可控响应功率,否则,新解的可控响应功率仍为上一循环的计算值,在满足结束网络搜索条件时,以可控响应功率最大的解为全局最优解,否则,以exp-TdeltaT的概率接收新解为当前解,T为模拟退火温度,Tdelta为模拟退火温度的调节量,递减模拟退火温度后进入下一循环;以exp-TdeltaT的概率接收新解为当前解的方法具体为:产生一个0~1之间的随机数,在该随机数大于exp-TdeltaT时接受新解为当前解,否则,维持当前解不变;更新栅格化表格中全局最优解所对应栅格点声源出现频次值的方法为:对全局最优解所对应栅格点的频次值进行加一操作,全局最优解所对应栅格点的频次值加一操作后大于最大阈值时,更新该全局最优解所对应栅格点的频次值为当前频次值与最大阈值的差值,若全局最优解所对应栅格点的频次加一操作后小于最小阈值时,更新全局最优解所对应栅格点的频次值为最小阈值。
全文数据:基于模拟退火算法的SRP-PHAT声源定位网格搜索方法技术领域本发明公开了基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,涉及声源定位技术,属于测量测试的技术领域。背景技术SRP-PHAT声源定位算法结合了波束形成和广义互相关法的优点,既能抑制混响干扰又能抑制噪声,在真实环境下依然可以获得较高的定位精度和鲁棒性,近年来受到了广泛的关注和研究,但波束扫描网格搜索的特点使声源定位算法需要用方向性波束对整个空间逐点进行搜索,庞大的计算量使得实时地执行算法变得困难。因此,在保证定位精度不变的前提下,大量削减计算量,加快计算速度以适应实时目标探测就成为SRP-PHAT算法对声源目标定位研究的主要问题之一。SRP-PHAT声源定位算法中最大可控响应功率点即为声源位置,但其网格搜索实时性差是一个重要且难以解决的问题。为解决该问题,研究人员从包括缩减可控响应功率的计算量和优化网格搜索效率的不同角度提出了SRP-PHAT加速算法,其中,从缩减可控响应功率的计算量角度提出的SRP-PHAT加速算法比较固定且优化空间有限,而从优化网格搜索效率角度提出的SRP-PHAT加速算法抽象为求全局最优解问题,具有诸多的优化方法,是主要的优化着手点。常见的优化网络搜索效率的搜索算法有:由粗到精的空间搜索算法、基于概率的空间搜索算法、混合搜索算法、反映射搜索算法、分级搜索算法等,而基于概率的空间搜索算法需要充分利用声音功率谱特性,本发明正是为了充分利用声音功率谱特性,提出了一种基于退火算法的新型加速网格搜索方法以保证声源定位的实时性且不损失定位精度。发明内容本发明的发明目的是针对上述背景技术的不足,提供了基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,充分利用声音功率谱特性以及模拟退火算法全局最优快速收敛的特性,在不损失定位精度的条件下快速找到最大可控响应功率点,提出了一种充分利用声音功率谱特性的新型加速网络搜索方法,解决了SRP-PHAT声源定位算法的网络搜索实时性差的技术问题。本发明为实现上述发明目的采用如下技术方案:基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,对以MIC阵列为中心的搜索空间进行栅格化处理,初始化记录各栅格点声源出现频次值、各栅格点可控响应功率的计算时间及各栅格点可控响应功率值的栅格化表格,以声源出现概率最大的栅格点作为初始当前解,将随机移动步长演化为模拟退火温度,采用模拟退火算法寻求可控响应功率函数的全局最优解,更新栅格化表格。作为基于模拟退火算法的SRP-PHAT声源定位网格搜索方法的进一步优化方案,对以MIC阵列为中心的搜索空间进行栅格化处理的方法为:以MIC阵列几何中心为栅格中心,以距离栅格中心等间隔增加的长度为半径进行二维空间内的圆形栅格化或三维空间内的球形栅格化。作为基于模拟退火算法的SRP-PHAT声源定位网格搜索方法的进一步优化放哪,对以MIC阵列为中心的搜索空间进行栅格化处理的方法还可以是:以MIC阵列几何中心为栅格中心,以栅格中心为正方形中心并以等间隔增长的长度为边长进行二维空间内的正方形栅格化,或,以栅格中心为正方体中心并以等间隔增长的长度为边长进行三维空间内的正方体栅格化。作为基于模拟退火算法的SRP-PHAT声源定位网格搜索方法的进一步优化方案,采用模拟退火算法寻求可控响应功率函数的全局最优解的方法为:按照当前温度值移动当前解到与其相邻的栅格点产生新解,在当前解可控响应功率计算时间与当前时间的差满足实时性要求时,计算新解的可控响应功率,否则,新解的可控响应功率仍为上一循环的计算值,在满足结束网络搜索条件时,以可控响应功率最大的解为全局最优解,否则,以exp-TdeltaT的概率接收新解为当前解,T为模拟退火温度,Tdelta为模拟退火温度的调节量,递减模拟退火温度后进入下一循环。作为基于模拟退火算法的SRP-PHAT声源定位网格搜索方法的进一步优化方案,更新栅格化表格中全局最优解所对应栅格点声源出现频次值的方法为:对全局最优解所对应栅格点的频次值进行加一操作,全局最优解所对应栅格点的频次值加一操作后大于最大阈值时,更新全局最优解所对应栅格点的频次值为当前频次值与最大阈值的差值,若全局最优解所对应栅格点的频次加一操作后小于最小阈值时,更新全局最优解所对应栅格点的频次值为最小阈值。再进一步的,基于模拟退火算法的SRP-PHAT声源定位网格搜索方法中,所述可控响应功率函数的表达式为:其中,Xkω为第k个传声器信号xkt的加窗傅里叶变换,为第l个传声器信号xlt的加窗傅里叶变换信号的共轭信号,τl、τk分别为第k个、第l个传声器指向当前栅格点的可控时延,q为声源的空间位置向量,Ψklω为多信道形式的PHAT加权系数。再进一步的,基于模拟退火算法的SRP-PHAT声源定位网格搜索方法中,结束网络搜索条件包含但不限于这三种:循环次数达到最大阈值,或者,模拟退火温度达到设定值,或者,循环次数超过最小阈值且连续数次的循环中新解和当前解的可控响应功率差值均满足阈值要求。再进一步的,基于模拟退火算法的SRP-PHAT声源定位网格搜索方法中,以exp-TdeltaT的概率接收新解为当前解的方法具体为:产生一个0~1之间的随机数,在该随机数大于exp-TdeltaT时接受新解为当前解,否则,维持当前解不变。本发明采用上述技术方案,具有以下有益效果:1本发明采用模拟退火算法进行网格搜索时基于历史声源位置频次表建立初始条件,同时,通过调节模拟退火的关键控制要素温度T动态调整栅格移动的步长,保证了算法的收敛速度;2本发明提供的SRP-PHAT声源定位网格搜索方法结合了波束形成和广义互相关法的优点,既能抑制混响干扰又能抑制噪声,利用模拟退火算法全局最优快速收敛的特性快速搜索整个空间,保证了声源定位的实时性而且不会损失精度。附图说明图1为本发明声源定位网络搜索方法的流程图。具体实施方式下面结合附图对发明的技术方案进行详细说明。本申请采用固体退火算法模拟SRP-PHAT的全局寻优过程,具体是将内能E模拟为可控响应功率,将随机移动步长演化为温度T,具体流程如图1所示,包括如下八个步骤。步骤一:初始化算法环境;设定模拟退火算法的初始温度T为充分大,将以MIC阵列为中心的搜索空间栅格化,栅格大小取决于对精度和实时性的要求,栅格越大,精度越低,实时性越好,反之,栅格越小,精度越高,实时性越差;根据圆形或者方形栅格化规则建立栅格化表格表示出整个搜索空间,栅格化表格中的值包含三个部分:声源在该栅格点出现的频次,计算可控响应功率的时间和在该栅格点计算出的可控响应功率值。步骤二:根据各栅格点声源出现的历史概率选择出现概率最大的栅格点作为模拟退火算法的初始当前解,若无声源历史记录,则按照平均分布随机选择栅格点作为模拟退火算法的初始当前解,计算退火算法各解的可控响应功率的公式如下:其中:Xkω为第k个传声器信号xkt的加窗傅里叶变换;为第l个传声器信号xlt的加窗傅里叶变换信号的共轭信号;τ是阵列指向声源的可控时延,用于补偿每个传声器理想信号的直接路径传播延时,τl、τk分别为第k个、第l个传声器指向当前栅格点的可控时延,q为声源的空间位置向量;Ψklω为多信道形式的PHAT加权系数。步骤三:将当前解随机移动到相邻的栅格点产生新解,如果上次计算可控响应功率时间与当前时间差值大于实时性要求,计算新解的可控响应功率,否则,采用上次计算的可控响应功率值;当前解当前栅格点向各个方向移动的概率相同,移动的步长在1和最大步长之间随机产生,且迭代开始时随机移动最大步长较大,随着迭代次数的增加,随机移动最大步长逐渐减小;步骤四:如果当前解和新解的可控响应功率满足一定条件则网格搜索结束,进入步骤7,否则进入下一步骤;一定条件包含但不限于以下三种:4.1循环次数大于某一特定值;4.2模拟退火温度达到某一特定温度值;4.3循环次数大于某一较小值,且连续N次计算出的可控响应功率差值都较小;步骤五:如果新解可控响应功率大于当前解可控响应功率,则接收新解为当前解,否则以exp-TdeltaT的概率接收新解为当前解,其它情况当前解不变,具体实施步骤:5.1随机产生一个0~1之间的随机数5.2计算当前exp-TdeltaT值,如果该随机数大于该值则接收为当前解,否则当前解不变;步骤六:将当前温度T下降Tdelta,即:T=T-Tdelta,进入步骤三;步骤七:统计历史当中出现过的解的可控响应功率值,其中可控响应功率值最大值对应的解即是声源位置;步骤八:更新栅格化表格中声源所在栅格点的频次值,更新频次表的步骤如下这里将简单处理后的频次作为概率来使用:8.1确定声源位置后,将其对应栅格点的频次值加一;8.2如果该值大于预先设定的最大阈值,则将声源所在栅格点的频次值减去最大阈值;8.3如果步骤8.2更新后的声源所在栅格点的频次值小于预先设定的最小阈值,则更新后的声源所在栅格点的频次值改为最小阈值。
权利要求:1.基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,其特征在于,对以MIC阵列为中心的搜索空间进行栅格化处理,初始化记录各栅格点声源出现频次值、各栅格点可控响应功率的计算时间及各栅格点可控响应功率值的栅格化表格,以声源出现概率最大的栅格点作为初始当前解,将随机移动步长演化为模拟退火温度,采用模拟退火算法寻求可控响应功率函数的全局最优解,更新栅格化表格。2.根据权利要求1所述基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,其特征在于,对以MIC阵列为中心的搜索空间进行栅格化处理的方法为:以MIC阵列几何中心为栅格中心,以距离栅格中心等间隔增加的长度为半径进行二维空间内的圆形栅格化或三维空间内的球形栅格化。3.根据权利要求1所述基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,其特征在于,对以MIC阵列为中心的搜索空间进行栅格化处理的方法还可以是:以MIC阵列几何中心为栅格中心,以栅格中心为正方形中心并以等间隔增长的长度为边长进行二维空间内的正方形栅格化,或,以栅格中心为正方体中心并以等间隔增长的长度为边长进行三维空间内的正方体栅格化。4.根据权利要求1所述基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,其特征在于,采用模拟退火算法寻求可控响应功率函数的全局最优解的方法为:按照当前温度值移动当前解到与其相邻的栅格点产生新解,在当前解可控响应功率计算时间与当前时间的差满足实时性要求时,计算新解的可控响应功率,否则,新解的可控响应功率仍为上一循环的计算值,在满足结束网络搜索条件时,以可控响应功率最大的解为全局最优解,否则,以exp-TdeltaT的概率接收新解为当前解,T为模拟退火温度,Tdelta为模拟退火温度的调节量,递减模拟退火温度后进入下一循环。5.根据权利要求1所述基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,其特征在于,更新栅格化表格中全局最优解所对应栅格点声源出现频次值的方法为:对全局最优解所对应栅格点的频次值进行加一操作,全局最优解所对应栅格点的频次值加一操作后大于最大阈值时,更新全局最优解所对应栅格点的频次值为当前频次值与最大阈值的差值,若全局最优解所对应栅格点的频次加一操作后小于最小阈值时,更新全局最优解所对应栅格点的频次值为最小阈值。6.根据权利要求4所述基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,其特征在于,所述可控响应功率函数的表达式为:其中,Xkω为第k个传声器信号xkt的加窗傅里叶变换,为第l个传声器信号xlt的加窗傅里叶变换信号的共轭信号,τl、τk分别为第k个、第l个传声器指向当前栅格点的可控时延,q为声源的空间位置向量,Ψklω为多信道形式的PHAT加权系数。7.根据权利要求4所述基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,其特征在于,结束网络搜索条件包含但不限于这三种:循环次数达到最大阈值,或者,模拟退火温度达到设定值,或者,循环次数超过最小阈值且连续数次的循环中新解和当前解的可控响应功率差值均满足阈值要求。8.根据权利要求4所述基于模拟退火算法的SRP-PHAT声源定位网格搜索方法,其特征在于,以exp-TdeltaT的概率接收新解为当前解的方法具体为:产生一个0~1之间的随机数,在该随机数大于exp-TdeltaT时接受新解为当前解,否则,维持当前解不变。
百度查询: 东南大学 东南大学—无锡集成电路技术研究所 基于模拟退火算法的SRP-PHAT声源定位网格搜索方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。